Sign In

StyleBench: Evaluating thinking styles in Large Language Models

Created by
  • Haebom
Category
Empty

μ €μž

Junyu Guo, Shangding Gu, Ming Jin, Costas Spanos, Javad Lavaei

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 μΆ”λ‘  μ„±λŠ₯ ν–₯상을 μœ„ν•œ κ΅¬μ‘°ν™”λœ μΆ”λ‘  λ°©μ‹μ˜ νš¨κ³Όμ™€ νš¨μœ¨μ„±μ„ νƒκ΅¬ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ μΆ”λ‘  μŠ€νƒ€μΌ(Chain-of-Thought, Tree-of-Thought λ“±)을 5κ°€μ§€ μΆ”λ‘  κ³Όμ œμ™€ 15개 LLM에 걸쳐 ν‰κ°€ν•œ κ²°κ³Ό, ꡬ쑰적 λ³΅μž‘μ„±μ΄ νŠΉμ • μž‘μ—… μš”κ΅¬μ‚¬ν•­κ³Ό λͺ¨λΈ μš©λŸ‰μ—μ„œλ§Œ 정확도λ₯Ό ν–₯μƒμ‹œν‚¨λ‹€λŠ” 것을 λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, 검색 기반 μŠ€νƒ€μΌμ€ κ°œλ°©ν˜• μ‘°ν•© λ¬Έμ œμ—μ„œ μœ μš©ν•˜μ§€λ§Œ μž‘μ€ λͺ¨λΈμ—μ„œλŠ” μ‹€νŒ¨ν•˜λ©°, κ°„κ²°ν•œ μŠ€νƒ€μΌμ€ κ΅¬μ‘°ν™”λœ μž‘μ—…μ—μ„œ μ„±λŠ₯ μ €ν•˜ 없이 νš¨μœ¨μ„±μ„ 크게 λ†’μΈλ‹€λŠ” 것을 ν™•μΈν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ΅¬μ‘°ν™”λœ μΆ”λ‘  방식은 μž‘μ—…μ˜ λ³΅μž‘μ„±κ³Ό λͺ¨λΈμ˜ μš©λŸ‰μ— 따라 κ·Έ νš¨κ³Όκ°€ 달라지며, 항상 νš¨μœ¨μ μ΄κ±°λ‚˜ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 것은 μ•„λ‹™λ‹ˆλ‹€.
β€’
κ°œλ°©ν˜• μ‘°ν•© λ¬Έμ œμ—λŠ” 검색 기반 μΆ”λ‘  μŠ€νƒ€μΌμ΄ μœ λ¦¬ν•˜μ§€λ§Œ, μž‘μ€ 규λͺ¨μ˜ λͺ¨λΈμ—λŠ” μ ν•©ν•˜μ§€ μ•ŠμœΌλ©°, κ°„κ²°ν•œ μŠ€νƒ€μΌμ€ κ΅¬μ‘°ν™”λœ μž‘μ—…μ—μ„œ νš¨μœ¨μ„±μ„ λ†’μ΄λŠ” 데 νš¨κ³Όμ μž…λ‹ˆλ‹€.
β€’
μž‘μ€ λͺ¨λΈμ—μ„œ λ°œμƒν•˜λŠ” 체계적인 μ‹€νŒ¨ λͺ¨λ“œ(예: μ„±κΈ‰ν•œ μΆ”μΈ‘, μΆ”λ‘  μ œμ–΄ 지침에 λŒ€ν•œ μ•½ν•œ μ€€μˆ˜)λ₯Ό μ‹λ³„ν•˜κ³ , 적응적 μΆ”λ‘  μ œμ–΄λ₯Ό μœ„ν•œ 지도 ν•™μŠ΅ 및 κ°•ν™” ν•™μŠ΅ 기반 μ „λž΅ μ„ νƒμ˜ 효과λ₯Ό λΉ„κ΅ν–ˆμŠ΅λ‹ˆλ‹€.
πŸ‘