Sign In

WebChain: A Large-Scale Human-Annotated Dataset of Real-World Web Interaction Traces

Created by
  • Haebom
Category
Empty

μ €μž

Sicheng Fan, Rui Wan, Yifei Leng, Gaoning Liang, Li Ling, Yanyi Shang, Dehan Kong

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ‹€μ œ μ›Ήμ‚¬μ΄νŠΈμ—μ„œμ˜ 인간 주석이 ν¬ν•¨λœ λŒ€κ·œλͺ¨ μ›Ή μƒν˜Έμž‘μš© 좔적 데이터셋인 WebChain을 μ†Œκ°œν•©λ‹ˆλ‹€. 이 데이터셋은 μ‹œκ°, ꡬ쑰, 행동 데이터λ₯Ό ν†΅ν•©ν•œ Triple Alignmentλ₯Ό νŠΉμ§•μœΌλ‘œ ν•˜λ©°, λ³΅μž‘ν•˜κ³  κ°€μΉ˜ 높은 μž‘μ—…μ„ ν¬κ΄„ν•˜μ—¬ μ›Ή μ—μ΄μ „νŠΈ μ—°κ΅¬μ˜ μž¬ν˜„μ„±μ„ λ†’μž…λ‹ˆλ‹€. μ œμ•ˆλœ Dual Mid-Training 기법과 ν•¨κ»˜ 이 데이터셋을 ν™œμš©ν•˜μ—¬ 곡간적 접지와 κ³„νšμ„ λΆ„λ¦¬ν•˜κ³ , WebChainBench 및 λ‹€λ₯Έ GUI λ²€μΉ˜λ§ˆν¬μ—μ„œ μ΅œμ²¨λ‹¨ μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
WebChain 데이터셋은 μ‹€μ œ μ›Ή ν™˜κ²½μ—μ„œμ˜ λ³΅μž‘ν•˜κ³  κ°€μΉ˜ 높은 μž‘μ—…μ„ λ‹€λ£¨λŠ” μ›Ή μ—μ΄μ „νŠΈ 연ꡬλ₯Ό μœ„ν•œ μ€‘μš”ν•œ μžμ›μ„ μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ Dual Mid-Training 기법은 μ›Ή μ—μ΄μ „νŠΈμ˜ 곡간적 접지와 κ³„νš λŠ₯λ ₯을 효과적으둜 λΆ„λ¦¬ν•˜μ—¬ μ„±λŠ₯ ν–₯상을 μ΄λŒμ–΄λƒˆμŠ΅λ‹ˆλ‹€.
β€’
ν˜„μž¬ λ°μ΄ν„°μ…‹μ˜ 규λͺ¨λŠ” ν¬μ§€λ§Œ, μ‹€μ œ μ›Ήμ˜ λͺ¨λ“  λ³΅μž‘μ„±κ³Ό 닀양성을 μ™„μ „νžˆ ν¬κ΄„ν•˜κΈ°μ—λŠ” 아직 λΆ€μ‘±ν•  수 있으며, ν–₯ν›„ 지속적인 데이터 ν™•μž₯ 및 κ°œμ„ μ΄ ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘