haebom
Sign In
WebGameBench: Requirement-to-Application Evaluation for Coding Agents via Browser-Native Games
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Wenyu Zhang, Guoliang You, Tianlun, Haotian Zhao, Tianshu Zhu, Haoran Wang, Xiaoxuan Tang, Mingyang Dai, Jingnan Gu, Daxiang Dong, Jianmin Wu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μ½λ© μμ΄μ νΈκ° μꡬμ¬ν λͺ μΈλ‘λΆν° λΈλΌμ°μ μμ μ€ν κ°λ₯ν κ²μ μ ν리μΌμ΄μ μ μΌλ§λ μ μμ±νλμ§ νκ°νκΈ° μν μλ‘μ΄ λ²€μΉλ§ν¬μΈ WebGameBenchλ₯Ό μ μν©λλ€. WebGameBenchλ ꡬ쑰νλ μΉκ²μ λͺ μΈλ‘λΆν° μμ±λ μ ν리μΌμ΄μ μ μ€μ λΈλΌμ°μ νκ²½μμ ν μ€νΈνμ¬ EXCELLENT, USABLE, UNUSABLEμ μΈ κ°μ§ λ±κΈμΌλ‘ νκ°ν©λλ€. μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄ μ½λ© μμ΄μ νΈλ€μ΄ μ΅μνμ νλ μ΄ κ°λ₯ν μ ν리μΌμ΄μ μ λμ΄ μλ²½ν μꡬμ¬ν λ§μ‘±κΉμ§λ μμ§ κ° κΈΈμ΄ λ©λ€λ κ²μ 보μ¬μ€λλ€.
π μμ¬μ λ° νκ³
β’
μ½λ© μμ΄μ νΈμ νκ°λ₯Ό μμ€μ½λ μμ€μμ λ²μ΄λ μ€μ μ ν리μΌμ΄μ μ λμκ³Ό μ¬μ©μ±μ μ§μ μ μΌλ‘ κ²μ¦νλ λ°©ν₯μΌλ‘ μ ννλ λ° κΈ°μ¬ν©λλ€.
β’
λ¨μν΄ λ³΄μ΄λ κ²μμ‘°μ°¨λ μ λ ₯ μ²λ¦¬, κ·μΉ μ€ν, μν μ ν λ± λ€μν 볡ν©μ μΈ κΈ°λ₯μ μꡬνλ―λ‘, μ½λ© μμ΄μ νΈμ μ’ ν©μ μΈ λ₯λ ₯μ νκ°νλ λ° ν¨κ³Όμ μΈ ν μ€νΈλ² λλ₯Ό μ 곡ν©λλ€.
β’
νμ¬ μ½λ© μμ΄μ νΈλ€μ΄ 'usable' μμ€μ μ ν리μΌμ΄μ μμ±μλ μ΄λ μ λ μ±κ³΅νμ§λ§, 'excellent' μμ€μ μλ²½ν λ§μ‘±λμλ λλ¬νμ§ λͺ»νλ κ°κ·Ήμ λͺ νν λλ¬λ λλ€.
β’
μΈκ°μ νλ μ΄ κ²½ν 리뷰μ λΉκ΅νμ λ, λ°νμ νκ°μ μ λ’°μ±μ μ μ¦νλ € νμΌλ, λ€μν κ²μ μ ν λ° λ³΅μ‘μ±μ λν ν¬κ΄μ μΈ κ²μ¦μ ν₯ν κ³Όμ λ‘ λ¨μ΅λλ€.
PDF 보기
Made with Slashpage