haebom
Sign In
MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants
Created by
Haebom
Category
Empty
μ μ
Zuhao Zhang, Chengyue Yu, Yuante Li, Chenyi Zhuang, Linjian Mo, Shuai Li
π‘ κ°μ
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ΄ ν μ€νΈ κΈ°λ° μλ΅μμ HTML κΈ°λ°μ μνΈμμ© κ°λ₯ν μ ν리μΌμ΄μ (MiniApps)μΌλ‘ λ°μ ν¨μ λ°λΌ, κΈ°μ‘΄ λ²€μΉλ§ν¬λ‘λ μ΄λ¬ν λ³νλ₯Ό μΈ‘μ νλ λ° νκ³κ° μμ΅λλ€. λ³Έ μ°κ΅¬λ νμ€ μΈκ³μ μμΉμ λ°λ₯΄λ©΄μ μκ°μ μΈν°νμ΄μ€μ μνΈμμ© λ‘μ§μ μμ±νλ LLMμ λ₯λ ₯μ νκ°νκΈ° μν μ΅μ΄μ μ’ ν© λ²€μΉλ§ν¬μΈ MiniAppBenchλ₯Ό μ μν©λλ€. 500κ°μ μ€μ μ ν리μΌμ΄μ κΈ°λ° νμ€ν¬λ₯Ό ν¬ν¨νλ MiniAppBenchμ ν¨κ», λ³Έ μ°κ΅¬λ 'MiniAppEval'μ΄λΌλ μλ‘μ΄ μμ΄μ νΈ κΈ°λ° νκ° νλ μμν¬λ₯Ό κ°λ°νμ¬ κ°λ°©ν μνΈμμ©μ νκ° λ¬Έμ λ₯Ό ν΄κ²°ν©λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μκ°μ μΈν°νμ΄μ€μ μνΈμμ© λ‘μ§μ μμ±νλ λ° μμ΄ μ¬μ ν μλΉν μ΄λ €μμ κ²ͺκ³ μμΌλ©°, MiniApps μμ±μ μν λ λ°μ λ λͺ¨λΈμ΄ νμν©λλ€.
β’
MiniAppEvalμ λΈλΌμ°μ μλνλ₯Ό νμ©ν νμμ ν μ€ν μ ν΅ν΄ μΈκ°μ νλ¨κ³Ό λμ μΌμΉλλ₯Ό 보μ¬, LLM κΈ°λ° μ ν리μΌμ΄μ νκ°λ₯Ό μν μ λ’°ν μ μλ νμ€μ μ μν©λλ€.
β’
λ²€μΉλ§ν¬κ° μ€μ μ ν리μΌμ΄μ μμ νμλμμ§λ§, 500κ°μ νμ€ν¬κ° MiniAppμ λͺ¨λ 볡μ‘μ±μ ν¬κ΄νκΈ°μλ μ νμ μΌ μ μμΌλ©°, ν₯ν λ λ€μν μλ리μ€μ 볡μ‘ν μνΈμμ©μ λν νκ°κ° νμν©λλ€.
PDF 보기
Made with Slashpage