haebom
Sign In
WebLLM: A High-Performance In-Browser LLM Inference Engine
Created by
Haebom
Category
Empty
์ ์
Charlie F. Ruan, Yucheng Qin, Akaash R. Parthasarathy, Xun Zhou, Ruihang Lai, Hongyi Jin, Yixin Dong, Bohan Hou, Meng-Shiun Yu, Yiyan Zhai, Sudeep Agarwal, Hangrui Cao, Siyuan Feng, Tianqi Chen
๐ก ๊ฐ์
์ด ์ฐ๊ตฌ๋ ์น ๋ธ๋ผ์ฐ์ ๋ด์์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํจ์จ์ ์ผ๋ก ์ถ๋ก ํ ์ ์๋ ๊ณ ์ฑ๋ฅ JavaScript ํ๋ ์์ํฌ์ธ WebLLM์ ์ ์ํฉ๋๋ค. WebLLM์ WebGPU์ WebAssembly๋ฅผ ํ์ฉํ์ฌ GPU ๋ฐ CPU ๊ฐ์์ ์ง์ํ๋ฉฐ, ์ด๋ฅผ ํตํด ๊ธฐ์กด ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ ์ถ๋ก ๋ฐฉ์์ ๋ํ ๋์์ ์ ์ํฉ๋๋ค. ํ๊ฐ ๊ฒฐ๊ณผ, WebLLM์ ๋์ผ ๊ธฐ๊ธฐ์์ ๋ค์ดํฐ๋ธ ์ฑ๋ฅ์ ์ต๋ 80%๊น์ง ์ ์งํ์ฌ, ๋ธ๋ผ์ฐ์ ๊ธฐ๋ฐ LLM ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฐ๋ฅ์ฑ์ ์ด์์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๋ณดํธ์ ์ ๊ทผ์ฑ ๋ฐ ๊ฐ์ธ ์ ๋ณด ๋ณดํธ:
์๋ฒ ์ธํ๋ผ๋ ๋ณ๋์ ์ค์น ์์ด ์น ๋ธ๋ผ์ฐ์ ๋ง ์์ผ๋ฉด LLM ๊ธฐ๋ฅ์ ์ฌ์ฉํ ์ ์์ด ์ ๊ทผ์ฑ์ด ๋๊ณ , ๋ฐ์ดํฐ๊ฐ ๋ก์ปฌ์์ ์ฒ๋ฆฌ๋์ด ๊ฐ์ธ ์ ๋ณด ๋ณดํธ์ ์ ๋ฆฌํฉ๋๋ค.
โข
๋ก์ปฌ ๋ฐ ๊ฐ์ธํ๋ LLM ์ ํ๋ฆฌ์ผ์ด์ :
์น ๋ธ๋ผ์ฐ์ ๋ด์์ LLM์ ๊ตฌ๋ํจ์ผ๋ก์จ ์ฌ์ฉ์๋ ๋์ฑ ๊ฐ์ธํ๋๊ณ ๋ก์ปฌ ์์์ ํ์ฉํ๋ ๋ค์ํ LLM ๊ธฐ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฒฝํํ ์ ์์ต๋๋ค.
โข
์ฑ๋ฅ ๊ฒฉ์ฐจ ์ถ์ ๋ฐ WebGPU ์ปค๋ ์ต์ ํ:
์์ง ๋ค์ดํฐ๋ธ ์ฑ๋ฅ๊ณผ์ ๊ฒฉ์ฐจ๊ฐ ์กด์ฌํ์ง๋ง, MLC-LLM ๋ฐ Apache TVM๊ณผ ๊ฐ์ ๋จธ์ ๋ฌ๋ ์ปดํ์ผ๋ฌ๋ฅผ ํตํด WebGPU ์ปค๋์ ์ต์ ํํ์ฌ ์ฑ๋ฅ์ ์ง์์ ์ผ๋ก ๊ฐ์ ํ ์ฌ์ง๊ฐ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage