haebom
Sign In
Accelerating Social Science Research via Agentic Hypothesization and Experimentation
Created by
Haebom
Category
Empty
์ ์
Jishu Sen Gupta, Harini SI, Somesh Kumar Singh, Syed Mohamad Tawseeq, Yaman Kumar Singla, David Doermann, Rajiv Ratn Shah, Balaji Krishnamurthy
๐ก ๊ฐ์
๊ธฐ์กด์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ฌํ๊ณผํ ์ฐ๊ตฌ๋ ๊ด์ฐฐ, ๊ฐ์ค ์์ฑ, ์คํ ๊ฒ์ฆ์ ๋ฐ๋ณต์ ์ธ ๊ณผ์ ์ ๊ฑฐ์ณ ๋๋ฆฌ๊ฒ ์งํ๋ฉ๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ๋ฒ ์ด์ง์ ์ต์ ํ ๊ธฐ๋ฐ์ ๋ ๋จ๊ณ ํ์ ํ๋ ์์ํฌ์ธ EXPERIGEN์ ์ ์ํฉ๋๋ค. EXPERIGEN์ ์์ฑ์(Generator)๊ฐ ๊ฐ์ค์ ์ ์ํ๊ณ ์คํ์(Experimenter)๊ฐ ์ด๋ฅผ ๊ฒฝํ์ ์ผ๋ก ๊ฒ์ฆํ๋ ๋ฐฉ์์ผ๋ก, end-to-end ๊ณผํ์ ๋ฐ๊ฒฌ์ ์๋ํํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
EXPERIGEN์ ๊ธฐ์กด ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ๋๋น 2-4๋ฐฐ ๋ ๋ง์ ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ๊ฐ์ค์ ๋ฐ๊ฒฌํ์ผ๋ฉฐ, ์์ธก๋ ฅ ๋ํ 7-17% ํฅ์๋์์ต๋๋ค.
โข
์์ฑ๋ ๊ฐ์ค๋ค์ ๋์ ์์ค์ ๋ ์ฐฝ์ฑ(88%๊ฐ ๋ณดํต ์ด์์ผ๋ก ์ฐธ์ ํจ), ์ํฅ๋ ฅ(70%๊ฐ ์ถ๊ตฌํ ๋งํ๋ค๊ณ ํ๊ฐ๋จ), ๊ทธ๋ฆฌ๊ณ ์๋ จ๋ ์ฐ๊ตฌ์์ ์์ค์ ํ์ ํ๋ ์๋ฐํจ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
โข
LLM ์์ฑ ๊ฐ์ค์ ๋ํ ์ต์ด์ A/B ํ ์คํธ ๊ฒฐ๊ณผ, 344%์ ํฐ ํจ๊ณผ ํฌ๊ธฐ์ 1e-6 ๋ฏธ๋ง์ p-value๋ก ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ์ต๋๋ค.
โข
๋ณธ ์ฐ๊ตฌ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ ๊ด๊ณํ ๋ฐ์ดํฐ์ ๊ฐ์ ๋ณต์กํ ๋ฐ์ดํฐ ํ๊ฒฝ์์๋ ํจ๊ณผ์ ์ผ๋ก ํ์ฅ๋ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
์ค์ ๊ณผํ์ ์ง๋ณด๋ฅผ ์ํด์๋ ์์ฑ๋ ๊ฐ์ค์ด ๋ ์ฐฝ์ ์ด๊ณ , ๊ฒฝํ์ ์ผ๋ก ๊ทผ๊ฑฐ๊ฐ ์์ผ๋ฉฐ, ์คํ ๊ฐ๋ฅํด์ผ ํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage