haebom
Sign In
FutureWorld: A Live Reinforcement Learning Environment for Predictive Agents with Real-World Outcome Rewards
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Zhixin Han, Yanzhi Zhang, Chuyang Wei, Maohang Gao, Xiawei Yue, Kefei Chen, Yu Zhuang, Haoxiang Guan, Jiyan He, Jian Li, Yitong Duan, Yu Shi, Mengting Hu, Shuxin Zheng
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ์ค์ ์ธ๊ณ ์ฌ๊ฑด์ ๋ฏธ๋๋ฅผ ์์ธกํ๋ '์ค์๊ฐ ๋ฏธ๋ ์์ธก' ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๋ก์ด ๊ฐํํ์ต ํ๊ฒฝ์ธ FutureWorld๋ฅผ ์ ์ํฉ๋๋ค. FutureWorld๋ ์์ธก ์์ ๋ถํฐ ์ค์ ๊ฒฐ๊ณผ ํ์ธ ๋ฐ ๋ชจ๋ธ ์ ๋ฐ์ดํธ๊น์ง์ ํ์ต ๊ณผ์ ์ ์ฐ๊ฒฐํ๋ฉฐ, ์ง์ฐ๋ ์ค์ ๊ฒฐ๊ณผ ๋ณด์์ ํ์ฉํ์ฌ ์์ด์ ํธ์ ์์ธก ์ ํ๋, ํ๋ฅ ์ ์, ๋ณด์ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ค์ ์ธ๊ณ์ ์ง์ฐ๋ ๊ฒฐ๊ณผ๋ฅผ ๊ฐํํ์ต ์ ํธ๋ก ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
์์ด์ ํธ๊ฐ ์ค์ ์ธ๊ณ ์ฌ๊ฑด์ ๊ธฐ๋ฐ์ผ๋ก ์ง์์ ์ผ๋ก ํ์ตํ ์ ์๋ ํ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
โข
ํ์ฌ๋ ์ธ ๊ฐ์ง ์คํ์์ค ์์ด์ ํธ์ ๋ํ ์คํ ๊ฒฐ๊ณผ๋ง์ ์ ์ํ๊ณ ์์ด, ๋ค์ํ ์์ด์ ํธ ๋ฐ ์ค์ ์ ์ฉ ์๋๋ฆฌ์ค์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage