Rohan Alur, Bradly C. Stadie, Daniel Kang, Ryan Chen, Matt McManus, Michael Rickert, Tyler Lee, Michael Federici, Richard Zhu, Dennis Fogerty, Hayley Williamson, Nina Lozinski, Aaron Linsky, Jasjeet S. Sekhon
개요
AIA Forecaster는 비정형 데이터를 사용하여 판단 예측을 수행하는 대규모 언어 모델(LLM) 기반 시스템입니다. 이 시스템은 고품질 뉴스 소스에 대한 에이전트 기반 검색, 동일 이벤트에 대한 다양한 예측을 조정하는 감독 에이전트, 그리고 LLM의 행동 편향을 억제하기 위한 통계적 보정 기법의 세 가지 핵심 요소를 결합합니다. ForecastBench 벤치마크에서 인간 슈퍼 예측가와 동등한 수준의 성능을 달성했으며, 액체 예측 시장에서 생성된 더 어려운 벤치마크에서는 시장 컨센서스에 미치지 못했지만, AIA Forecaster와 시장 컨센서스를 결합한 앙상블은 컨센서스 단독보다 더 나은 성과를 보였습니다.