Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Towards Large Reasoning Models for Agriculture

Created by
  • Haebom

저자

Hossein Zaremehrjerdi, Shreyan Ganguly, Ashlyn Rairdin, Elizabeth Tranel, Benjamin Feuer, Juan Ignacio Di Salvo, Srikanth Panthulugiri, Victoria Moser, Sarah Jones, Joscif G Raigne, Yanben Shen, Heidi M. Dornath, Aditya Balu, Adarsh Krishnamurthy, Asheesh K Singh, Arti Singh, Baskar Ganapathysubramanian, Chinmay Hegde, Soumik Sarkar

개요

본 논문은 농업 의사결정의 복잡성과 전통적인 대규모 언어 모델(LLM)의 한계를 지적하며, 대규모 추론 모델(LRM)을 활용한 농업 추론 시스템 개발을 제시합니다. 이를 위해 100개의 질문으로 구성된 농업 추론 벤치마크 AgReason을 구축하고, 13개의 오픈소스 및 독점 모델을 평가하여 LRM이 LLM보다 우수한 성능을 보임을 확인하였습니다(최고 성능 36%). 또한, 44,600개의 질문-답변 쌍으로 구성된 대규모 데이터셋 AgThoughts를 생성하고, 이를 기반으로 소규모 추론 모델 AgThinker를 개발하여 소비자급 GPU에서도 농업 추론이 가능함을 보였습니다.

시사점, 한계점

시사점:
대규모 추론 모델(LRM)이 농업과 같은 복잡한 도메인 특화 추론 문제 해결에 효과적임을 보여줌.
농업 추론을 위한 새로운 벤치마크(AgReason)와 데이터셋(AgThoughts) 제공을 통해 향후 연구 발전에 기여.
소규모 모델(AgThinker) 개발을 통해 컴퓨팅 자원 제약을 완화하고 접근성 향상.
한계점:
최고 성능 모델의 정확도가 36%로 여전히 낮아 향후 성능 개선 필요.
AgReason 및 AgThoughts 데이터셋의 규모 및 다양성 확장 필요.
모델의 설명력 및 투명성 향상 필요.
👍