Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Evaluation of the Automated Labeling Method for Taxonomic Nomenclature Through Prompt-Optimized Large Language Model

Created by
  • Haebom
Category
Empty

저자

Keito Inoshita, Kota Nojiri, Haruto Sugeno, Takumi Taga

개요

본 논문은 거미 이름 데이터셋을 사용하여 대규모 언어 모델(LLM)을 이용한 자동 종 이름 라벨링의 실행 가능성을 평가했습니다. 기존의 수동 라벨링 방식의 시간 및 노력 소모 문제를 해결하기 위해 LLM의 텍스트 분류 및 의미 추출 기능을 활용하여, 프롬프트 엔지니어링을 통해 개선된 LLM 기반 라벨링 결과를 사람의 주석과 비교했습니다. 형태, 지리, 사람 범주에서는 높은 정확도를 달성했지만, 생태 및 행동, 현대 및 과거 문화 범주에서는 정확도가 낮았습니다. 향후 연구는 최적화된 퓨샷 학습 및 검색 증강 생성 기술을 통해 정확도를 향상시키고 다양한 생물 분류군으로의 적용 범위를 확장하는 데 초점을 맞출 것입니다.

시사점, 한계점

시사점:
LLM을 활용한 자동 종 이름 라벨링이 대규모 데이터셋 처리에 효율적임을 시사.
형태, 지리, 사람 관련 정보 추출에 높은 정확도를 보임.
프롬프트 엔지니어링을 통한 LLM 성능 향상 가능성 제시.
한계점:
생태 및 행동, 문화적 맥락 관련 정보 추출 정확도가 낮음.
현재 모델은 거미 데이터셋에 국한되어 다양한 생물 분류군으로의 일반화 필요.
퓨샷 학습 및 검색 증강 생성 기술 등 추가적인 개선 필요.
👍