Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Annif at SemEval-2025 Task 5: Traditional XMTC augmented by LLMs

Created by
  • Haebom

作者

Osma Suominen, Juho Inkinen, Mona Lehtinen

概要

本論文では、SemEval-2025 Task 5(LLMs4Subjects)で大規模言語モデル(LLM)を使用したトピックインデックス操作にAnnifシステムを提示します。この課題では、二言語 TIBKAT データベースの書誌記録に GND トピック語彙を使用してトピック予測を生成する必要がありました。 Annifシステムは、Annifツールキットに実装されている既存の自然言語処理および機械学習技術と翻訳および合成データを生成するための革新的なLLMベースの方法、および日本語モデルの予測マージを組み合わせます。定量的評価ですべてのテーマカテゴリーで1位、tib-core-テーマカテゴリーで2位を占め、定性的評価では4位を占めた。これらの結果は、多言語環境におけるトピック索引の精度と効率を向上させるために、既存のXMTCアルゴリズムと最新のLLM技術を組み合わせた可能性を示しています。

Takeaways、Limitations

Takeaways:
既存の自然言語処理と機械学習技術とLLMベースの技術の組み合わせによる多言語トピック索引作業の精度と効率の向上の可能性の提示
Annifシステムの優れた性能によりLLMを活用したトピック索引の分野における発展性の確認
多言語環境におけるトピック索引作業に対する効果的なアプローチの提示
Limitations:
定性的評価で4位を占め、定量的評価結果との違いが存在。定性的評価基準と結果の詳細な説明が必要です。
使用されるLLMおよび他の技術の詳細な説明の欠如。再現性を確保するための追加情報提供が必要。
👍