この論文は、税分類システムで標準化された職業で、作業データに自動的に注釈を付ける職業分類作業に焦点を当てます。データの不足と手動コメントの難しさが原因で、この作業が困難になっています。この研究は、大規模言語モデル(LLM)が膨大な世界知識と文脈内学習機能のために有望ですが、その効果は職業分類システムの知識に依存していることを指摘しています。したがって、LLMの正確な分類体系エンティティ生成能力を評価し、特に小規模モデルの限界を強調する。これらの問題を解決するために、推論、検索、および再順位付けステップで構成される多段階フレームワークを提案し、分類体系ベースの推論の例を統合し、分類体系の知識との整列を通じてパフォーマンスを向上させます。大規模なデータセットの評価の結果、提案されたフレームワークは、職業と技術の分類作業を向上させるだけでなく、GPT-4oなどの最先端のモデルに費用対効果の高い代替手段を提供し、強力なパフォーマンスを維持しながら計算コストを大幅に削減します。したがって、本研究は、様々なLLMにおける職業分類および関連作業に対する実用的で拡張可能な解決策を提供する。