[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Un cadre multi-étapes avec raisonnement guidé par la taxonomie pour la classification des professions à l'aide de grands modèles linguistiques

Created by
  • Haebom

Auteur

Palakorn Achananuparp, Ee-Peng Lim, Yao Lu

Contour

Cet article se concentre sur la classification des professions, qui annote automatiquement les données d'emploi avec des professions standardisées en taxonomie. Cette tâche est entravée par le manque de données et la difficulté de l'annotation manuelle. Cette étude souligne que, bien que les modèles linguistiques à grande échelle (MLH) soient prometteurs en raison de leur vaste connaissance du monde et de leurs capacités d'apprentissage contextuel, leur efficacité dépend de la connaissance de la taxonomie des professions. Par conséquent, nous évaluons la capacité des MLH à générer des entités taxonomiques précises, et soulignons en particulier les limites des modèles à petite échelle. Pour résoudre ces problèmes, nous proposons un cadre en plusieurs étapes comprenant des étapes d'inférence, de récupération et de reclassement qui intègrent des exemples d'inférence basés sur la taxonomie et améliorent les performances grâce à l'alignement avec les connaissances taxonomiques. Les résultats de l'évaluation sur des ensembles de données à grande échelle montrent que le cadre proposé améliore non seulement les tâches de classification des professions et des compétences, mais offre également une alternative rentable aux modèles de pointe tels que GPT-4o, réduisant considérablement les coûts de calcul tout en maintenant des performances robustes. Ainsi, cette étude fournit une solution pratique et évolutive pour la classification des professions et les tâches connexes dans divers LLM.

Takeaways, Limitations

Takeaways:
Proposer une méthode pour améliorer l’efficacité et la précision de la classification professionnelle à l’aide du LLM.
Le cadre multi-étapes proposé offre une alternative rentable aux modèles coûteux tels que GPT-4o.
Validation des performances du cadre par des expérimentations utilisant des ensembles de données à grande échelle.
Fournir des solutions évolutives applicables à une variété de LLM.
Limitations:
Pour les petits LLM, il existe un risque de dégradation des performances.
La performance du cadre proposé peut dépendre de la qualité du système de classification utilisé.
Des recherches supplémentaires sont nécessaires sur la généralisabilité à des langues ou à des domaines professionnels spécifiques.
👍