Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Towards Smarter Hiring: Are Zero-Shot and Few-Shot Pre-trained LLMs Ready for HR Spoken Interview Transcript Analysis?

Created by
  • Haebom

저자

Subhankar Maity, Aniket Deroy, Sudeshna Sarkar

개요

본 연구는 GPT-4 Turbo, GPT-3.5 Turbo 등 주요 사전 훈련된 거대 언어 모델(LLM)들의 성능을 HR 면접 시나리오에서 전문가 수준의 인간 평가자와 비교 분석한 논문입니다. 실제 HR 면접 기록 3,890건으로 구성된 HURIT 데이터셋을 사용하여 LLM들이 면접 점수 부여, 오류 식별, 피드백 및 개선 제안 능력을 평가했습니다. 그 결과, 특히 GPT-4 Turbo와 GPT-3.5 Turbo는 인간 평가자와 비슷한 수준의 점수를 부여하는 능력을 보였지만, 오류 식별 및 구체적인 개선 방안 제시에는 어려움을 보였습니다. 따라서 연구는 HR 면접 평가에 LLM을 자동으로 적용하는 것보다는, 인간의 개입을 통한 오류 검토 및 피드백 질 향상을 위한 접근 방식이 더 적합하다고 제안합니다.

시사점, 한계점

시사점:
GPT-4 Turbo와 GPT-3.5 Turbo는 HR 면접 점수 부여 측면에서 인간 전문가와 유사한 성능을 보임.
LLM을 활용한 HR 면접 평가 자동화의 가능성을 시사하지만, 완전한 자동화는 현실적이지 않음.
인간-LLM 협업 방식이 HR 면접 평가의 효율성 및 정확성 향상에 기여할 수 있음.
한계점:
LLM들이 HR 면접에서의 오류 식별 및 구체적인 개선 방안 제시에 어려움을 보임.
LLM의 피드백 질 향상을 위한 추가적인 연구가 필요함.
현재 LLM 기술만으로는 HR 면접 평가의 완전 자동화는 어려움.
👍