Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Mind the Gap: The Divergence Between Human and LLM-Generated Tasks

Created by
  • Haebom

作者

Yi-Long Lu, Jiajun Song, Chunhui Zhang, Wei Wang

概要

本論文では、大規模言語モデル(LLM)ベースの生成エージェントが人間と同様の方法でタスクを生成するかどうかを調べるために、人間とGPT-4oを対象にタスク生成実験を行いました。実験の結果、人間の仕事の作成は、開放性などの個人的な価値観や認知スタイルなどの心理的要因によって一貫して影響を受けますが、LLMは心理的要因が明示的に提供されてもこれらの行動パターンを反映できませんでした。 LLMが作成した作業は社会的ではなく、身体的活動が少なく、抽象的なテーマに偏っていました。 LLMによって作成された作業はより面白くて斬新であると評価されていますが、これはLLMの言語能力と人間に似た具体的な目標を作成する能力の違いを示しています。結論として、人間の認知の価値中心的で具体的な特性とLLMの統計的パターンとの間には根本的な違いがあります。

Takeaways、Limitations

Takeaways:
人間の仕事の作成は、個人的な価値と認知スタイルによって大きく影響されることを確認しました。
LLMは人間とは異なり社会的ではなく、身体的活動が少なく、抽象的な仕事を生み出す傾向があります。
LLMの言語能力と人間に似た目標生成能力との間に差がある。
人間中心のエージェント開発には、内的動機と物理ベースの統合が不可欠です。
Limitations:
GPT-4o 1 つの LLM のみを使用して実験を進め、一般化の可能性に制限があります。
心理的要因をLLMに提供する方法の制限により、LLMのパフォーマンスが正しく評価されていない可能性があります。
実験参加者の数と多様性に関する情報が不足しているため、結果の信頼性をさらに検討する必要があります。
👍