Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Explainable Sentiment Analysis with DeepSeek-R1: Performance, Efficiency, and Few-Shot Learning

Created by
  • Haebom

作者

Donghao Huang, Zhaoxia Wang

概要

本論文は、オープンソース推論モデルであるDeepSeek-R1の性能をOpenAIのGPT-4oおよびGPT-4o-miniと比較評価した研究である。 671Bモデルとその縮小版を対象に、何回の学習だけでも優れた性能を示すか実験した。 DeepSeek-R1は、5クラスの感性分析で91.39%のF1スコア、2クラスの感性分析で99.31%の精度を達成し、GPT-4oよりも8倍の効率が向上しました。また、32B Qwen2.5ベースモデルが70B Llamaベースモデルより6.69%p高い性能を示すなど、アーキテクチャによる蒸留効果も確認された。 DeepSeek-R1は推論プロセスの透明性によって解釈の可能性を高めましたが、処理速度はやや遅いというLimitationsを持っています。

Takeaways、Limitations

Takeaways:
DeepSeek-R1は、GPT-4oなどの商用モデルに比べて優れたfew-shot学習効率を提供するオープンソースの代替案であることを示唆している。
モデルアーキテクチャによる蒸留効果を分析し、将来のモデル開発にTakeawaysを提供します。
推論プロセスの透明性によって高い解釈の可能性を提供する。
Limitations:
推論プロセスの透明性を確保するために処理速度が遅い。
👍