この論文は、低資源言語(LRL)のための生成言語モデリングにおけるデータ不足の問題を解決するための戦略の最初の体系的なレビューを提供します。 54の研究に基づいて、単一言語データの拡張、逆翻訳、多言語学習、およびプロンプトエンジニアリングを含む技術的アプローチを生成的作業全体で識別、分類、および評価します。また、アーキテクチャの選択、言語系列表現、評価方法の動向を分析します。結論として、変圧器ベースのモデルへの強い依存性、少数のLRLへの集中、そして研究間の一貫性のない評価の欠如を強調し、より広い範囲のLRLにこれらの方法を拡張するための推奨事項を提示し、公平な生成言語システムの構築の未解決の課題を概説します。最終的に、このレビューは、低資源言語ユーザーのための包括的なAIツールを構築するために研究者と開発者を支援することを目的としています。