本論文は、低資源言語であるルーマニア語の文学翻訳のための統合フレームワークであるTINYFABULIST TRANSLATION FRAMEWORK(TF2)を提示する。 TF2は、圧縮された微調整言語モデル(TF2-12B)と大規模合成並列データセット(DS-TF2-EN-RO-3MおよびDS-TF2-EN-RO-15K)を生成および公開することを中心に、データセットの作成、微調整および評価のための統合フレームワークです。従来の大規模合成英語寓話データセット(DS-TF1-EN-3M)に基づいて高品質ルーマニア語参照データ15,000個を生成し、120億パラメータのオープンウェイトモデルに対してディレクティブ微調整とアダプタ圧縮を行い、モデルを微調整します。評価は、パックレベルBLEUと5次元LLMベースの評価尺度(正確性、流暢性、一貫性、スタイル、文化的適応)を組み合わせて行われます。実験の結果、微調整されたモデルは、最高性能の大規模な独占モデルと競争力のある流暢性と適切性を達成しながら、オープンソース、アクセシビリティ、およびコスト効率を提供します。モデルとデータセット、スクリプト、評価プロンプトの両方が公開されます。