本論文は、制約プログラミング(CP)のモデリングプロセスが専門知識を必要とすることで大衆化に苦しむことを指摘し、これを解決するために大規模言語モデル(LLM)を活用したCPモデリング自動化研究を扱う。既存の研究の限界である限定的な評価データセット問題を解決するために、さまざまな種類の結合最適化問題を含む新しいベンチマークCP-Benchを提示します。 CP-Benchを用いて抽象化レベルと構文の異なる3つのCPモデリングシステムに対するLLMのモデリング性能を比較評価し、プロンプトベースおよび推論時間計算方法を体系的に評価して最大70%の精度を達成した。特に、高レベルのPythonベースのフレームワークを使用すると、パフォーマンスが高くなりました。