本論文は、科学情報に対する公衆の認識を12の次元(例えば、ニュース価値、重要性、驚き)にモデル化する計算フレームワークを提示します。米国と英国の多様な人口集団の2,101人の参加者から10,489個の注釈を含む大規模科学ニュース認識データセットを構築し、これをもとに大衆の認識スコアを予測するNLPモデルを開発しました。これにより、科学情報に対する公衆の認識を、(1)結果としての認識(どの要因が科学情報に対する公衆の認識に影響を及ぼすのか?)と(2)予測変数としての認識(推定認識を用いて科学参加を予測できるのか)という2つの観点から分析した.分析の結果、科学ニュースの消費頻度は認識の主な要因であり、人口統計的要因は最小限の影響を与えることがわかりました。 Redditでの大規模な分析と自然実験は、推定された国民の認識が最終的な参加パターンと直接関連していることを示しました。ポジティブな認識スコアを持つ投稿は、かなり多くのコメントと推薦を受けました。結論として、この研究は科学コミュニケーションにおける細分化された認識モデリングの重要性を強調し、科学コンテンツへの一般の関心と参加を予測する新しい方法を提示します。