STREAM (ChemBio): A Standard for Transparently Reporting Evaluations in AI Model Reports
Created by
Haebom
作者
Tegan McCaslin, Jide Alaga, Samira Nedungadi, Seth Donoughe, Tom Reed, Rishi Bommasani, Chris Painter, Luca Righetti
概要
本論文は、AIモデルの危険な能力評価とその結果に対する透明性の確保の重要性を強調し、化学および生物学(ChemBio)ベンチマークに焦点を当てたAIモデル評価結果報告の標準であるSTREAM(A Standard for Transparently Reporting Evaluations in AI Model Reports)を提案します。政府、市民社会、学界、最先端のAI企業の専門家23人と協議して開発されたSTREAMは、AI開発者が評価結果を明確に提示し、第三者がChemBio評価の厳格性を評価するのに十分な詳細を提供することを確認するのに役立つ実用的な標準です。 「ゴールデンスタンダード」のケースでは、提案されたベストプラクティスを具体的に示し、AI開発者が推奨事項をより簡単に実装できるように3ページのレポートテンプレートを提供します。