[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Boîte noire déployée – Critères fonctionnels pour les agents moraux artificiels à l'ère du LLM

Created by
  • Haebom

Auteur

Matthew E. Brophy

Contour

Cet article soutient que les progrès des modèles linguistiques à grande échelle (MLA), puissants mais opaques, nécessitent une révision fondamentale des critères philosophiques utilisés pour évaluer les agents moraux artificiels (AMA). Les cadres pré-MLA existants reposent sur l'hypothèse d'une architecture transparente, mais les MLA n'adhèrent pas à cette hypothèse en raison de leurs résultats probabilistes et de leurs états internes opaques. Cet article soutient donc que ces incohérences rendent les critères éthiques existants pratiquement inutiles pour les MLA. Abordant des sujets clés de la philosophie de la technologie, nous présentons dix critères fonctionnels pour évaluer les agents moraux IA basés sur les MLA : cohérence morale, sensibilité au contexte, intégrité normative, conscience métaphysique, résilience du système, fiabilité, modifiabilité, transparence partielle, autonomie fonctionnelle et imagination morale. Ces lignes directrices, appliquées aux « SMA-LLS » (Simulation d'agents moraux via des systèmes linguistiques à grande échelle), visent à conduire les MLA vers un meilleur alignement et une intégration sociale bénéfique dans les années à venir. Nous démontrons l’applicabilité pratique de ces critères dans des contextes moralement importants en utilisant un scénario hypothétique impliquant des bus autonomes (APB).

Takeaways, Limitations

Takeaways:
Présentation de nouveaux critères fonctionnels pour l'évaluation AMA basée sur le LLM : congruence morale, sensibilité au contexte, intégrité normative, conscience métaphysique, résilience du système, fiabilité, modifiabilité, transparence partielle, autonomie fonctionnelle et imagination morale.
Fournir un nouveau cadre d'évaluation qui surmonte les limites des normes éthiques existantes et prend en compte les caractéristiques du LLM
Présentation de l'orientation de l'intégration sociale de l'AMA basée sur le LLM à travers un nouveau concept appelé SMA-LLS
Vérification de l'applicabilité pratique au moyen de scénarios virtuels
Limitations:
Manque de discussion claire sur l’interaction et la priorisation des 10 critères présentés.
Manque de méthodologie spécifique pour l'application et l'évaluation pratiques du LLM
Le recours aux scénarios virtuels nécessite une validation supplémentaire de l’applicabilité au monde réel
Manque d’explications spécifiques sur la manière de définir et de mesurer la transparence partielle
👍