Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Morality in AI. A plea to embed morality in LLM architectures and frameworks

Created by
  • Haebom
Category
Empty

저자

Gunter Bombaerts, Bram Delisse, Uzay Kaymak

개요

대규모 언어 모델(LLM)이 인간의 의사 결정 및 행동에 미치는 영향이 커짐에 따라, LLM의 도덕적 의미 처리 능력 확보가 중요해짐. 기존의 하향식(bottom-up) 방식 대신, 변환기 기반 모델의 구조적 메커니즘에 도덕적 의미 처리를 직접 통합하는 상향식(top-down) 설계를 제안. 특히, 주의(attention)를 구조와 처리 사이를 매개하는 동적 인터페이스로 개념화하고, 아이리스 머독의 '사랑하는 주의(loving attention)' 이론을 활용하여 LLM 아키텍처에 도덕성을 내재화하는 기술적 접근 방식을 제시.

시사점, 한계점

시사점:
주의 메커니즘을 구조와 처리 사이의 동적 시스템으로 재개념화.
머독의 '사랑하는 주의' 개념을 기반으로 LLM에 도덕성을 내재화하는 기술적 방법론 제시 (훈련 목표 수정, 런타임 가중치 조정, 주의 아키텍처 개선).
아키텍처 기반의 도덕성 통합이 외부 제약 기반 방법론을 보완할 수 있다고 주장.
한계점:
탐구의 제한성을 인정.
실제 구현 및 성능 평가에 대한 구체적인 내용 부족.
철학적 개념을 기술적으로 구현하는 데 있어 추가적인 연구 필요.
👍