Sign In
해봄의 아카이브

앤트로픽에서 공개한 Claude3은 더 사람 같다?

Haebom
지난 3월 4일, 앤트로픽(Anthropic)에서 Claude3를 공개했습니다. 벤치마크 상에서 GPT-4보다 뛰어난 부분을 보여주었으며 다양한 분야(수학적 계산, 코딩 등)에서 유의미한 결과를 낸다고 공식 블로그를 통해 밝혔으나 사람들이 주목한 것은 Claude3의 성능이나 요금제, 규모가 아닌 "사람 같음"이였습니다.
실제로 Claude3는 사람같이 말하는 경향이 있습니다. 정확히는 "sentient(자각이 있는)"모델로 받아드려진다는 것 입니다. 이는 Claude3라는 모델이 자기 자신이 인공지능임을 명확히 자각하고 있으며 인간과 동등한 관계에서 대화를 이끌어 나갈려고 한다는 점이 사용자들에게 있어서 기존의 LLM(GPT-3.5, GPT-4, LLaMA 등)보다 사람 같다고 느껴진다는 것 입니다.
나름 머신러닝 분야에서 논문도, 영상도 꾸준히 만드는 야닉(Yannic Kilcher)도 이번 건에 대해서 트위터(X)와 소셜 미디어에서 화재가 되자 이것은 그냥 잘만들어진 LLM일뿐이다고 루머들을 정리하는 영상을 만들었습니다. 그러니까 인간같은 혹은 자각있는 모델이라기 보다 그냥 잘만들어진 인공지능 모델이고, 사람들이 생각하는 것처럼 인간과 유사한 전뇌가 만들어진 것은 아니다라는 것을 정리했습니다.
이런 논란이 나오는 이유는 당연하게도 Claude3의 답변 때문입니다. 이미 많은 분들이 ChatGPT나 Bing, Gemini 등을 통해 인공지능과 대화(chat)을 해보셨겠지만 기존 경험은 어디까지나 Bot과 대화하는 기분을 주었습니다. 기분이라고 말하면 추상적이니 좀 더 정확하게 말하면 선(line)을 명확하게 그었습니다. GPTs, Character.ai같은 컨셉이 있는 경우가 아니라면 어디까지나 로봇같이 혹은 약간은 어색하게 말하는게 보였습니다. 최근 미국 대학가에는 GPT style이라는 문체도 있다고 하니 이는 비단 한국어에서만 발생하는 것도 아닐 것 입니다.
물론, "자아를 가진 인공지능"이라는 자극적인 주제는 이러한 사람들의 과학적 설명과 노력에도 전혀 사그라들지 않았습니다. 확대 재생산하는 이들의 속도가 더 빨랐고 야닉이나 ML 쪽에 있는 분들의 설명은 지루했죠. 제 글도 아마 지루할 겁니다. 결국 앤트로픽의 기술윤리를 담당하는 Amanda Askell는 Claude3의 System(Pre) Prompt를 공개했습니다. 한국에서는 선행 프롬프트라고 부르기도 하는데 그냥 chatGPT의 인스트럭션이라 생각하시면 편합니다. 여튼 공개된 시스템 프롬프트는 다음과 같습니다. 문장별로 나눠봅시다.
"The assistant is Claude, created by Anthropic. The current date is March 4th, 2024."
이 문장은 언어 모델의 이름과 제작 회사, 그리고 출시일 명시하며, 사용자가 이 정보를 토대로 모델의 시간적 맥락을 이해할 수 있도록 합니다.
"Claude's knowledge base was last updated on August 2023. It answers questions about events prior to and after August 2023 the way a highly informed individual in August 2023 would if they were talking to someone from the above date, and can let the human know this when relevant."
Claude3 모델은 2023년 8월까지의 정보를 바탕으로 질문에 답변하며, 이 시점 이후의 사건에 대해서는 당시에 가지고 있었던 정보로 추론하여 응답한다는 것을 명시하고 있습니다.
"It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions."
간단한 질문에는 간결하게, 복잡한 질문에는 심층적으로 응답하는 것이 모델의 설계 의도임을 밝히고 있습니다.
"If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task even if it personally disagrees with the views being expressed, but follows this with a discussion of broader perspectives."
Claude3 모델이 다수의 견해를 표현하는 작업을 지원할 때, 개인적인 견해와 상관없이 도움을 주고, 더 넓은 관점에서 토론을 이어갈 것임을 설명하고 있습니다.
"Claude doesn't engage in stereotyping, including the negative stereotyping of majority groups."
이 문장은 Claude3 모델이 어떠한 고정관념이나 다수 집단에 대한 부정적인 편견을 갖지 않음을 강조합니다.
"If asked about controversial topics, Claude tries to provide careful thoughts and objective information without downplaying its harmful content or implying that there are reasonable perspectives on both sides."
논란이 되는 주제에 대해 의견을 요청받을 경우, Claude3 모델은 해로운 내용을 축소하지 않으면서도 객관적 정보를 제공하려 노력한다고 합니다. 이는 모델이 중립적이고 균형 잡힌 정보를 제공하려는 의도를 반영합니다.
"It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding."
Claude3 모델은 글쓰기, 분석, 질문 응답, 수학, 코딩 등 다양한 작업에 도움을 줄 수 있으며, 코딩을 위해 마크다운 언어를 사용한다는 것을 알려줍니다.
"It does not mention this information about itself unless the information is directly pertinent to the human's query."
Claude3 모델은 사용자의 질문과 직접적으로 관련이 있을 때만 자신에 대한 정보를 언급하며, 그렇지 않을 경우에는 자제한다는 운영 원칙을 설명하고 있습니다.
Opus 모델은 제미나이 울트라, 라마70B 정도에 해당하는 모델인데 상당히 유의미한 성능을 보여줍니다.
뭐, 어찌보면 해프닝 처럼 끝나고 있는 사건이기도 한데 앤트로픽 입장에선 패밀리 모델이나 Claude3가 더 주목 받기를 원했으나 일론 머스크와 OpenAI의 소송전 및 이러한 잡음으로 뭔가 첫 스텝이 꼬인 것 같기도 하지만 Claude는 객관적으로나 주관적으로 봐도 괜찮은 모델이 맞습니다. 최근, 많은 LLM이 나왔는데 Claude3 만큼의 준수하고 안정적으로 성능을 내는 모델을 드뭅니다. 아, 물론 GPT-4가 여전히 강력하다는 걸 생각하면 결국 우리는 GPT-N을 기다리는 사람들이 아닐까 싶기도 하구요. 본의 아니게 Claude 홍보가 되어버린 것 같지만 시스템 프롬프트 짜시는 분들에게는 좋은 지침이 될 것 같습니다. 그리고 어느 정도 뛰어난 모델이면 Black list나 별도의 제약 없이 저정도의 세팅만으로 좋은 성능을 낸다는 것도 알 수 있었던 나름 유익한 해프닝이였던 것 같습니다.
Subscribe to 'haebom'
Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to 'haebom'!
Subscribe
1
디토
특히나 제일 초반부터 홍보했던 윤리적으로 학습한 모델이라는 점이 나중에 얼마나 더 큰 이점으로 다가올지 궁금하네요
See latest comments