OpenAI의 Q*에 대한 관심, 그리고 SOS - Newsfeed

chicheadDec 8, 2023

2023 AI 보고서 “State of AI 2023” 리뷰

State of AI 2023 매년 AI 기술의 현주소를 분석해 100페이지가 넘는 보고서를 작성하는 팀이 있습니다. 이 팀은 AI 기술에 투자하는 벤처캐피탈 Air Street Captital의 Genenral Partner인 Nathan Benaich가 이끌고 있죠. 이 보고서는 State of AI Report라는 이름을 달고 2018년부터 매년 발표되고 있습니다. 보고서는 크게 5가지 파트로 구성되어 있습니다. Research: 기술 혁신과 그 역량 Industry: AI의 상업적 적용과 비즈니스에 미치는 영향 Politics: AI 관련 규제, 경제적 영향 및 AI 정책의 지정학 Safety: 미래 AI 시스템이 우리에게 초래할 수 있는 치명적인 위험을 식별, 완화 Predictions: 앞으로 일어날 것으로 예상되는 일과 이전 보고서의 성과 검토 2023년의 AI 기술 역량뿐 아니라 산업 영역, 또한 정책 상황과 안보 이슈까지 총 망라한 State of AI 보고서는 이곳에서 볼 수 있습니다. 시간이 된다면 원문을 찬찬히 뜯어볼 것을 추천합니다. 오늘 이 글에선 State of AI 보고서의 주요 부분을 요약하고, 추가로 덧붙일만한 내용을 포함해 정리해 보았습니다. 1. Research 1-1. LLM 2023년은 단연 LLM의 해라고 할 수 있습니다. 수많은 LLM 중에서도 가장 인상적인 건 바로 GPT-4죠. OpenAI가 공개한 테스트 결과를 보면 GPT-4는 AI 벤치마크뿐 아니라 변호사 시험, 미국 대학원 입학시험(GRE), 코딩테스트 플랫폼인 리트코드(Leetcode) 등 인간을 대상으로 설계된 시험에서도 좋은 성적을 얻어 냈습니다. GPT-3과 GPT-3.5는 텍스트만 학습했었지만 GPT-4는 텍스트와 이미지 모두를 학습한 친구입니다. 또한 GPT-4는 이미지를 기반으로 텍스트를 생성할 수 있는 멀티모달 AI이기도 하죠. OpenAI는 GPT-4가 여전히 할루시네이션(오류가 있는 데이터를 학습해 잘못된 답변을 진실로 답변하는 현상) 이슈로 문제를 겪고 있다고 밝히고 있지만, 그럼에도 불구하고 AI를 속이기 위해 생성된 데이터 셋에서 다른 모델들보다 40% 높은 정답률을 기록하면서 성능면에서 상당히 앞서 있습니다. GPT-4의 성공에 힘입어 RLFH(Reinforcement Learning from Human Feedback)는 올해의 MVP라고 할 수 있습니다. RLFH는 사람의 피드백을 활용해 모델을 훈련시기는 방법인데, OpenAI의 ChatGPT뿐 아니라 Meta의 LLaMa-2-chat, Google의 Bard 등 채팅 애플리케이션의 LLM에는 RLFM이 핵심적인 역할을 하고 있죠. 그런데 RLFH을 적용하려면 모델 결과물을 평가하고 순위를 매길 사람이 필요한데, 그런 탓에 비용이 많이 든다는 단점이 있습니다. 또 ‘사람’이 평가를 한다는 점에서 편향성 문제가 따라다닙니다. 미국 언론에서는 RLFH가 놓치고 있는 노동, 인권 문제에 대한 탐사 보도가 나오기도 했습니다. 오류를 잡아내기 위한 인간의 피드백을 받는 과정이 사실상 노동 착취와 다름없다는 건데, 워싱턴포스트는 스케일 AI의 필리핀 원격 근무가 사실상 디지털 착취 공장(digital sweatshops)이라고 비판했습니다. 참고로 스케일 AI는 OpenAI나 Meta 등을 고객으로 두고 있고, 최근 미 국방부와도 계약을 체결했습니다. 1-2. Open vs Closed LLM을 두고 경쟁이 치열해지다 보니 개방성에서 멀어지는 움직임도 있었습니다. 일단 OpenAI는 GPT-4에 대해 제한적인 정보만 담긴 기술 보고서를 발표했고, Google은 PaLM2에 대해 거의 공개하지 않았습니다. 하지만 Meta 성님은 달랐습니다. 사실상 오픈소스의 희망으로 떠오른 Meta는 GPT-3.5를 따라잡을만한 경쟁력 있는 LLaMa를 출시했습니다. X(구 트위터)에서는 ChatGPT가 5,430회 언급되면서 LLM 중 가장 높은 언급량을 보였습니다. GPT-4와 LLaMA가 그 뒤를 이었습니다. 비공개 소스 모델이 많은 관심을 받고 있지만, 오픈 소스도 뒤지진 않습니다. 허깅페이스는 오픈 소스의 인기에 힘입어 2023년 8월에만 6억 건 이상의 모델 다운로드를 기록했습니다. 오픈 소스 모델은 Gradio나 Streamlit 같은 웹 배포 애플리케이션을 만나 접근성을 더 높이고 있는 추세입니다. Gradio의 월간 활성 사용자는 23년 1월 12만 명에서 8월 58만 명으로 급증했습니다. 1-3. Benchmark

chichead

2023/12/08 6:04 PM

chicheadDec 5, 2023

소프트웨어 엔지니어 최고 연봉 2위, 쿠팡

핵심요점 : 2023년 12월 1일 기준, levels.fyi의 소프트웨어 엔지니어의 총 보수액 중간값을 기준으로 가장 높은 급여를 지급하는 상위 500대 기업 리스트를 나타냈습니다. 1위는 OpenAI, 2위는 쿠팡, 3위는 클럽하우스입니다. : 이 목록은 심층 분석이 아니라 소프트웨어 엔지니어링 직책에 대해 상대적으로 높은 보상을 제공하는 것으로 알려진 회사들을 대략적으로 정리한 것입니다. 표본 크기, 정확성, 연공 서열 또는 지역적 차이와 같은 요소는 고려되지 않았습니다. 요점 뒷받침 소프트웨어 엔지니어의 최고 연봉 기업은 925,000 USD의 OpenAI입니다. 2위는 600,000 USD를 기록한 쿠팡입니다. 이 리스트에는 자체 보고서의 표본 크기나 정확성은 전혀 고려되지 않았습니다. 그렇기 때문에 연공 서열이나 연봉에 영향을 미치는 다른 여러 요인(지역적 위치 등)으로 세분화하면 리스트는 크게 달라질 수 있습니다. levels.fyi가 중간값을 계산하여 제공하기에 충분한 데이터가 부족한 회사는 필터링됩니다. 상위 10개 기업 Rank Company ID Total Comp(USD) Levels.fyi URl 1 openai 925,000 https://levels.fyi/company/openai/salaries/software-engineer 2

chichead

2023/12/05 9:49 AM

chicheadDec 3, 2023

AGI(범용인공지능) 재정의하기 by 구글

핵심 요점 : 모든 상황에 일반적으로 두루 적용할 수 있는 AGI(범용인공지능, Artificial General Intelligence)는 AI 기술 분야에서 가장 논란이 많은 개념 중 하나입니다. 구글 딥마인드 연구자들이 이런 논란을 종식시키기 위해 나섰습니다. : 구글 딥마인드의 이번 연구는 AGI의 정의를 둘러싼 혼란을 해소하고, 신생(emerging)에서 초인간(superhuman)까지 5단계의 점진적 수준을 제시하며, 필수적인 특징과 구체성의 필요성을 조명하는 등 이해하기 어려운 개념에 대해 명확하게 설명한다는 점에서 의의가 있습니다. 요점 뒷받침 구글 딥마인드 팀은 AGI에 대한 새로운 정의를 확립하기 위해 기존 AGI의 정의들을 살펴보고 각 정의에 필수적으로 등장하는 공통 특징들을 도출했습니다. 이를 바탕으로 정리된 구글 딥마인드의 분류법은 AGI 수준을 5가지 단계로 식별하여 필수 속성과 인간 수준의 작업 수행 기준을 명확히 합니다. 그 5가지 수준은 각각 신생(emerging), 유능(competent), 전문가(expert), 거장(virtuoso), 초인간(superhuman) 수준입니다. 연구팀은 신생 단계에 현재 ChatGPT, Bard 등의 최첨단 챗봇이 포함되는 것으로 분류했습니다. 초인간 수준은 타인의 생각을 해독하고, 미래 사건을 예측하며, 동물과 대화를 나누는 등 인간은 할 수 없는 일을 포함한 광범위한 작업 수행에 뛰어난 AGI 수준을 의미합니다. 연구팀은 현재 기술이 신생 수준의 AGI를 넘어선 적이 없다고 언급했습니다. 딥마인드의 기준은 학습, 자기 평가, 도움을 구할 수 있는 범용의 높은 성취도를 가진 AI의 특징을 강조하며 이전의 AI 시스템과 차별화됩니다. 앞으로의 전망 : 인공지능에 대한 명확한 논의는 모호한 개념에서 정의된 매개변수로 논의를 이끌어가는 중추적인 순간이 될 수 있습니다. AGI 평가의 복잡성은 향후 모델에 따라 더욱 심화될 것이기에, 종합적인 AGI 평가를 위해선 지속적인 관리가 필요합니다. 원본 자료 https://arxiv.org/abs/2311.02462 https://www.technologyreview.kr/google-deepmind-what-is-artificial-general-intelligence-agi/ https://venturebeat.com/ai/here-is-how-far-we-are-to-achieving-agi-according-to-deepmind/

chichead

2023/12/03 11:01 PM