LLM과 에이전트에 대한 기초 개념을 아주 쉽고 명확하게 소개하는 강의

Created by
  • M
    MC
Created at
Category
  1. llm
  2. 에이전트
스탠포드 대학에 재직 중인 한국인 교수가 LLM과 에이전트에 대한 기초 개념을 1시간 동안 아주 쉽고 명확하게 소개하는 강의라고 합니다.

강의 중 등장하는 주요 용어 몇 가지 정리
언어 모델 (Language Model):
주어진 텍스트 데이터를 학습하여, 다음에 어떤 단어가 나올지 예측하거나 새로운 텍스트를 생성할 수 있는 인공지능 모델.
자연어 처리(NLP)의 핵심 기술로, 번역, 요약, 질의응답 등 다양한 작업에 사용됨.
사전 훈련 (Pre-training):
언어 모델을 만들기 위한 초기 대규모 학습 단계.
웹사이트, 책, 뉴스 기사 등 방대한 양의 텍스트 데이터를 사용하여 모델이 언어의 기본적인 패턴, 문법, 의미 등을 학습하게 함.
이 과정을 통해 기본적인 언어 이해 능력을 갖춘 '기본 모델(Base Model)'이 생성됨.
파인튜닝 (Fine-tuning) / 사후 훈련 (Post-training):
사전 훈련된 기본 모델을 특정 목적이나 작업에 맞게 추가적으로 학습시키는 과정.
예를 들어, 특정 산업 분야의 용어를 더 잘 이해하게 하거나, 사용자의 질문에 더 명확하게 답변하도록 조정할 수 있음.
환각 (Hallucination):
AI가 실제로는 사실이 아니거나 존재하지 않는 정보를 마치 사실인 것처럼 생성하거나 답변하는 현상을 말함.
학습 데이터에 없거나 잘못된 정보를 바탕으로 추론할 때 발생할 수 있음.
지식 단절 (Knowledge Cut-off):
언어 모델은 학습 데이터가 구축된 특정 시점까지만 정보를 알고 있고, 그 이후의 최신 정보나 사건에 대해서는 알지 못하는 한계를 의미함.
이 때문에 답변이 오래되었거나 관련성이 떨어질 수 있음.
검색 증강 생성 (RAG - Retrieval-Augmented Generation):
언어 모델의 한계를 보완하는 기술.
사용자의 질문을 받으면, 관련된 최신 정보나 특정 문서를 외부 데이터 소스에서 검색(Retrieval)한 후, 이 정보를 바탕으로 답변을 생성(Generation)함.
이를 통해 지식 단절 문제를 해소하고 환각을 줄이며, 정보의 출처를 제시할 수 있음.
함수 호출 (Function Calling) / 도구 사용 (Tool Use):
언어 모델이 단순히 텍스트만 처리하는 것을 넘어, 외부의 도구(예: 계산기, 검색 엔진, API 등)를 사용하거나 특정 함수(코드)를 실행할 수 있게 하는 기능.
이를 통해 실시간 정보를 가져오거나, 복잡한 계산을 수행하는 등 모델의 능력을 확장할 수 있음.
에이전트 언어 모델 (Agent Language Model):
주어진 목표를 달성하기 위해 스스로 계획을 세우고, 추론하며, 필요한 도구(함수 호출 등)를 사용하고, 환경과 상호작용하며 행동하는 진보된 언어 모델.
단순한 정보 제공을 넘어 복잡한 작업을 자율적으로 수행할 수 있는 잠재력을 가짐.