Share
Sign In
Lighthouse LLM
대규모 언어 모델(LLM)이란?
L
Lighthouse
👍
1
대규모 언어 모델(LLM)은 방대한 양의 텍스트 데이터를 학습하여 텍스트를 생성하고, 언어를 번역하고, 다양한 종류의 창의적인 콘텐츠를 작성하는 등 인간과 같은 방식으로 언어를 처리할 수 있는 기계 학습 모델입니다.
https://www.cmswire.com/digital-marketing/midjourney-vs-dall-e-2-vs-stable-diffusion-which-ai-image-generator-is-best-for-marketers/
LLM은 다음과 같은 특징을 가지고 있습니다.
대규모 데이터 학습: LLM은 수백만에서 수십억 개의 단어로 구성된 데이터 세트에서 학습합니다. 이러한
대규모 데이터 세트는 LLM이 인간 언어의 복잡성을 이해하고 학습하는 데 도움이 됩니다.
텍스트 생성: LLM은 텍스트를 생성할 수 있습니다. 예를 들어, LLM은 시, 코드, 대본, 음악 작품, 이메일,편지 등과 같은 다양한 종류의 창의적인 텍스트 형식을 생성할 수 있습니다.
언어 번역: LLM은 언어를 번역할 수 있습니다. 예를 들어, LLM은 영어에서 한국어로, 한국어에서 영어로 등 다양한 언어 간의 번역을 수행할 수 있습니다.
질문 응답: LLM은 질문에 답변할 수 있습니다. 예를 들어, LLM은 "파리의 수도는 어디입니까?"와 같은 질문에 답변할 수 있습니다.
LLM은 다양한 분야에서 활용되고 있습니다. 다음은 LLM의 대표적인 활용 사례입니다.
자연어 처리: LLM은 자연어 처리(NLP) 분야에서 사용됩니다. NLP는 컴퓨터가 인간 언어를 이해하고 처리할 수 있도록 하는 분야입니다. LLM은 NLP의 다양한 작업에 사용될 수 있습니다. 예를 들어, LLM은 텍스트를 분류하고, 텍스트에서 정보를 추출하고, 텍스트를 요약하는 데 사용될 수 있습니다.
챗봇: LLM은 챗봇에 사용됩니다. 챗봇은 사람과 대화할 수 있는 컴퓨터 프로그램입니다. LLM은 챗봇이 더 자연스럽고 유익한 대화를 할 수 있도록 합니다.
창의적인 콘텐츠 생성: LLM은 창의적인 콘텐츠를 생성하는 데 사용됩니다. 예를 들어, LLM은 시, 코드, 대본, 음악 작품, 이메일, 편지 등과 같은 다양한 종류의 창의적인 텍스트 형식을 생성하는 데 사용될 수 있습니다.
RAG 방식
LLM은 다음과 같은 방식으로 작동합니다.
LLM은 입력 텍스트를 단어와 기호로 분해합니다.
LLM은 분해된 단어와 기호를 사용하여 텍스트의 의미를 이해합니다.
LLM은 텍스트의 의미를 바탕으로 출력 텍스트를 생성합니다.
LLM의 정확성과 성능을 향상시키기 위해 다양한 방법이 연구되고 있습니다. 그 중 하나는 RAG 방식입니다.
RAG 방식은 LLM이 텍스트를 이해하는 방식을 개선하는 방식입니다. RAG 방식은 텍스트를 다음과 같이 세 가지 구성 요소로 분해합니다.
관계(Relations): 텍스트의 주제와 주제 간의 관계를 나타냅니다. 예를 들어, "김철수는 서울에 사는 학생입니다."라는 문장에서 "서울에 사는"은 "김철수"와 "학생"의 관계를 나타냅니다.
주제(Argument): 텍스트의 주제를 나타냅니다. 예를 들어, "김철수는 서울에 사는 학생입니다."라는 문장에서 "김철수"와 "학생"은 모두 주제입니다.
기능(Function): 텍스트의 기능을 나타냅니다. 예를 들어, "김철수는 서울에 사는 학생입니다."라는 문장에서 "는"은 동격의 기능을 나타냅니다.
RAG 방식은 LLM이 텍스트의 의미를 더 잘 이해할 수 있도록 도와줍니다. 이를 통해 LLM의 정확성과 성능을 향상시킬 수 있습니다.
LLM은 아직 초기 단계에 있지만, 다양한 분야에서 다양한 방식으로 활용될 수 있는 잠재력을 가지고 있습니다. 앞으로 LLM이 어떻게 발전할지 기대됩니다.
라이트하우스에서는 회계/세무 그리고 다양한 인더스트리 리포트들을 기반으로 RAG방식을 연구중에 있고 꽤 괜찮은 성과들을 내고 있습니다.
다음 글에서는 성능평가 방식에 대해 기초적인 내용을 다루어 보겠습니다!
Kp
Subscribe to 'kpmg-lighthouse'
Welcome to 'kpmg-lighthouse'!
By subscribing to my site, you'll be the first to receive notifications and emails about the latest updates, including new posts.
Join SlashPage and subscribe to 'kpmg-lighthouse'!
Subscribe
👍
1
최윤진
스크래치 nanoGPT
들어가며 네이처는 매년 이슈가 된 과학자 10인, nature’s 10을 뽑습니다. 2023년 nature’s 10에 ChatGPT가 명단을 올렸습니다. 네이처는 2023년 ChatGPT 가 세상 전반에 큰 영향력을 끼쳤다고 했습니다. 더 성능이 좋고 가벼운 모델들을 개발하려는 움직임에 막대한 자본과 인력이 투입되고 있습니다. 동시에 점점 더 커지고 복잡해지는 LLM을 이해하는 것이 어려워 지고 있습니다. 이번 글에서는 GPT를 아주 간소하게 만든 nanoGPT를 만들어봄으로써 LLM의 내부 메커니즘을 파악해보겠습니다. 먼저 GPT를 잘 알기 위해서는 Transformer 모델을 알아야 합니다. 이 모델을 공식적으로 발간한 ‘Attention is all you need(NeurIPS, 2017)’ 논문은 인용수는 10만회를 넘었습니다. 이 논문을 기반으로 GPT 시리즈가 만들어졌습니다. GPT-1(2018년), GPT-2(2019년), GPT-3(2020년), InstructGPT(2022년), 그리고 2023년에 GPT-4가 나왔습니다. [Transformer] Attention Is All You Need, 2017 [GPT-1] Improving Language Understanding by Generative Pre-Training, 2018 [GPT-2] Language Models are Unsupervised Multitask Learners, 2019 [GPT-3] Language Models are Few-Shot Learners, 2020 [Instruct GPT] Training language models to follow instructions with human feedback, 2022 [GPT-4] GPT-4 Technical Report, 2023 때문에 먼저 Transformer 의 아키텍쳐를 살펴보고 nanoGPT 를 만드는 순으로 진행하겠습니다. 코드는 Andrej Karpathy 의 Let's build GPT: from scratch, in code, spelled out. 를 참고했습니다. 셰익스피어의 문체를 학습하고 생성하는 모델을 만들어보겠습니다. Before Transformer
😍😘😀
3
Lighthouse
Langchain이란?
Langchain은 방대한 양의 텍스트 데이터를 학습하여 텍스트를 생성하고, 언어를 번역하고, 다양한 종류의 창의적인 콘텐츠를 작성하는 등 인간과 같은 방식으로 언어를 처리할 수 있습니다. Langchain은 다음과 같은 특징을 가지고 있습니다. 대규모 데이터 학습: Langchain은 수십억 개의 단어로 구성된 데이터 세트에서 학습합니다. 이러한 대규모 데이터 세트는 Langchain이 인간 언어의 복잡성을 이해하고 학습하는 데 도움이 됩니다. 텍스트 생성: Langchain은 텍스트를 생성할 수 있습니다. 예를 들어, Langchain은 시, 코드, 대본, 음악 작품, 이메일, 편지 등과 같은 다양한 종류의 창의적인 텍스트 형식을 생성할 수 있습니다. 언어 번역: Langchain은 언어를 번역할 수 있습니다. 예를 들어, Langchain은 영어에서 한국어로, 한국어에서 영어로 등 다양한 언어 간의 번역을 수행할 수 있습니다. Langchain의 응용 방안 Langchain은 다양한 분야에서 응용될 수 있습니다. 다음은 Langchain의 대표적인 응용 방안입니다. 챗봇: Langchain은 챗봇에 사용될 수 있습니다. 챗봇은 사람과 대화할 수 있는 컴퓨터 프로그램입니다. Langchain은 챗봇이 더 자연스럽고 유익한 대화를 할 수 있도록 합니다. 창의적인 콘텐츠 생성: Langchain은 창의적인 콘텐츠를 생성하는 데 사용될 수 있습니다. 예를 들어, Langchain은 시, 코드, 대본, 음악 작품, 이메일, 편지 등과 같은 다양한 종류의 창의적인 텍스트 형식을 생성할 수 있습니다. 자연어 처리: Langchain은 자연어 처리(NLP) 분야에서 사용될 수 있습니다. NLP는 컴퓨터가 인간 언어를 이해하고 처리할 수 있도록 하는 분야입니다. Langchain은 NLP의 다양한 작업에 사용될 수 있습니다. 예를 들어, Langchain은 텍스트를 분류하고, 텍스트에서 정보를 추출하고, 텍스트를 요약하는 데 사용될 수 있습니다.
❤️👍
2
Lighthouse
LLM을 쉽게 인더스트리 내에서 연구하고 적용하는 방법
대규모 언어 모델(LLM)은 방대한 양의 텍스트 데이터를 학습하여 텍스트를 생성하고, 언어를 번역하고, 다양한 종류의 창의적인 콘텐츠를 작성하는 등 인간과 같은 방식으로 언어를 처리할 수 있는 기계 학습 모델입니다. LLM은 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있지만, 인더스트리 내에서 연구하고 적용하는 것은 쉽지 않은 일입니다. 인더스트리 내에서 LLM을 연구하고 적용하는 데는 다음과 같은 어려움이 있습니다. 데이터셋 확보: LLM을 훈련하기 위해서는 방대한 양의 텍스트 데이터가 필요합니다. 인더스트리에서는 이러한 데이터를 확보하는 것이 쉽지 않습니다. 컴퓨팅 자원: LLM을 훈련하는 데는 많은 컴퓨팅 자원이 필요합니다. 인더스트리에서는 이러한 자원을 확보하기가 어렵습니다. 전문 지식: LLM을 연구하고 적용하기 위해서는 전문적인 지식이 필요합니다. 인더스트리에서는 이러한 지식을 가진 인력을 확보하기가 어렵습니다. 이러한 어려움을 극복하기 위해서는 다음과 같은 방법을 고려할 수 있습니다. 데이터셋 공유: 인더스트리 내에서 LLM을 연구하고 적용하기 위해서는 데이터셋을 공유하는 것이 중요합니다. 이를 통해 데이터셋 확보의 어려움을 해결할 수 있습니다. 클라우드 컴퓨팅: 클라우드 컴퓨팅을 활용하면 컴퓨팅 자원의 어려움을 해결할 수 있습니다. 교육 및 훈련: LLM에 대한 교육 및 훈련을 제공하여 전문 지식의 어려움을 해결할 수 있습니다. 이러한 방법을 활용하면 인더스트리 내에서도 LLM을 연구하고 적용하는 것이 쉬워질 것입니다. 데이터셋 공유 데이터셋 공유는 인더스트리 내에서 LLM을 연구하고 적용하기 위한 가장 중요한 방법 중 하나입니다. 인더스트리 내에서 데이터셋을 공유하면 다음과 같은 이점을 얻을 수 있습니다.
👏👍❤️🟦
4