언어 모델을 사용한 텍스트 분류는 텍스트에 특정 라벨을 부여하는 작업입니다. 이를 위해, 모델에게 명확한 지시와 함께 예시를 제공하는 것이 중요합니다. 이는 모델이 요구하는 작업을 정확히 이해하고, 원하는 결과를 생성할 수 있도록 합니다. 말 그대로 특정 텍스트에게 속성을 부여서 나누어 정리한다라는 개념으로 이해하시면 됩니다.
가장 많이 학계에서 쓰이는 예시는 감정분류나 목적분류 입니다. 저는 아래 7가지 문장을 넣고 목적 혹은 감정으로 분류해달라고 요청하였습니다.
"이 제품은 무척 쓰기 불편합니다. 저는 산 것을 후회하고 있습니다." "제가 방문했던 식당 중 가장 기억에 남습니다. 저는 기회가 있다면 또 방문하려 합니다." "제가 가고자하는 쇼핑몰에 맥도날드는 있습니까?" "맥도날드의 빅맥을 만드는 방법" "친구가 사다준 아이스크림을 먹었는데 그것의 출처를 알기 전까지 저는 맛있게 먹었습니다." "이 옷은 사진과 무척 다릅니다. 다만, 판매자가 빠르게 응답해주었고 저는 교환을 받았습니다." "이 가이드는 무척 친절 합니다."
이 문장들을 목적 혹은 감정에 따라 분류하면 다음과 같습니다:
"이 제품은 무척 쓰기 불편합니다. 저는 산 것을 후회하고 있습니다."
감정: 부정적
"제가 방문했던 식당 중 가장 기억에 남습니다. 저는 기회가 있다면 또 방문하려 합니다."
감정: 긍정적
"제가 가고자하는 쇼핑몰에 맥도날드는 있습니까?"
목적: 최신성 정보 획득
"맥도날드의 빅맥을 만드는 방법"
목적: 창작
"친구가 사다준 아이스크림을 먹었는데 그것의 출처를 알기 전까지 저는 맛있게 먹었습니다."
감정: 중립
"이 옷은 사진과 무척 다릅니다. 다만, 판매자가 빠르게 응답해주었고 저는 교환을 받았습니다."
감정: 중립
"이 가이드는 무척 친절 합니다."
감정: 긍정적
이러한 분류는 문장 내용과 문맥을 기반으로 한 것이며, 각 문장이 전달하고자 하는 목적과 표현된 감정에 따라 결정되었습니다.
이것은 현재 기준을 명확하게 정해주지 않은 상태에서 요청 하였을 때 나타나는 방식입니다. 만약 당신이 이것을 좀 더 세밀하게 분류하고 싶다면 어떻게 하면 될까요? 예시를 들어주거나 지시를 명확히 하면 됩니다. 기준을 만들어 주는 것이죠. 가령 이렇게 할 수 있습니다.
부정적 (Negative): 이 분류는 텍스트가 부정적인 감정이나 태도를 표현할 때 사용됩니다. 예를 들어, 불만, 실망, 슬픔, 분노, 두려움 등의 감정이 드러나는 경우가 여기에 해당합니다. 텍스트가 제품이나 서비스에 대해 불만을 표시하거나, 경험에 대해 부정적으로 언급하는 경우가 이에 해당합니다.
중립 (Neutral): 중립적인 텍스트는 긍정적이거나 부정적인 감정이 명확하게 드러나지 않는 경우에 해당합니다. 이러한 텍스트는 대개 정보를 전달하거나 질문하는 등 감정적으로 중립적인 상태를 유지합니다. 예를 들어, 단순한 질문, 사실적인 기술, 또는 개인적인 감정이나 태도가 드러나지 않는 문장이 여기에 해당합니다.
긍정적 (Positive): 긍정적 분류는 텍스트가 긍정적인 감정이나 태도를 표현할 때 적용됩니다. 이에는 만족, 기쁨, 흥미, 감사 등의 긍정적인 반응이 포함됩니다. 예를 들어, 제품이나 서비스에 대한 칭찬, 긍정적인 경험에 대한 언급, 만족스러운 결과에 대한 표현 등이 이 범주에 속합니다.
이렇게 미리 특정 분류에 대한 명확한 기준을 정하고 분류 작업을 시킬 경우 더 높은 퀄리티의 작업을 기대할 수 있습니다. 어떠신가요? 알면 알 수록 인간에게 일 시키는 것과 유사하지 않으신가요?