CMDS Obsidian Settings

옵시디언을 설정하고 체계를 구축하는 단계에서 참고하면 좋을 팁
설계 단계
5
CMDS Architecture
  • 커맨드스페이스
CMDS 목차 구조
  • 커맨드스페이스
CMDS Guide
  • 커맨드스페이스
CMDS 폴더 구조
  • 커맨드스페이스
ChatGPT, Claude에게 내 목차 정리시키기
  • 커맨드스페이스
구체화 단계
2
Smart Composer System Prompt
  • 커맨드스페이스
활용 단계
2
Markdown Syntax Guide for Researchers
  • 커맨드스페이스
CMDS 목차 연결하기
  • 커맨드스페이스

Gen AI Embedding Model 정리 (Smart Connections 플러그인 추천)

Status
구체화 단계
Created by
  • 커맨드스페이스
Created at
자주 사용하는 옵시디언 플러그인인 Smart Connections에서 선택 가능한 모델들에 대한 설명이다.

TaylorAI/bge-micro-v2

유형: sentence-transformers 모델
특징:
384차원 밀집 벡터 공간으로 매핑
BAAI/bge-small-en-v1.5에서 2단계 훈련 과정을 통해 증류
용도:
클러스터링
의미 검색
문장 유사성 평가

andersonbcdefg/bge-small-4096

유형: Hugging Face 호스팅 임베딩 모델
특징:
4096 토큰의 문맥 창 제공
성능:
MTEB 벤치마크에서 다양한 작업에 대해 좋은 성능
특히 분류 및 검색 작업에서 우수
용도:
긴 문서 처리
감정 분석
텍스트 분류

Xenova/jina-embeddings-v2-base-zh

유형: 다국어(중국어/영어) 임베딩 모델
특징:
768차원 임베딩 생성
최대 8192 토큰 처리 가능
용도:
중국어 텍스트 처리
긴 문서 분석
복잡한 쿼리 처리

text-embedding-3-small

유형: OpenAI의 새 임베딩 모델
특징:
1536차원 임베딩 생성
text-embedding-ada-002보다 성능 향상
이전 모델보다 5배 저렴한 가격
성능:
MIRACL(다국어 검색 벤치마크)에서 우수
MTEB(영어 작업 벤치마크)에서 우수

text-embedding-3-large

유형: OpenAI의 차세대 대형 텍스트 임베딩 모델
특징:
최대 3072차원 임베딩 생성
성능:
MIRACL과 MTEB 벤치마크에서 text-embedding-ada-002보다 훨씬 우수

text-embedding-3-small-512

유형: text-embedding-3-small의 변형
특징:
512차원 임베딩 생성
용도:
성능과 비용 사이의 균형 조절

text-embedding-3-large-256

유형: text-embedding-3-large의 변형
특징:
256차원 임베딩 생성
용도:
성능과 비용 사이의 균형 조절

text-embedding-ada-002

유형: OpenAI의 이전 세대 임베딩 모델
특징:
1536차원 임베딩 생성
성능:
새로운 모델들에 비해 낮지만 여전히 사용 가능

Xenova/jina-embeddings-v2-small-en

유형: 영어 텍스트용 소형 임베딩 모델
특징:
구체적인 정보 제한적

nomic-ai/nomic-embed-text-v1.5

유형: Nomic AI 개발 임베딩 모델
특징:
Matryoshka Representation Learning 사용
64에서 768 사이의 가변 임베딩 차원 지원
용도:
성능과 메모리 사용량 사이의 균형 조절

Xenova/bge-small-en-v1.5

유형: 영어 텍스트용 소형 임베딩 모델
특징:
384차원 임베딩 생성
최대 512 토큰 처리 가능

nomic-ai/nomic-embed-text-v1

유형: Nomic AI의 이전 버전 임베딩 모델
특징:
nomic-embed-text-v1.5와 성능 유사
가변 차원 미지원