Sign In
권미정
Category
Empty
✅ 만들고자 하는 시스템 정리
🧠 목표:
학교 내부의 계약, 구매, 행정 관련 규정 문서들을 AI에 넣고
질문을 입력하면 그에 맞는 정확한 규정 근거와 설명을 챗봇 형태로 응답하는 시스템
예시 질문:
"50만원 이하 물품은 어떻게 구매 처리하나요?"
"지방출장비는 어떤 조건에서 지급되나요?"
✅ 이걸 만드는 데 필요한 핵심 기술 요소
구성 요소 설명 사용 예시
문서 업로드 & 처리 학교 규정 PDF, HWP, DOCX, 텍스트 등을 AI가 읽을 수 있게 처리 LangChain, LlamaIndex, PyMuPDF, PDFMiner 등
정보 검색 (RAG) 질문과 관련된 규정 조항을 먼저 검색해서 LLM에 함께 넣는 구조 RAG (Retrieval Augmented Generation)
LLM 질의응답 엔진 검색된 규정을 근거로 사람이 이해할 수 있게 자연어로 설명 GPT-4, Claude 3, Mistral 등
노트북 실행 환경 코랩, Jupyter 등에서 테스트하고 배포 가능 Google Colab + LangChain
✅ 구체적 구현 흐름
학교 규정 문서 수집
예: 구매규정.pdf, 계약지침.hwp, 출장규정.docx 등
문서 처리 (텍스트로 변환)
PDF, 한글파일 → 텍스트 추출
예: PyMuPDF / python-docx / py-hwp 등 사용
문서 벡터화 및 저장
문장을 조각 내어 임베딩 처리 → 검색용 DB 저장
예: Chroma, FAISS, Pinecone, LlamaIndex
사용자 질문 처리 (RAG 구조)
질문을 입력 → 관련 규정 문단 검색 → LLM에 함께 넣어 답변 생성
응답 출력
요점 + 관련 규정 조항 인용 (출처까지 포함 가능)
✅ 예시 기술 스택
언어 모델: OpenAI GPT-4 / Claude / LLaMA3
검색 구조 (RAG): LangChain or LlamaIndex
임베딩 모델: OpenAI Embedding or BGE-small
DB 저장소: Chroma or FAISS
UI(선택사항): Gradio, Streamlit, Slack 연동 가능
✅ 실행 가능한 최소 예시 코드 흐름 (요약)
python
코드 복사

문서 불러오기

from llama_index import SimpleDirectoryReader
documents = SimpleDirectoryReader("규정문서폴더").load_data()

벡터 인덱스 생성

from llama_index import GPTVectorStoreIndex
index = GPTVectorStoreIndex.from_documents(documents)

질문

query = "50만원 이하 물품은 구매 방식이 어떻게 되나요?"

응답 생성

response = index.query(query)
print(response)
✅ 기획서 포맷으로 작성한다면?
서비스 명: UniGovQA: 대학 행정 규정 AI 도우미
사용자: 교직원, 연구원, 조교
기능: 행정규정 질문 응답, 규정 출처 인용, 하이퍼링크 제공
도입 효과: 규정 해석 시간 단축, 오류 감소, 민원 감소
기술: LLM + RAG + 벡터 검색
✅ 주의할 점
학교 규정은 법적 요소가 있어 답변 정확성 매우 중요 → 반드시 근거 조항 출력
하드코딩된 규칙이 아닌 문서 기반 질의응답이기 때문에, 규정이 바뀌면 문서만 바꾸면 됨 (유지보수 쉬움)
👍