Sign In

지그재그 세미나 2회

일시: 2025-11-07 오후 7시
장소: 서울 중구 을지로14길 22 401호

진행 방식

1.
간단한 자기 소개 (3분/인)
2.
각자 연구/개발 사례 공유 (5분/인)
3.
주제 논의 (90분)

주제

🏅
AI-Ready Data
데이터 레이크와 데이터 웨어하우스만으로는 왜 AI 의사결정을 지원할 수 없는가?
1.
AI-Ready Data 시대에 대한 정의는 무엇인가?
2.
데이터 레이크/웨어하우스의 역할과 한계는 어디까지인가?
3.
AI가 내리는 의사결정에 "근거"와 "의미"가 필요한가?
4.
AI의 의사결정은 어디까지 신뢰할 수 있는가?
5.
조직 내 온톨로지 도입은 기술 문제인가, 조직 문화 문제인가?
6.
온톨로지는 "초기 설계형"인가 "진화/운영형"인가?

참여자

건설환경공학 분야 연구자
기술 혁신 관련 실무자
상품 추천 관련하여 그래프를 적용하는 개발자
온톨로지 교육&확산 전문가
진행 : joyhong

논의 요약

온톨로지·지식그래프 실무자들이 나눈 논의 요약

최근 다양한 기업과 연구조직에서 "AI가 실제 의사결정을 지원할 수 있는가?"라는 질문이 중요한 주제로 떠오르고 있다. 데이터 레이크, 데이터 웨어하우스, 분석 대시보드까지는 이미 충분히 성숙했지만, 의사결정은 단순 데이터 조회와는 다른 문제이기 때문이다.
이번 논의에서는 AI가 의사결정을 하기 위해 필요한 조건들이 무엇인지 여러 실무자들의 경험을 바탕으로 정리되었다.
전반부는 AI가 의사결정을 하기 위해 필요한 것은 무엇인지에 대해 논의하였고,
후반부는 미리 공지한 질문에 대한 논의를 하였다.

[전반부] AI가 의사결정을 하기 위해 필요한 것은 무엇인가?

1. AI는 '답'을 내리는 것이 아니라 확률적 판단을 제안한다

현재의 AI는 특정 상황에서 가장 가능성이 높은 답을 제안하는 수준이다.
따라서 최종 책임과 결정은 인간이 내려야 하며, AI는 결정 과정에 참고 가능한 근거를 제공하는 역할이 적합하다.
"AI는 판단을 도와줄 수 있지만, 그 판단에 대한 책임은 여전히 사람에게 있다."

2. 의사결정은 '문제·목표·맥락'이 정의되지 않으면 의미가 없다

여러 프로젝트 현장에서 공통적으로 겪은 문제는 다음과 같다.
데이터가 많아도 무엇에 쓰일지 정의되지 않으면 활용 불가
현업이 어떤 판단 단계를 거치는지 업무 지식이 정리되어 있지 않음
"그냥 다 알려주는 AI"는 현실적으로 불가능
즉, AI가 아니라 '의사결정 과정' 자체가 먼저 명확해야 한다.

3. 여기서 온톨로지(ontology)가 중요한 역할을 한다

온톨로지는 복잡한 현실을 개념·관계·규칙으로 구조화하는 방법이다.
이는 데이터 그 자체가 아니라 데이터가 의미를 가지는 맥락을 정리하는 일이다.
온톨로지는 다음을 가능하게 한다:
항목
설명
맥락 제공
데이터가 어떤 의미와 관계를 갖는지 체계적으로 설명
일관된 의사결정 기준
조직 내 누구나 동일한 기준으로 판단 가능
설명가능성(Explainability)
AI가 왜 그런 판단을 했는지 근거를 제시
엔터티/용어 통일
부서마다 다르게 쓰는 단어를 하나로 표준화

4. 단, 모든 데이터를 온톨로지화할 필요는 없다

온톨로지/지식그래프가 만능은 아니다.
가치가 높은 의사결정 영역부터 점진적으로 구축하는 것이 현실적이다.
또한 최근에는:
LLM (생성형 AI)
그래프 구조화 데이터
전문 역할 별 AI 에이전트
를 조합하여 '역할 기반 AI 의사결정 지원 구조'를 만드는 방향이 주목받고 있다.

5. 결론: AI가 의사결정을 하기 위해 필요한 것들

필요 요소
설명
명확한 목표 정의
"AI가 무엇을 결정해야 하는가?"가 가장 먼저
업무 맥락/도메인 지식 정리
경험과 업무 흐름의 구조화
온톨로지를 통한 개념·관계 모델링
데이터의 의미 체계화
설명가능성과 신뢰 확보
판단 근거를 제공할 수 있어야 함
Human-in-the-loop
최종 의사결정은 인간이 승인하는 구조
의사결정의 핵심은 데이터가 가지는 맥락이다. AI는 그 맥락을 이해할 수 있을 때 비로소 의사결정을 ‘도울 수’ 있다.

[후반부] 공지한 질문에 대한 논의

1. AI-Ready Data 시대에 대한 정의는 무엇인가?

AI/에이전트가 맥락을 이해·추론·설명할 수 있도록 데이터에 의미(개념·관계·규칙)와 메타데이터가 붙어 구조화된 상태.
기계가 데이터를 해석하고 처리할 수 있도록 표현해야 AI가 데이터를 효과적으로 활용 가능
앤드류 응(Andrew Ng) 교수도 'AI-ready Data'라는 용어를 사용하며 AI 에이전트가 활용할 수 있는 지식 그래프 체계화를 강조
핵심 수단으로는 온톨로지(개념·관계 모델), 문서 컨텍스트화(청킹·출처·주제 태깅) 가 존재.
온톨로지 중심 관점: "AI가 읽기 좋은 데이터 = 온톨로지로 모델링된 데이터."
컨텍스트 엔지니어링 관점: 검색·평가가 쉬운 형태(예: Markdown 정리, 표 분해, 청킹+메타데이터)로 만들면 LLM 활용성이 급상승.
수렴된 의견 : 두 접근 모두 '기계가 맥락을 복원할 수 있게 표현한다' 는 데서 공통점을 가짐
→ 온톨로지 ↔ 문서 컨텍스트화는 경쟁이 아니라 보완.

2. 데이터 레이크/웨어하우스의 역할과 한계는 어디까지인가?

데이터 레이크/웨어하우스는 방대한 데이터 저장에는 효과적이나, 활용 측면에서 한계가 존재
메타데이터 관리의 어려움 - 자동화 툴이 있어도 결국 사람이 확인하고 관리해야 함
테이블 간 관계나 컬럼에 대한 해석 등이 부족하면 의미 있는 분석이 어려움
AI 에이전트가 효과적으로 데이터를 활용하기 위해서는 추가적인 준비가 필요
메타데이터·연결성·설명이 빈약하면 의사결정 입력으로 쓰기 어려움.
→ 시맨틱스(용어 정리/설명), 관계 정의, 업무 맥락 메타데이터가 필수.

3. AI의 의사결정은 어디까지 신뢰할 수 있는가?

AI는 "놀랍게 똑똑하거나 정말 놀랍게 멍청할 수 있음" - 결과의 일관성 부족
참가자들은 대체로 AI 의사결정을 완전히 신뢰하지 않음, 특히 도메인 크리티컬 영역에서
일부 사람들은 AI 결과를 과신하는 경향이 있음 - "GPT가 그러던데요" [
AI는 신뢰의 대상이라기보다 선택지를 빠르게 제공하는 효용 측면에서 가치가 있음
모든 AI 결과물은 사람이 검수해야 하는 단계가 필요

4. 조직 내 온톨로지 도입은 기술 문제인가, 조직 문화 문제인가?

온톨로지 도입의 어려움은 기술보다 조직문화에 더 크게 의존
“왜 내가 바꿔야 하나?”를 해소할 직무 효용(시간↓, 오류↓, 성과↑) 가시화가 관건.
현업 부서의 협조와 데이터 준비 의지가 부족하면 아무리 좋은 기술도 효과를 발휘하기 어려움 [
사용자들이 실질적인 필요성을 느끼고 베네핏을 인식할 때 변화가 일어남
특히 AI 도입이 인력 감축으로 이어질 수 있는 부서에서는 저항이 더 큼]
기술은 준비되어 있으나 진행이 안 된다면, 그 원인은 기술 자체가 아닌 사람과 문화적 측면에서 찾아야 함

결론

데이터 레이크와 데이터 웨어하우스는 데이터를 저장하고 조회하는 데 최적화된 기술이다.
그러나 AI가 의사결정을 하기 위해 필요한 것은 '데이터'가 아니라 '데이터의 의미(맥락)' 이다.
레이크/웨어하우스는 값(데이터) 은 제공하지만 (무엇이 있는지 알려준다)
왜 그 값이 중요한지(맥락·관계·규칙) 는 제공하지 않는다.
AI는 예측을 하기에는 뛰어나지만, 의사결정을 하려면 반드시 '맥락(Context)'과 '근거(Reason)'가 필요하다.
AI-Ready Data는 AI가 데이터를 단순히 읽는 것을 넘어 '이해하고, 연결하고, 이유를 설명할 수 있게 만든 데이터 상태'를 의미한다.
즉, 값(Value) 이 아니라 의미(Meaning) 를 중심으로 데이터가 구조화된 상태이다. (무엇을 의미하는지 알려준다)
AI가 의사결정 주체로 동작하기 위해서는 데이터가 관계, 목적, 규칙, 역할이 명시된 형태로 재조직되어야 한다.
온톨로지는 이런 기반을 제공하여 AI가 신뢰 가능한 결정을 하게 만드는 역할을 수행할 수 있다.
Next...
온톨로지 기반의 운영 체제에 대해 추가 참가자들과 함께 후속 논의 진행 예정
👍