Subscribe
CRISP-DM과 데이터 마이닝
데이터리차드
안녕하세요.
데이터를 더 재미있고 가치있게 배울수 있도록
데이터 교육 컨텐츠를 만드는 크리에이터, 데이터 리차드입니다.
데이터 마이닝(Data Mining)은 데이터 사이언스(Data Science)의 근간이 되는 개념으로 결과를 예측하기 위해 데이터 세트에서 패턴 및 상관 관계를 찾아내는 프로세스를 의미합니다.
그중 가장 보편적으로 사용하는 방법이 바로 CRISP-DM인데요.
CRISP-DM 이라고 부르는 데이터 마이닝 산업 표준 프로세스(Cross-industry standard process for data mining)는 비즈니스 에너레틱 (BA) 에서 사용하는 가장 핵심적인 개념으로
비즈니스 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 및 배포
순으로 데이터 마이닝 (Data Mining)을 진행합니다.
CRISP-DM 에 따르면 데이터 마이닝은
1.
비즈니스가 가진 문제를 이해하고
2.
문제와 관련된 데이터를 이해한뒤
3.
데이터를 모델링에 알맞게 변형하고 준비하여
4.
데이터가 문제를 해결할수 있도록 모델링한 뒤
5.
마지막으로 모델이 문제를 실제로 해결하는지를 평가하고 실제로 사용하는 것
입니다.
데이터 마이닝은 현재 우리가 가장 주목하고 있는 AI와도 밀접한 관련이 있습니다.
현재 AI에게 우리의 직업이나 자리를 빼앗기지 않기 위해서 많은 걱정과 우려가 나타나고 있습니다.
많은 직업들이 AI에 의해 대체되는 시대에 우리 역시 AI가 어떻게 작동하는지 이해할 필요가 있습니다. AI 전문가나 박사 학위를 따지 않아도 우리는 이 과정을 이해함으로서 변화하는 시대를 대비할수 있습니다.
#데이터리차드 #데이터교육 #데이터분석
SquareLabs
스퀘어랩스에 오신걸 환영합니다.
Subscribe
👍
1
👎
1
Previous
Next