Subscribe
SCD, Slowly Changing Dimension은 무엇일까?
데이터리차드
이 글은 데이터 블로그 챌린지의 8번째 공식 블로그 포스트입니다.
SCD (Slowly Changing Dimension) 은 데이터 모델링에서 사용되는 기법 중 하나입니다. 데이터를 저장하는 방식인 스타 스키마( Start Schema) 에서 데이터 테이블을 상황에 맞게 변경하는 방법론 중 하나인데요.
원문에는 굉장히 여러운 단어들로 이루어져 있어 어렵게 느껴질수 있지만 사실 알고나면 생각보다 간단하고 편리한 데이터 저장 방식입니다.
요약
SCD는 단계에 따라서 총 0에서 3단계로 나누어지는데요. 데이터 웨어하우스의 대부인 랄프 킴볼의 The Data Warehouse toolkit에 따르면 상황과 조건에 따라 테이블은 Type 0, Type 1, Type 2, Type 3 으로 나누어질수 있습니다.
아래 그림을 참고하여 어떻게 Type이 바뀌면서 데이터 저장 형태가 바뀌는지 쉽게 이해할수 있습니다. Type0에서 Type3로 갈수록 더욱 효율적인 저장과 분석이 가능해지는 형태이기 때문에 데이터 모델링을 할때 자주 적용되는 기법중 하나입니다.
인사이트
KISS (Keep it simple, stupid) 법칙은 데이터 모델링을 위한 가장 적합한 용어입니다.
간단하고 때로는 반복적인 방법이 가장 효율적인 방법이 될수 있습니다. 마치 우리 인생처럼 말이죠 🙂
블로그 링크:
데이터리차드 #데블챌 #데이터블로그챌린지
SquareLabs
스퀘어랩스에 오신걸 환영합니다.
Subscribe
👍
Next
Made with SlashPage