Share
Sign In

◼️ 데이터 분석 (Data Analytics)

New
데이터와 관련한 지식과 인사이트를 기록하는 곳입니다.
DADB(Data Analyst Digital Brain) 를 소개합니다.
데이터 분석가 직무를 꿈꾸고 있나요? 꾸준히 성장하는 데이터 분석가로 성장하고 싶나요? 데이터 분석 프로젝트를 성공적으로 완료하고 싶나요? 데이터 분석에 도움이 되는 자료들을 정리하고 싶나요? 성장하는 데이터 분석가(DA)를 위한 디지털 브레인 (DB)를 소개합니다. 노션 으로 만든 DADB 는 데이터 분석가가 어떤 업무를 하는 사람(Who is DA)인지 알려줍니다. 데이터 분석에서 가장 많이 사용하는 프레임워크(Framework)들을 소개합니다. 데이터 분석에 필요한 스킬셋(Skillset)을 알려줍니다. 데이터 분석 프로세스(Process)에 대해 알려줍니다. 데이터 분석, 더 이상 디지털에서 헤메지 마세요. 데이터리차드가 데이터를 재미있고 가치있게 배울수 있도록 함께하겠습니다. PS. DADB의 예상 출시 일자는 10월 20일입니다. 사전 예약을 받고 있습니다. 아래의 폼에서 신청해주세요.
  • 데이터리차드
👎👍
2
데이터 분석가가 되기 위해 꼭 배워야 하는 TOP 5 스킬
안녕하세요. 데이터를 재미있고 가치있게 배울수 있는 교육 컨텐츠를 만드는 데이터 리차드입니다. 링크드인(LinkedIn)에는 한국 뿐만 아니라 글로벌하게 활동하는 다양한 교육 크리에이터들이 있습니다. 그중 스스로를 Data Nerd (데이터 너드) 라고 부르는 데이터 크리에이터, Luke Barousse는 데이터 분석가가 되고 싶어하는 너드들을 위해 어떤 스킬을 갖추어야 할지를 소프트웨어로 구현했습니다. 아래는 그가 만든 https://datanerd.tech/ 이라는 웹사이트로 Google Search와 SerpApi, 그리고 Streamlit으로 만들어져 있습니다. 전세계의 채용 공고에 나오는 스킬들을 API로 수집하여 직업 타이틀과 국가마다 어떤 데이터 스킬이 가장 많이 사용되는지를 직관적으로 볼수 있습니다. 현재 한국에서 데이터 분석가로 취업하기 위해서는 파이썬이 42.3%
  • 데이터리차드
👎👍
2
CRISP-DM과 데이터 마이닝
안녕하세요. 데이터를 더 재미있고 가치있게 배울수 있도록 데이터 교육 컨텐츠를 만드는 크리에이터, 데이터 리차드입니다. 데이터 마이닝(Data Mining)은 데이터 사이언스(Data Science)의 근간이 되는 개념으로 결과를 예측하기 위해 데이터 세트에서 패턴 및 상관 관계를 찾아내는 프로세스를 의미합니다. 그중 가장 보편적으로 사용하는 방법이 바로 CRISP-DM인데요. CRISP-DM 이라고 부르는 데이터 마이닝 산업 표준 프로세스(Cross-industry standard process for data mining)는 비즈니스 에너레틱 (BA) 에서 사용하는 가장 핵심적인 개념으로 비즈니스 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 및 배포 순으로 데이터 마이닝 (Data Mining)을 진행합니다. CRISP-DM 에 따르면 데이터 마이닝은 비즈니스가 가진 문제를 이해하고 문제와 관련된 데이터를 이해한뒤 데이터를 모델링에 알맞게 변형하고 준비하여 데이터가 문제를 해결할수 있도록 모델링한 뒤 마지막으로 모델이 문제를 실제로 해결하는지를 평가하고 실제로 사용하는 것 입니다.
  • 데이터리차드
👎👍
2
비즈니스 에너레틱 [1]
보편적 진리나 법칙의 발견을 목적으로 하는 체계적 지식을 과학이라고 부릅니다. 데이터 과학은 데이터를 탐구하는 학문이며 데이터를 하나의 신호로 보고 데이터의 정확도와 신뢰도를 계산합니다. 그리고 가장 이상적인 모델을 찾아내죠. 비즈니스 에너레틱(BA)은 비즈니스에 데이터 과학을 접목한 융합형 학문입니다. 어떻게 비즈니스가 가장 큰 효과를 낼수 있을까를 고민하면서 비즈니스 마인드 역시 배울수 있습니다. 현재 BA는 여러가지 가설들을 시도하고 있는데요. 그 중 자주 사용되는 기법들이 RFM, AARRR 그리고 Cohort 분석입니다.
  • 데이터리차드
👎👍
2
SCD, Slowly Changing Dimension은 무엇일까?
이 글은 데이터 블로그 챌린지의 8번째 공식 블로그 포스트입니다. SCD (Slowly Changing Dimension) 은 데이터 모델링에서 사용되는 기법 중 하나입니다. 데이터를 저장하는 방식인 스타 스키마( Start Schema) 에서 데이터 테이블을 상황에 맞게 변경하는 방법론 중 하나인데요. 원문에는 굉장히 여러운 단어들로 이루어져 있어 어렵게 느껴질수 있지만 사실 알고나면 생각보다 간단하고 편리한 데이터 저장 방식입니다. 요약 SCD는 단계에 따라서 총 0에서 3단계로 나누어지는데요. 데이터 웨어하우스의 대부인 랄프 킴볼의 The Data Warehouse toolkit에 따르면 상황과 조건에 따라 테이블은 Type 0, Type 1, Type 2, Type 3 으로 나누어질수 있습니다. 아래 그림을 참고하여 어떻게 Type이 바뀌면서 데이터 저장 형태가 바뀌는지 쉽게 이해할수 있습니다. Type0에서 Type3로 갈수록 더욱 효율적인 저장과 분석이 가능해지는 형태이기 때문에 데이터 모델링을 할때 자주 적용되는 기법중 하나입니다. 인사이트 KISS (Keep it simple, stupid) 법칙은 데이터 모델링을 위한 가장 적합한 용어입니다. 간단하고 때로는 반복적인 방법이 가장 효율적인 방법이 될수 있습니다. 마치 우리 인생처럼 말이죠 🙂 블로그 링크: https://lnkd.in/g6HMvuyV
  • 데이터리차드
Made with SlashPage