데이터리차드11d선형 회귀(Linear Regression)를 이해하는 데 필요한 개념들•회귀 계수(coefficient)•절편(intercept)•잔차(Residuals)•다중공선성(Multicollinearity)•이상치(Outliers)•잔차 제곱합 (Sum of Squared Errors)ReactionCommentShare
데이터리차드12d머신러닝, 무엇부터 배워야 하나요?•선형 회귀 (Ordinary Least Squares)•로지스틱 회귀(Logistic Regression)•의사결정나무(Decision Tree)•랜덤 포레스트 (Random Forest)•k-최근접 이웃(KNN)•서포트 벡터 머신(SVM)•나이브 베이즈(Naive Bayes)ReactionCommentShare
데이터리차드13d최근 채용 공고를 통해 분석한 데이터 분석가의 주요 업무•비즈니스 도메인 별 개선/고도화를 위한 지표 정의•AB 테스트와 같은 통계적 기법으로 가설 설정 및 검증•SQL/Python과 같은 프로그래밍 언어로 데이터 추출 및 가공•데이터 시각화를 활용한 대시보드 구축 / 모니터링•분석 결과 전달 및 발표를 위한 커뮤니케이션ReactionCommentShare
데이터리차드14d데이터 분석에서 가장 많이 사용하는파이썬 라이브러리 Top7•Pandas: 데이터 프레임을 통한 데이터 조작 및 분석•Numpy: 다차원 배열 및 행렬 생성 및 연산•Matplotlib: 데이터 시각화, 그래프 및 차트 생성•Scikit-learn: 머신러닝 모델 및 평가 알고리즘 제공•TensorFlow: 딥러닝 및 머신러닝 모델 구축•BeautifulSoup: 웹 스크래핑 용도의 HTML 및 XML 파싱•Requests: 웹 상호작용을 위한 API를 위한 처리ReactionCommentShare
데이터리차드23d최근에 등장한 OpenAI의Task 기능과 Operator 에이전트를 보면서 느낀점은앞으로 셀수 없이 많은 자동화들이 등장하겠지만사람을 완벽하게 대체하는 자동화는존재하지 않겠다는 생각이였어요.아무리 고도화된 자동화가 등장하더라도사람의 작동 원리를 모방하는 자동화만 있을 뿐입니다.따라서 사람을 깊이 공부하면,자동화의 효율성은 자연스럽게 따라올 거에요.ReactionCommentShare
데이터리차드25d데이터 사이언티스트가 일상에서 가장 시간을 많이 사용하는 순서입니다.•데이터 전처리 및 정제하기 60%•데이터 수집하기 19%•데이터 패턴 분석하기 9%•기타 5%•알고리즘 및 파인튜닝하기 4%•모델을 위한 훈련 데이터 만들기 3%Garbage In, Garbage Out쓰레기를 넣으면 쓰레기가 나옵니다.모든 훌륭한 모델은 훌륭한 데이터로부터 시작합니다.ReactionCommentShare