Home
datarichard 학습 커뮤니티
커뮤니티
자유로운 질문방
Subscribe

자유로운 질문방

자유롭게 궁금한 내용을 물어보세요.
Publish now
Loading...
데이터리차드
선형 회귀(Linear Regression)를 이해하는 데 필요한 개념들
회귀 계수(coefficient)
절편(intercept)
잔차(Residuals)
다중공선성(Multicollinearity)
이상치(Outliers)
잔차 제곱합 (Sum of Squared Errors)
Reaction
Comment
Share
데이터리차드
머신러닝, 무엇부터 배워야 하나요?
선형 회귀 (Ordinary Least Squares)
로지스틱 회귀(Logistic Regression)
의사결정나무(Decision Tree)
랜덤 포레스트 (Random Forest)
k-최근접 이웃(KNN)
서포트 벡터 머신(SVM)
나이브 베이즈(Naive Bayes)
Reaction
Comment
Share
데이터리차드
최근 채용 공고를 통해 분석한 데이터 분석가의 주요 업무
비즈니스 도메인 별 개선/고도화를 위한 지표 정의
AB 테스트와 같은 통계적 기법으로 가설 설정 및 검증
SQL/Python과 같은 프로그래밍 언어로 데이터 추출 및 가공
데이터 시각화를 활용한 대시보드 구축 / 모니터링
분석 결과 전달 및 발표를 위한 커뮤니케이션
Reaction
Comment
Share
데이터리차드
데이터 분석에서 가장 많이 사용하는
파이썬 라이브러리 Top7
Pandas: 데이터 프레임을 통한 데이터 조작 및 분석
Numpy: 다차원 배열 및 행렬 생성 및 연산
Matplotlib: 데이터 시각화, 그래프 및 차트 생성
Scikit-learn: 머신러닝 모델 및 평가 알고리즘 제공
TensorFlow: 딥러닝 및 머신러닝 모델 구축
BeautifulSoup: 웹 스크래핑 용도의 HTML 및 XML 파싱
Requests: 웹 상호작용을 위한 API를 위한 처리
Reaction
Comment
Share
데이터리차드
최근에 등장한 OpenAI의
Task 기능과 Operator 에이전트를 보면서 느낀점은
앞으로 셀수 없이 많은 자동화들이 등장하겠지만
사람을 완벽하게 대체하는 자동화는
존재하지 않겠다는 생각이였어요.
아무리 고도화된 자동화가 등장하더라도
사람의 작동 원리를 모방하는 자동화만 있을 뿐입니다.
따라서 사람을 깊이 공부하면,
자동화의 효율성은 자연스럽게 따라올 거에요.
Reaction
Comment
Share
데이터리차드
데이터 사이언티스트가 일상에서 가장 시간을 많이 사용하는 순서입니다.
데이터 전처리 및 정제하기 60%
데이터 수집하기 19%
데이터 패턴 분석하기 9%
기타 5%
알고리즘 및 파인튜닝하기 4%
모델을 위한 훈련 데이터 만들기 3%
Garbage In, Garbage Out
쓰레기를 넣으면 쓰레기가 나옵니다.
모든 훌륭한 모델은 훌륭한 데이터로부터 시작합니다.
Reaction
Comment
Share
가을 청록 목소리
ㄴㅁㅇㄴㅁㅇㅁㄴㅇㅁㄴ
ㄴㅁㅇㅁㄴㅇ!!
👍
1 Reaction
Reaction
Comment
Share
데이터리차드
궁금한 점이 있다면 언제든 편하게 알려주세요!
Reaction
Comment
Share
Share
데이터리차드
최근에 등장한 OpenAI의
Task 기능과 Operator 에이전트를 보면서 느낀점은
앞으로 셀수 없이 많은 자동화들이 등장하겠지만
사람을 완벽하게 대체하는 자동화는
존재하지 않겠다는 생각이였어요.
아무리 고도화된 자동화가 등장하더라도
사람의 작동 원리를 모방하는 자동화만 있을 뿐입니다.
따라서 사람을 깊이 공부하면,
자동화의 효율성은 자연스럽게 따라올 거에요.
👍