DA

All about Data Analysis
TikaToka
데이터 전처리 간단 정리
Thanks to Kaggle Learn 데이터 분석 과제 정도의 수준이지 실전용은 아니라는 점을 참고하시면 좋겠습니다. 결측치 처리 갯수 세기 없애기 채우기 스케일링 데이터의 범위를 바꿔주는 역할 (달러와 엔의 scale이 다르면 맞춰주는 그런 용도) SVM, KNN 쓸때 주로 사용함. 정규화 데이터의 분포를 정규화 주로 정규분포를 필요로 하는 알고리즘을 쓸 때 사용 (k-Means, PCA, CNN, RNN, GAN,...)
TikaToka
Pandas 간단 정리
Thanks to Kaggle Learn. 만약에 뭔가 기억이 나지 않는다면, 두가지만 기억하자 함수 사용법을 알려주거나 어떤 함수가 있는지 알려준다. Import 데이터 만들기 csv 읽기 특정 열에 access review라는 변수에 dataframe이 담겨있고, country라는 열에 접근하려면 indexing iloc (index based) loc (label based)