본문 바로가기
반응형

Data Analysis/Statistics with Python7

[Statistics with Python] 03. Stratified K-fold, cross_val_score, GridSearchCV (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (2) 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 저번 포스팅에서는 Cross-validation중에서 K-fold에 대한 개념과 구현 과정을 살펴보았다. 이번 포스팅에서는 K-fold를 구현하는데 좀 더 효율적인 방법을 지원해주는 라이브러리들을 살펴볼 것이다. Stratified K-fold 교차 검증 - Stratified K-fold 란? K fold는 random으로 데이터 셋을 split 해주는데, 이 때문에 레이블 값의 분포(비율)가 기존 데이터 full 셋에서의 분포(비율)와 크게 달라질 수도 있다. Stratified K-fold 교차 검증 방법은 원.. 2019. 8. 15.
[Statistics with Python] 02. 교차검증 Cross validation, K-fold (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (1) - K-fold 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. Model을 선택하는데 있어 필요한 개념이 있는데, 바로 Cross-validation인 교차검증이다. 오늘의 포스팅에서는 Cross-validation(교차검증) 중에서도 K-fold 교차검증을 구현하는 방법에 대해서 자세히 살펴볼 예정이다. - Cross-validation(교차검증)이란? 교차검증이란 일반화 성능을 측정하기 위해 데이터를 여러번 반복해서 나누어 여러 모델을 학습하는 과정을 뜻한다. 대표적으로 KFold 교차검증이 존재한다. - K-fold 교차검증 데이터를 폴드라 부르는 비슷한 .. 2019. 8. 14.
[Statistics with Python] 01. Python을 활용한 머신러닝 시작하기 Strat learning "Machine Learning with Python" 파이썬을 활용하여 머신러닝 공부를 하면서 포스팅을 시작해보기로 했다. - 학습 참고 도서 : [위키북스- 파이썬 머신러닝 완벽 가이드] 앞으로 포스팅에 참고하여 공부할 책으로 [위키북스- 파이썬 머신러닝 완벽 가이드]를 선택하였다. 일단, 데이터 분석(머신러닝)을 처음 공부하는 사람들을 위해 책 내에서 이론을 충분히 설명해주면서 소스 코드를 단계적으로 설명해주는 것이 좋았다. 머신러닝의 바이블이라고 칭해지는 [O'Reilly- Hands-on Machine Learning]과 비교하여 좀 더 개념을 이해하기 쉽게 설명해 놓았기 때문에 개인적으로는 이 책을 추천한다. 수학적인 개념을 더 알고싶다면 O'Reilly 책을 참고하.. 2019. 8. 14.
반응형