본문 바로가기
반응형

머신러닝2

[Statistics with Python] 03. Stratified K-fold, cross_val_score, GridSearchCV (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (2) 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 저번 포스팅에서는 Cross-validation중에서 K-fold에 대한 개념과 구현 과정을 살펴보았다. 이번 포스팅에서는 K-fold를 구현하는데 좀 더 효율적인 방법을 지원해주는 라이브러리들을 살펴볼 것이다. Stratified K-fold 교차 검증 - Stratified K-fold 란? K fold는 random으로 데이터 셋을 split 해주는데, 이 때문에 레이블 값의 분포(비율)가 기존 데이터 full 셋에서의 분포(비율)와 크게 달라질 수도 있다. Stratified K-fold 교차 검증 방법은 원.. 2019. 8. 15.
[Statistics with Python] 02. 교차검증 Cross validation, K-fold (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (1) - K-fold 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. Model을 선택하는데 있어 필요한 개념이 있는데, 바로 Cross-validation인 교차검증이다. 오늘의 포스팅에서는 Cross-validation(교차검증) 중에서도 K-fold 교차검증을 구현하는 방법에 대해서 자세히 살펴볼 예정이다. - Cross-validation(교차검증)이란? 교차검증이란 일반화 성능을 측정하기 위해 데이터를 여러번 반복해서 나누어 여러 모델을 학습하는 과정을 뜻한다. 대표적으로 KFold 교차검증이 존재한다. - K-fold 교차검증 데이터를 폴드라 부르는 비슷한 .. 2019. 8. 14.
반응형