본문 바로가기
반응형

교차검증3

[기초통계] 연관성 분석, 교차분석(교차표, 적합도검정, 독립성검정) 지난 포스팅에서는 연관성 분석에서 상관분석에 대해 알아보았다. 이번 포스팅에서는 연관성 분석 중 교차분석에 대해 알아보려 한다. - 교차분석 저번 포스팅에서 정리했던 연관성 분석에 관한 표를 다시 가져와보았다. 교차분석은 아래의 표에서 정리한 연관성 분석의 종류 중 하나이다. 구분 척도 분석 방법 기타 변수의 개입 여부 상관분석 등간척도 비율척도 편상관분석 O 피어슨 상관분석 X 서열척도 스피어만 서열 상관분석 - 교차분석 명목척도 교차분석 - 교차분석(cross-tabulation analysis)은 '범주형'으로 구성된 자료들 간의 연관관계를 확인하기 위해 교차표를 만들어 관계를 확인하는 분석 방법을 말한다. 이 방법에서는 변수들의 빈도를 이용하여 연관성을 파악하는데, 이 때 검정통계량으로 카이제곱(.. 2019. 9. 15.
[Statistics with Python] 03. Stratified K-fold, cross_val_score, GridSearchCV (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (2) 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 저번 포스팅에서는 Cross-validation중에서 K-fold에 대한 개념과 구현 과정을 살펴보았다. 이번 포스팅에서는 K-fold를 구현하는데 좀 더 효율적인 방법을 지원해주는 라이브러리들을 살펴볼 것이다. Stratified K-fold 교차 검증 - Stratified K-fold 란? K fold는 random으로 데이터 셋을 split 해주는데, 이 때문에 레이블 값의 분포(비율)가 기존 데이터 full 셋에서의 분포(비율)와 크게 달라질 수도 있다. Stratified K-fold 교차 검증 방법은 원.. 2019. 8. 15.
[Statistics with Python] 02. 교차검증 Cross validation, K-fold (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (1) - K-fold 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. Model을 선택하는데 있어 필요한 개념이 있는데, 바로 Cross-validation인 교차검증이다. 오늘의 포스팅에서는 Cross-validation(교차검증) 중에서도 K-fold 교차검증을 구현하는 방법에 대해서 자세히 살펴볼 예정이다. - Cross-validation(교차검증)이란? 교차검증이란 일반화 성능을 측정하기 위해 데이터를 여러번 반복해서 나누어 여러 모델을 학습하는 과정을 뜻한다. 대표적으로 KFold 교차검증이 존재한다. - K-fold 교차검증 데이터를 폴드라 부르는 비슷한 .. 2019. 8. 14.
반응형