본문 바로가기
반응형

Python3

[Statistics with Python] 06. 분류 알고리즘 평가 방법 - F1-score, ROC, AUC 3절 Evaluation(평가) 방법 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 이번 포스팅에서는 저번 포스팅에 이어 분류 알고리즘을 평가 하는 다양한 방법 중 F1 score, ROC curve, AUC에 대해 알아보려 한다. 정확도(Accuracy) 오차 행렬(confusion matrix, 혼동 행렬) 정밀도(Precision)와 재현율(Recall) F1 score ROC curve와 AUC - F1 score F1 스코어는 정밀도와 재현율을 결합한 지표이다. 정밀도와 재현율이 한쪽으로 치우치지 않는 수치를 나타낼 때 상대적으로 높은 값을 지닌다. F1 스코어 계산법 F1 스코어 계산법은 아래 그림과 같다. F1 스코어 예시 1. Precision = 0.. 2019. 8. 17.
[Statistics with Python] 05. 분류 알고리즘 평가 방법 - Accuracy, precision, recall 3절 Evaluation(평가) 방법 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 저번 포스팅까지는 교차 검증에 관한 개념과 scikit learn에서 제공하는 다양한 k-fold 검증에 대해 알아보았다. 이번 포스팅에서는 "분류 알고리즘이 얼마나 정확한 예측을 하는가"에 대한 평가 방법에 대한 개념들을 알아보도록 할 것이다. (코딩은 뒤의 실습에서 자세히 다루려 한다.) 분류 알고리즘에 평가를 하는 다양한 방법이 있는데, 그 종류는 아래와 같으며 하나하나씩 짚어가며 설명해보려고 한다. 정확도(Accuracy) 오차 행렬(confusion matrix, 혼동 행렬) 정밀도(Precision)와 재현율(Recall) F1 score ROC curve와 AUC Acc.. 2019. 8. 17.
[Statistics with Python] 03. Stratified K-fold, cross_val_score, GridSearchCV (with Scikit-learn) 2절 Scikit - learn을 통한 예측 알고리즘 실습해보기 4장 Model Selection (2) 본 포스팅은 [위키북스- 파이썬 머신러닝 완벽 가이드]를 활용한 스터디 포스팅입니다. 저번 포스팅에서는 Cross-validation중에서 K-fold에 대한 개념과 구현 과정을 살펴보았다. 이번 포스팅에서는 K-fold를 구현하는데 좀 더 효율적인 방법을 지원해주는 라이브러리들을 살펴볼 것이다. Stratified K-fold 교차 검증 - Stratified K-fold 란? K fold는 random으로 데이터 셋을 split 해주는데, 이 때문에 레이블 값의 분포(비율)가 기존 데이터 full 셋에서의 분포(비율)와 크게 달라질 수도 있다. Stratified K-fold 교차 검증 방법은 원.. 2019. 8. 15.
반응형