그 set에 중요한 정보가 편향되어있을 가능성이 있으므로
KFold에 shuffle옵션을 주어 테스트해보고,
그 set만학습하여 다른 set들을 예측해보는 방법으로 그 set에 얼마나 중요한 정보들이 담겨있는지 체크해본다.
'개발 > ML+ Data Science' 카테고리의 다른 글
model의 feature importance 시각화 하는 template (0) | 2019.11.10 |
---|---|
Pandas DataFrame에 dict적용하기 (0) | 2019.11.10 |
KFold Example (0) | 2019.11.06 |
Check isnan, isfinite (0) | 2019.11.06 |
꿀팁! 데이터분석할땐 python으로 힘들면 샘플을 엑셀로 다뤄보기 (0) | 2019.11.05 |