python에서는 R과 다르게 null, na, nan를 같은 "장해지지않은값"의 의미로 사용.
isnull().sum()으로 체크가능하다. isna()와 같다.
notnull()로 아예 제거해버릴 수도 있다. d = d.notnull()
dropna() 또는 fillna()로 제거하거나 채울 수 있다.
sklearn imputer도 채우기 가능하다.
'개발 > ML+ Data Science' 카테고리의 다른 글
[Plot] 전체적인 실수값 histogram을 그려주는 kdeplot 템플릿 (0) | 2019.10.05 |
---|---|
Network work dataset feature Extraction 네트워크 피처추출하는법 (0) | 2019.10.01 |
PCA로 feature 줄이기 예제! (0) | 2019.10.01 |
어떤 feature의 value_count를 그래프로 정렬해서 표현하는 template (0) | 2019.10.01 |
train set이랑 test set의 feature별 개수차이 보여주는 template (0) | 2019.10.01 |