Thief of Wealth

다음은 IEEE Fraud dataset에서 V1~340으로 표시된 feature를 줄이는 예제이다.


sc = preprocessing.MinMaxScaler()

pca = PCA(n_components=2) # 2개로!

vcol_pca = pca.fit_transform( 

    sc.fit_transform( all_data[vcols].fillna(-1) ) # na값 최소값인 -1로하고 minmax! 한후에 pca!!

)


all_data['_vcol_pca0'] = vcol_pca[:, 0] # PCA로 2개가 나왔을테니 그중 1개를 피처

all_data['_vcol_pca1'] = vcol_pca[:, 1] # PCA로 2개가 나왔을테니 그중 1개를 피처

all_data['_vcol_nulls'] = all_data[vcols].isnull().sum(axis=1) # 원래 V1~340개가 가지고있던 모든 null값을 종합하여 feature로 사용!


all_data.drop(vcols, axis=1, inplace=True) # 원래있던 V1~ V340의 feature를 모두 제거!

profile on loading

Loading...