Thief of Wealth
머신러닝 요약집
개발/ML+ Data Science 2019. 7. 28. 21:49

https://machinelearningmastery.com/start-here/

최신 머신러닝 논문 보기
개발/ML+ Data Science 2019. 7. 28. 20:52

https://paperswithcode.com

Ensemble(앙상블) 학습이란? (필사) feat. 랜덤포레스트,XGBoost, LightGBM
개발/ML+ Data Science 2019. 7. 26. 13:25

(파이썬 머신러닝 완벽가이드 발췌) - 개요앙상블 학습을 통한 분류는 여러개의 분류기를 생성하고 그 예측을 결합함으로써 보다 정확한 최종예측을 도출하는 기법을 말합니다.어려운 문제의 결론을 내기위해 여러명의 전문가로 위원회를 구성해 다양한 의견을 수렴하고 결정하듯이 앙상블 학습의 목표는 다양한 분류기의 예측결과를 결합함으로써,단일 분류기보다 신뢰성이 높은 예측값을 얻는 것입니다. 이미지, 영상, 음성 등의 비정형 데이터의 분류는 딥러닝이 뛰어난 성능을 보이고 있지만, 대부분의 정형데이터 분류시에는 앙상블이 뛰어난 성능을 나타내고 있습니다.앙상블 알고리즘의 대표격인 랜덤포레스트와 그래디언트 앙상블이 뛰어난 성능을 나타내고 있습니다.앙상블 알고리즘의 대표적인 랜덤포레스트와 그래디언트 부스팅 알고리즘은 뛰어난..

DecisionTree (결정트리)란? (필사)
개발/ML+ Data Science 2019. 7. 26. 11:48

(파이썬 머신러닝 완벽가이드 발췌) 결정 트리는 머신러닝 알고리즘 중 직관적으로 이해하기 쉬운 알고리즘입니다.데이터에 있는 규칙을 학습을 통해 자동으로 찾아내 트리 기반의 분류 규칙을 만드는 것입니다. 일반적으로 규칙을 가장 쉽게 표혀나는 방법은 if/else 기반으로 나타내는 것인데, 쉽게 생각하면 스무고개 게임과 유사하면, 룰 기반의 프로그램에 적용되는 if, else 를 자동으로 찾아내 예측을 위한 규칙을 만드는 알고리즘으로 이해하면 더 쉽게 다가올 것입니다. 따라서 데이터의 어떤 기준으로 바탕으로 규칙을 만들어야 가장 효율적인 분류가 될 것인가가 알고리즘의 성능을 크게 좌우합니다. 규칙노드로 표시된 노드는 규칙조건이 되는 것이고, 리프노드로 표시된 노드는 결정된 클래스 값입니다.그리고 새로운 규칙..

KFold 교차검증과 Stratified KFold 차이점.
개발/ML+ Data Science 2019. 7. 26. 10:58

학습셋을 K번마다 K개의 셋으로 나눠서 train 및 validation과정을 거치는 것을 KFold 교차검증이라고 한다. 하지만, 이 경우에는 train, validation 셋을 나누는 과정이 랜덤하게 나눠지므로 데이터가 imbalance한 경우에는 train, validation셋의 label의 비율이 어긋나게된다. 극단적으로 training set이 참인 label이 1000개 거짓인 label이 10개있다고 치자. 그럼 확률적으로 나누는 KFold를 사용한다면, K등분했을때 거짓인 label이 validation 셋에 1개도 없을 수 있다. 그러면 당연히 제대로된 검증이 되지 않으므로 Stratified Kfold를 사용한다. 번역하면 계층화된 KFold라는 뜻이다. Straitified KFo..

Mac에서 Graphviz 설치?
개발/ML+ Data Science 2019. 7. 23. 20:17

원래는 다운받고 환경변수 일일이 설정해주고 해야하는데 , 리눅스나 맥유저는 여간 귀찮은게 아닐 수 없다. 아래 3가지 명령어만 수행하자. pip install graphvizconda install graphvizbrew install graphviz

Kaggle API사용하기
개발/ML+ Data Science 2019. 7. 18. 21:27

https://paiai.tistory.com/30 참고 Jupyter Notebook 에서 Kaggle API 설치하고 사용하기 공식 문서 링크 : Official Kaggle APIKaggle 링크 : https://www.kaggle.com/ 1. 준비사항kaggle 사이트에 접속해서 Profile > account tab > Create API Token => kaggle.json 파일 다운로드 Account 탭을 클릭한 후 하단에 Create API Token 버튼을 클릭하면 kaggle.json 파일이 다운로드된다. 2. Jupyter Notebook 실행Kaggle API 설치!pip install kaggleCollecting kaggle Downloading kaggle-1.0.5.tar..

데이터 별 plot 그리는 법
개발/ML+ Data Science 2019. 7. 17. 19:54

numerical 하면 histogram categorical 하면 barplot numerical 끼리는 scatter 등등

profile on loading

Loading...