https://lovit.github.io/nlp/representation/2018/09/28/tsne/
t-Stocastic Nearest Neighbor (y-SNE)는 vector visualization 을 위하여 자주 이용되는 알고리즘입니다.
t-SNE는 고차원의 벡터로 표현돠는 데이터 간의 neighbor structure를 보존하는 2차원의 ebedding vector를 학습함으로써,
고차원의 데이터를 2차원의 지도로 표현합니다.
t-SNE 는 벡터 시각화를 위한 다른 알고리즘들보다 안정적인 임베딩 학습결과를 보여줍니다.
이는 t-SNE가 데이터간 거리를 stocastic probability로 변환하여 임베딩에 이용하기 때문입니다.
그리고 이 stocastic probability는 perplexity 에 의해 조절되는데,
이 글에서는 t-SNE가 어떻게 안정적인 임베딩 학습결과를 보일 수 있는지에 대한 원리를 살펴보고, perplexity의 역할에 대해서도 알아봅니다.
'개발 > ML+ Data Science' 카테고리의 다른 글
나만의 머신러닝 메뉴얼 (0) | 2019.08.27 |
---|---|
Classifier 저장 및 불러오기 (0) | 2019.08.22 |
Oversampling하는 올바른 방법 (0) | 2019.08.21 |
Outlier 결정 및 trade off사항 (0) | 2019.08.21 |
Random Oversampling 방법 (0) | 2019.08.21 |