Thief of Wealth

https://lovit.github.io/nlp/representation/2018/09/28/tsne/


t-Stocastic Nearest Neighbor (y-SNE)는 vector visualization 을 위하여 자주 이용되는 알고리즘입니다.

t-SNE는 고차원의 벡터로 표현돠는 데이터 간의 neighbor structure를 보존하는 2차원의 ebedding vector를 학습함으로써,

고차원의 데이터를 2차원의 지도로 표현합니다.

t-SNE 는 벡터 시각화를 위한 다른 알고리즘들보다 안정적인 임베딩 학습결과를 보여줍니다.

이는 t-SNE가 데이터간 거리를 stocastic probability로 변환하여 임베딩에 이용하기 때문입니다.

그리고 이 stocastic probability는 perplexity 에 의해 조절되는데,

이 글에서는 t-SNE가 어떻게 안정적인 임베딩 학습결과를 보일 수 있는지에 대한 원리를 살펴보고, perplexity의 역할에 대해서도 알아봅니다.



'개발 > ML+ Data Science' 카테고리의 다른 글

나만의 머신러닝 메뉴얼  (0) 2019.08.27
Classifier 저장 및 불러오기  (0) 2019.08.22
Oversampling하는 올바른 방법  (0) 2019.08.21
Outlier 결정 및 trade off사항  (0) 2019.08.21
Random Oversampling 방법  (0) 2019.08.21
profile on loading

Loading...