t-SNE (t-Stochastic Neighbor Embedding) 이란?

t-Stocastic Nearest Neighbor (y-SNE)는 vector visualization 을 위하여 자주 이용되는 알고리즘입니다.

t-SNE는 고차원의 벡터로 표현돠는 데이터 간의 neighbor structure를 보존하는 2차원의 ebedding vector를 학습함으로써,

고차원의 데이터를 2차원의 지도로 표현합니다.

t-SNE 는 벡터 시각화를 위한 다른 알고리즘들보다 안정적인 임베딩 학습결과를 보여줍니다.

이는 t-SNE가 데이터간 거리를 stocastic probability로 변환하여 임베딩에 이용하기 때문입니다.

그리고 이 stocastic probability는 perplexity 에 의해 조절되는데,

이 글에서는 t-SNE가 어떻게 안정적인 임베딩 학습결과를 보일 수 있는지에 대한 원리를 살펴보고, perplexity의 역할에 대해서도 알아봅니다.

티스토리툴바