Thief of Wealth

다차원 척도법이란?

 

- 객체간 근접성(Proximity)를 시각화하는 통계기법이다.

- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다.

- 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다.

 

 

다차원 척도법 목적

 

- 데이터 속에 잠재해 있는 패턴, 구조를 찾아내기

- 찾아낸 패턴과 구조를 소수 차원의 공간에 기하학적으로 표현하기

- 데이터 축소를 목적 ( 데이터애 포함되는 정보를 끄집어내기 위해서 )

 

다차원 척도법 방법

 

- 개체들의 거리계산에는 유클리드 거리행렬을 활용

- 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값(Stress Value)으로 나타냄.

- 각 개체들을 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS나 S-STRESS를 사용.

- 최적모형의 적합은 부적합도를 최소로 하는 반복알고리즘을 이용, 이 값이 일정 수준 이하가 될 때 최종적으로 적합된 모형으로 제시. (즉, 스트레스값이 가장적은것이 최적모형)

 

- STRESS값 기준 판단

 

0 : 완벽

~0.05 : 매우 좋은

0.05~0.10 : 만족

0.10~0.15 : 보통

0.15~ : 나쁨

 

다차원 척도법 종류

 

1) 계량적 MDS (Metric MDS)

: 데이터가 구간척도나 비율적도인 경우 활용. (전통적인 다차원 척도법)

 

N개의 케이스에 대해 p개의 특성변수가 있는경우, 각 개체들간의 유클리드 거리행렬을 계산하고 개체들간의 비유사성(S) 를 공간상에 표현한다.

 

 

2) 비계량적 MDS (Nonmetric MDS)

: 데이터가 순서척도인 경우 활용한다. 

개체들간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같돌고 변환하여 거리를 생성한 후 적용한다.

'개발 > ML+ Data Science' 카테고리의 다른 글

데이터마이닝 이란?  (0) 2020.02.13
R 설치하는법  (0) 2020.02.12
최적회귀방정식에 대하여  (0) 2020.02.12
잔차분석이란?  (0) 2020.02.12
주성분 분석이란?  (0) 2020.02.11
profile on loading

Loading...