다차원 척도법이란?
- 객체간 근접성(Proximity)를 시각화하는 통계기법이다.
- 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다.
- 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다.
다차원 척도법 목적
- 데이터 속에 잠재해 있는 패턴, 구조를 찾아내기
- 찾아낸 패턴과 구조를 소수 차원의 공간에 기하학적으로 표현하기
- 데이터 축소를 목적 ( 데이터애 포함되는 정보를 끄집어내기 위해서 )
다차원 척도법 방법
- 개체들의 거리계산에는 유클리드 거리행렬을 활용
- 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값(Stress Value)으로 나타냄.
- 각 개체들을 공간상에 표현하기 위한 방법은 부적합도 기준으로 STRESS나 S-STRESS를 사용.
- 최적모형의 적합은 부적합도를 최소로 하는 반복알고리즘을 이용, 이 값이 일정 수준 이하가 될 때 최종적으로 적합된 모형으로 제시. (즉, 스트레스값이 가장적은것이 최적모형)
- STRESS값 기준 판단
0 : 완벽
~0.05 : 매우 좋은
0.05~0.10 : 만족
0.10~0.15 : 보통
0.15~ : 나쁨
다차원 척도법 종류
1) 계량적 MDS (Metric MDS)
: 데이터가 구간척도나 비율적도인 경우 활용. (전통적인 다차원 척도법)
N개의 케이스에 대해 p개의 특성변수가 있는경우, 각 개체들간의 유클리드 거리행렬을 계산하고 개체들간의 비유사성(S) 를 공간상에 표현한다.
2) 비계량적 MDS (Nonmetric MDS)
: 데이터가 순서척도인 경우 활용한다.
개체들간의 거리가 순서로 주어진 경우에는 순서척도를 거리의 속성과 같돌고 변환하여 거리를 생성한 후 적용한다.
'개발 > ML+ Data Science' 카테고리의 다른 글
데이터마이닝 이란? (0) | 2020.02.13 |
---|---|
R 설치하는법 (0) | 2020.02.12 |
최적회귀방정식에 대하여 (0) | 2020.02.12 |
잔차분석이란? (0) | 2020.02.12 |
주성분 분석이란? (0) | 2020.02.11 |