Thief of Wealth
다차원 척도법이란?
개발/ML+ Data Science 2020. 2. 12. 12:36

다차원 척도법이란? - 객체간 근접성(Proximity)를 시각화하는 통계기법이다. - 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다. - 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다. 다차원 척도법 목적 - 데이터 속에 잠재해 있는 패턴, 구조를 찾아내기 - 찾아낸 패턴과 구조를 소수 차원의 공간에 기하학적으로 표현하기 - 데이터 축소를 목적 ( 데이터애 포함되는 정보를 끄집어내기 위해서 ) 다차원 척도법 방법 - 개체들의 거리계산에는 유클리드 거리행렬을 활용 - 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값(..

잔차분석이란?
개발/ML+ Data Science 2020. 2. 12. 09:18

잔차분석 또는 회귀진단이라함은 회귀모형에 대한 가정들(정규성, 등분산성, 독립성)의 충족여부에 대한 검토와 이상값의 개입여부에 대한 검토절차를 말합니다. 이것을 잔차분석이라고 하는 이뉴는 이러한 절차가 잔차(Residual) 통계량을 이용하여 실시되기 때문입니다. * 잔차(Residual) 이란? : 실제 관측치와 추정회귀선에 의한 추정값의 차이로서 회귀추정식으로 설명될 수 없는 부분을 말한다. ( 잔차 == 오차error의 실현치 ) 출처: https://m.blog.naver.com/PostView.nhn?blogId=gusals1981&logNo=20017838767&proxyReferer=https%3A%2F%2Fwww.google.com%2F

기술통계란 무엇인가?
개발/ML+ Data Science 2020. 2. 6. 20:19

1. 기술통계란 무엇인가? : 자료의 특성을 표, 그림, 통계량 등을 사용하여 쉽게 파악할 수 있도록 정리/요약하는 것. : 자료를 요약하는 기초적 통계를 의미. : 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해봄으로써 데이터에 대한 대략적인 이해와 분석에 대한 통찰력을 얻기에 유리. 2. 그래프를 이용한 자료정리 1) 히스토그램 : 표로 되어있는 도수 분포를 그림으로 나타낸 것으로, 도수분포표를 그래프로 나타낸 것. 2) 막대그래프와 히스토그램의 비교 : 막대그래프는 범주형으로 구분된 데이터라서 범주의 순서를 임의로 바꿀 수 있다. 반면에 히스토그램은 연속형으로 표시된 데이터를 표현한 것으로 임의로 순서를 바꿀 수 없고 막대의 간격이 없다. 3) 줄기-잎 그림 : 데이터를 줄기와 잎의 모양..

profile on loading

Loading...