Thief of Wealth
분류분석과 예측분석
개발/ML+ Data Science 2020. 2. 14. 17:09

분류분석과 예측분석 분류분석이란, 데이터가 어떤 그룹에 속하는지 예측하는데 사용되는 기법이다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있다. supervised learning에 해당하는 예측기법이다. 예측분석이란, 시계열분석처럼 시간에 다른 값 두 개만을 이용해 앞으로의 매출 또는 온도 등을 예측하는 것이다. 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다른다. 여러개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면 된다. 두 가지의 공통점과 차이점은 공통점: 레코드의 특정 속성의 값을 미리 알아맞히는 점이다. 차이점: 분류분석은 레코드의 범주형 속성의 값을 알아맞히는 것이고, 예측분석은 연속형 속성의 값을 알아맞히는 것이다.

데이터마이닝 이란?
개발/ML+ Data Science 2020. 2. 13. 20:45

데이터 마이닝 이란? 데이터 마이닝은 대용량 데이터에서 의미있는패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. 통계분석과의 차이점? 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법을 통칭한다. 데이터 마이닝 분석방법 지도학습 비지도학습 Decision Tree ANN (인공신경망) GLM (일반화 선형 모형) 회귀분석 로지스틱 회귀분석 사례기반 추론 최근접 이웃법 OLAP (Online Analytical Processing) 연관성 규칙 발견 군집분석 SOM (Self Organizeing Map) 데이터 마이닝 추진단계 1) 목적설정 : 데이터마이닝을 통해 무엇을 왜 하는지 명확한 ..

다차원 척도법이란?
개발/ML+ Data Science 2020. 2. 12. 12:36

다차원 척도법이란? - 객체간 근접성(Proximity)를 시각화하는 통계기법이다. - 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다. - 개체들을 2차원 또는 3차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다. 다차원 척도법 목적 - 데이터 속에 잠재해 있는 패턴, 구조를 찾아내기 - 찾아낸 패턴과 구조를 소수 차원의 공간에 기하학적으로 표현하기 - 데이터 축소를 목적 ( 데이터애 포함되는 정보를 끄집어내기 위해서 ) 다차원 척도법 방법 - 개체들의 거리계산에는 유클리드 거리행렬을 활용 - 관측대상들의 상대적 거리의 정확도를 높이기 위해 적합 정도를 스트레스 값(..

잔차분석이란?
개발/ML+ Data Science 2020. 2. 12. 09:18

잔차분석 또는 회귀진단이라함은 회귀모형에 대한 가정들(정규성, 등분산성, 독립성)의 충족여부에 대한 검토와 이상값의 개입여부에 대한 검토절차를 말합니다. 이것을 잔차분석이라고 하는 이뉴는 이러한 절차가 잔차(Residual) 통계량을 이용하여 실시되기 때문입니다. * 잔차(Residual) 이란? : 실제 관측치와 추정회귀선에 의한 추정값의 차이로서 회귀추정식으로 설명될 수 없는 부분을 말한다. ( 잔차 == 오차error의 실현치 ) 출처: https://m.blog.naver.com/PostView.nhn?blogId=gusals1981&logNo=20017838767&proxyReferer=https%3A%2F%2Fwww.google.com%2F

주성분 분석이란?
개발/ML+ Data Science 2020. 2. 11. 17:44

주성분 분석 (PCA) : 여러 변수들의 변량을 주성분이라는 서로 상관성이 높은 변수들의 선형 결합으로 만들어 기존의 상관성이 높은 변수들을 요약, 축소하는 기법이다. : 첫 번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록 하고, 두 번째 주성분으로는 첫 번째 주성분과는 상관성이 낮아서 첫 번째 주성분이 설명하지 못하는 나머지 변동을 정보의 손실없이 가장 많이 설명할 수 있도록 변수들의 선형조합을 만든다. 주성분 분석의 목적 : 여러 변수들 간에 내재하는 상관관계, 연관성을 이용해 소수의 주성분으로 차원을 축소함으로써 데이터를 이해하기 쉽고 관리하기 쉽게 해준다. : 다중 공산성이 존재하는 경우, 상관성이 적은 주성분으로 변수들을 축소하여 모형 개발에 활용한다. (회귀분석이나 의사결정나무 등의 ..

article thumbnail
경영 빅데이터 분석사 자격증에 대하여

경영 빅데이터 분석가란? 빅데이터 경영 업무에 필요한 이론과 실무능력을 검증하는 자격시험제도 입니다. 본 목적은 빅데이터 분석 전문가를 양성하려는데에 있으며, 빅데이터 분석 전문가란 빅데이터 이해 및 처리 기술에 대한 기본지식을 바탕으로 분석 기획, 빅데이터 분석, 빅데이터 시각화 업무를 수행하고 이를 통해 프로세스 혁신 및 마케팅 전략 등에 대해 과학적인 의사결정을 지원하는 직무를 하는 것을 말합니다. 경영 빅데이터 분석가 자격증은 왜 필요한가? 다른 빅데이터 관련 자격증의 목적과 같이 폭증하는 데이터가 경제적 자신이 되고 가치창출의 원천이 되는 4차 산업혁명의 시대에 도달했습니다. 다양한 기업들은 치열한 경쟁환경에서 영향력이 강해진 고객을 만족시키기 위해서 고객의 행동 맥락, 감정 상태까지 파악하고 ..

profile on loading

Loading...