본문 바로가기
반응형

Data Analysis/Basic statistics19

[기초통계] 고유값, 고유벡터 개념 정리 - 고유값(Eigen Value), 고유벡터(Eigen Vector) 선형대수학에서 가장 중요한 개념중의 하나인 고유값과 고유벡터에 대해 알아보도록 하자. 이는 추후 차원 축소 기법인 PCA나 SVD같은 기법을 배우는데 기초가 된다! - 고유값 및 고유벡터 정의 정방행렬 $A$에 대하여, 아래를 만족할 경우 $x$는 고유벡터(Eigen Vector)이고 λ는 고유값(Eigen Value)이다. (여기서 정방행렬은 행과 열의 개수가 같은 행렬을 일컫는다.) - $Ax$ = λ$x$ - 아래와 같이 $A$는 $x$를 선형변환한다. 좀 더 쉽게 설명해보자. 위 그래프를 살펴보면 파란색 화살표에 대해서 임의의 값(λ) 값을 곱해도, 회색 화살표처럼 방향은 같은 것을 볼 수 있다. 이러한 벡터를 고유벡터라 칭한다.. 2020. 2. 26.
[기초통계] 확률(Probability) vs 우도(가능도,Likelihood) 통계 공부를 하다보면 확률과 우도(가능도)에 대한 개념이 헷갈릴 때가 있다. 함께 정리하며 같이 개념을 바로잡아보자. - 확률(Probability) 확률은 관측값 또는 관측 구간이 주어진 확률분포 안에서 얼마만큼 나타날 수 있는가에 대한 값이다. 앞 설명에서 중요한 포인트가 있다. 바로 '주어진 확률분포'가 있다는 뜻이다. 확률이란 주어진 확률 분포를 고정시켜 놓은 뒤, 관측치 또는 구간이 포함될 수치를 표현한 것이라 할 수 있다. - 확률의 비교가 가능할까? 이산형 확률변수를 통해 확률을 구할 때에는 각 관측치(확률변수)에 대응되는 확률값이 있기 때문에, 특정한 관측치에 관해 확률값을 구할 수 있다. 따라서 특정 관측치가 일어날 확률을 구하고 그들끼리 비교하는 것이 어렵지 않다. 그렇다면 연속형 확률.. 2019. 10. 10.
[기초통계] 회귀분석(다중공선성) 회귀분석을 하다보면 다중공선성이라는 이슈가 자주 발생될 때가 있다. 이번 포스팅에서는 다중공선성이 무엇인지, 그 판단법과 해결법에는 무엇이 있는지 파악해보기로 하자. - 다중공선성 다중공선성(multicollinearity)이란 독립변수(설명변수)들간의 강한 상관관계를 뜻한다. 여기서 우리는 독립변수라는 말에 주목해보자. 회귀분석은 설명변수(독립변수)와 종속변수 사이의 관계를 파악하기 위해 실행하는 분석이다. 여기서 흔히 설명변수를 독립변수라고 일컫는데에는 이유가 있다. 바로 회귀분석의 전제 조건에 '설명변수들은 서로 독립적이다'라는 조건이 있기 때문이다. 설명변수들이 서로 독립적이라는 가정이 성립되어야, 회귀계수의 추정이 보다 더 정확해진다. 이러한 이유 때문에 회귀분석에서의 설명변수는 독립변수라고도 .. 2019. 10. 4.
[기초통계] 회귀분석(회귀 계수의 유의성 검정) 이전 포스팅에선 회귀식의 유의성(적합성)을 검정하였다면, 이제는 회귀식 내에 존재하는 회귀계수가 유의한지에 대해 파악해보아야 한다. [기초통계] 회귀분석(적합도 검정, 결정계수) 앞 포스팅에서 회귀분석의 회귀식을 도출하는 방법을 살펴보았다. 2019/09/17 - [Data Analysis/Basic statistics] - [기초통계] 회귀분석(단순회귀분석, 잔차, 최소제곱법) [기초통계] 회귀분석(단순회귀분석, 잔.. dlearner.tistory.com [ 회귀식의 유의성 검정에 관한 이전 포스팅 ] - 회귀계수 ($\hat{\beta_0}, \hat{\beta_1}$)의 유의성 검정 회귀식 $\hat{Y} = \hat{\beta_0}+\hat{\beta_1}X_1$에서 $\hat{\beta_0}$.. 2019. 9. 28.
반응형