본문 바로가기
Data Analysis/Basic statistics

[기초통계] 표준편차 vs 표준오차

by Dlearner 2019. 9. 10.
반응형

 

- 표준편차

표준편차(standard deviation)는 표본평균($\bar{x}$)으로부터 표본들의 흩어져 있는 산포를 나타내기 위해, 분산을 먼저 구한 뒤 다시 제곱근을 취한 값이다. 모평균을 알 수 없으므로 표본평균으로 모평균을 추정하며, 표본의 분포를 확인하고자 표준편차를 구한다.

 

즉 표준편차를 구하는 이유는, 모평균을 추정하기 위해 표본을 추출하여 평균을 구하고 그 평균에 대한 특성을 나타내기 위해 표준편차를 구하는 것이다. 표준편차를 구하는 식은 아래와 같다.

 

 

$ S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2} $

 

 

 

 

- 표준오차

표준오차(standard error)는 모평균을 추정하는 표본평균의 산포도, 즉 표본평균의 표준편차를 나타낸다. 여기서 표본평균의 산포가 있다는 말은, 표본평균들이 여러개이고 그들간의 산포를 표현한다는 말이다. 단순히 1개의 표본평균보다 2개 이상의 표본평균을 통해 모수를 추정하는 것이 정확한 추정에 도움이 될 것이다.

 

표준오차는 평균들 간의 분포를 나타내므로 표준오차가 줄어들수록 평균을 나타내는 점들이 집중적으로 모여있음을 뜻하며, 이는 곧 모수의 추정이 정확하게 이루어졌음을 판단하는 기준이 될 수 있다. 표준오차를 구하는 식은 아래와 같다.

 

 

모분산을 아는 경우 :  $ S.E = \frac{\sigma }{\sqrt{n}} $

 

모분산을 모르는 경우 : $ S.E = \frac{s}{\sqrt{n}} $

 

 

+ 그렇지만, 현실에서는 모집단에서의 표본추출은 한 번 시행하는 것이 일반적이다. 따라서 표본평균도 한 개의 값만 존재한다. 이런 경우 '여러 개의 표본평균 간 표준편차를 구한다'는 개념을 가진 표준오차를 구한다는 데에 갸우뚱할 수있는 부분이 존재한다. 그럼에도 불구하고 '이론적으로'는 한 개의 표본평균으로도 표준오차를 계산할 수는 있다는 것을 알아두자.

 

 

 

반응형

댓글