- 표준편차
표준편차(standard deviation)는 표본평균($\bar{x}$)으로부터 표본들의 흩어져 있는 산포를 나타내기 위해, 분산을 먼저 구한 뒤 다시 제곱근을 취한 값이다. 모평균을 알 수 없으므로 표본평균으로 모평균을 추정하며, 표본의 분포를 확인하고자 표준편차를 구한다.
즉 표준편차를 구하는 이유는, 모평균을 추정하기 위해 표본을 추출하여 평균을 구하고 그 평균에 대한 특성을 나타내기 위해 표준편차를 구하는 것이다. 표준편차를 구하는 식은 아래와 같다.
$ S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2} $
- 표준오차
표준오차(standard error)는 모평균을 추정하는 표본평균의 산포도, 즉 표본평균의 표준편차를 나타낸다. 여기서 표본평균의 산포가 있다는 말은, 표본평균들이 여러개이고 그들간의 산포를 표현한다는 말이다. 단순히 1개의 표본평균보다 2개 이상의 표본평균을 통해 모수를 추정하는 것이 정확한 추정에 도움이 될 것이다.
표준오차는 평균들 간의 분포를 나타내므로 표준오차가 줄어들수록 평균을 나타내는 점들이 집중적으로 모여있음을 뜻하며, 이는 곧 모수의 추정이 정확하게 이루어졌음을 판단하는 기준이 될 수 있다. 표준오차를 구하는 식은 아래와 같다.
모분산을 아는 경우 : $ S.E = \frac{\sigma }{\sqrt{n}} $
모분산을 모르는 경우 : $ S.E = \frac{s}{\sqrt{n}} $
+ 그렇지만, 현실에서는 모집단에서의 표본추출은 한 번 시행하는 것이 일반적이다. 따라서 표본평균도 한 개의 값만 존재한다. 이런 경우 '여러 개의 표본평균 간 표준편차를 구한다'는 개념을 가진 표준오차를 구한다는 데에 갸우뚱할 수있는 부분이 존재한다. 그럼에도 불구하고 '이론적으로'는 한 개의 표본평균으로도 표준오차를 계산할 수는 있다는 것을 알아두자.
'Data Analysis > Basic statistics' 카테고리의 다른 글
[기초통계] 분산분석(ANOVA) (0) | 2019.09.12 |
---|---|
[기초통계] 가설검정과 절차(가설,유의수준,기각역,양측검정,단측검정) (0) | 2019.09.11 |
[기초통계] 기술통계 vs 추론통계, 점추정 vs 구간추정, 신뢰수준, 신뢰구간 (0) | 2019.09.08 |
[기초통계] 확률분포, 이산확률분포 vs 연속확률분포, 이항분포(+베르누이분포), 포아송분포 (0) | 2019.09.06 |
[기초 통계] 표준화, 정규분포, z분포, t분포, 카이제곱분포, F분포 (0) | 2019.09.04 |
댓글