통계학 기초 정리
통계학이란
수량적인 비교를 기초로 많은 사실을 관찰하고 처리하는 방법을 연구하는 학문이다.
통계학을 기반으로 불균형적인 데이터를 대상으로 규칙성과 불규칙성을 발견하여 실생활에 응용할 수 있다는 점에서 그 활용가치가 높다.
통계학의 목적
1. 의사결정
정보처리 관점에서 의사결정을 한다는 것은 많은 정보를 지각하고 평가하여 하나를 선택한다는 것이다. 이러한 경우, 여러 가지 변수나 데이터가 복잡하게 얽혀있어서 자료를 기준으로 판단하기 어려울 때 통계학적 지표로 선택의 근거를 마련할 수 있다.
2. 요약
통계에서 요약이란 데이터의 요약을 의미한다. 데이터를 수집하여 요약을 하는 이유는 빠른 의사결정을 위한 판단의 지표를 마련하기 위함이다. 특히 의미있는 기준(날짜별, 월별, 지점별, 지역별 등)으로 요약을 하면 그 가치를 더 높일 수 있다.
3. 연관성 파악
데이터의 특성을 파악하기 위한 요약의 과정에서 한 발 더 나아가, 변수간의 연관성 정도를 파악할 수 있다.
4. 예측
인과관계 파악을 통해 매출액이 변화하는 패턴을 찾아냈다면, 이를 하나의 추세로 판단할 수 있다. 이러한 패턴이 반드시 반복된다고는 단정할 수 없으나, 추후 변수의 조작을 통하여 충분히 예측이 가능하다.
통계분석의 과정
통계분석은 표본을 통해 의미 있는 자료를 추출하고, 이를 기반으로 의사결정, 요약, 연관성 파악, 예측 등의 결과로 이어지도록 하는 일련의 과정을 할한다.
통계분석은 [수집 -> 정제 -> 추정 -> 검정]의 과정을 통해 이루어진다.
1. 수집
통계분석을 시작하기 위해서는 조사의 목적에 맞는 데이터를 수집하는 것이 기본이다. 데이터는 성격에 따라 1차 자료와 2차 자료로 구분이 될 수 있다.
- 1차 자료 : 조사자가 직접 수집한 자료로, 보통 1차 자료는 설문으로 자료가 수집된다.
- 2차 자료 : 조사자의 조사 목적에 맞추어 수집된 자료는 아니지만, 조사 목적에 맞아 활용할 수 있는 자료를 뜻한다.
2. 정제
자료의 수집단계를 거친 후 적합한 자료를 선별하고, 적합하지 않는 자료는 삭제하는 과정을 거쳐야한다.
3. 추정
자료를 수집하고 정제하여 통계분석을 하는 것은 결국 모수를 추정하기 위함이다. 통계는 모집단을 대상으로 하지 않고 표본을 대상으로 분석하는 것이므로, 표본의 분석을 통해 모집단의 모수를 추정할 수 있는 좋은 자료가 뒷받침 되어야 한다.
4. 검정
통계조사의 목적은 어떠한 주장이 실제로 옳은지 아닌지를 확인하기 위함이다. 이때, 가설을 수립하고 이것이 맞는지의 여부를 판단하는 것을 검정이라고 한다.
추정 VS 예측
통계학을 공부하다 보면 추정과 예측의 개념을 헷갈릴 때가 있으므로, 확실하게 짚고 넘어갈 필요가 있겠다.
추정은 위에서 설명한 바와 같이 표본으로부터 얻은 통계량으로 '모수의 특성을 추측하는 과정'이다. 모집단 전체 데이터를 대상으로 분석하는 것이 불가능하므로, 표본 집단을 구성하여 모수를 추정할 수 있다.
예측은 추정을 반복하여 얻는 결과들을 기준으로 일정한 패턴을 찾아낸 후, 향후 미래에 활용할 수 있는 의미 있는 특정한 모수를 가늠하는 것이다.
'Data Analysis > Basic statistics' 카테고리의 다른 글
[기초통계] 확률분포, 이산확률분포 vs 연속확률분포, 이항분포(+베르누이분포), 포아송분포 (0) | 2019.09.06 |
---|---|
[기초 통계] 표준화, 정규분포, z분포, t분포, 카이제곱분포, F분포 (0) | 2019.09.04 |
[기초통계] 확률변수와 확률함수의 관계, 이산 확률변수 vs 연속 확률변수 (0) | 2019.09.04 |
[기초통계] 표본분포, 표본평균의 오차, 중심극한정리, 표본의 개수 (0) | 2019.09.03 |
[기초 통계] 모집단, 모수와 통계량, 표본추출 방법 (0) | 2019.09.01 |
댓글