본문 바로가기
반응형

전체 글45

[기초통계] 기술통계 vs 추론통계, 점추정 vs 구간추정, 신뢰수준, 신뢰구간 - 기술통계와 추론통계 기술통계 추론통계 표본으로부터 통계량을 구하고 통계량 간의 차이를 파악하는데 중점을 둔다. 표본을 통해 모집단의 성격을 파악하는 데 중점을 둔다. 특히 추론통계에서는 모수를 특정 수치나 수치의 범위로 표현한다. - 추정이란? 추정(estimation)의 사전적인 의미는 '정확하지는 않지만 이 정도면 될 것이라는 정도를 가늠하는 것'이라 표현된다. 이 '정도'를 가늠하는 방법에는 정확한 수치로 나타낼 수도 있고, 시작점과 종료점으로 표현할 수도 있다. 아래서 언급하겠지만 전자를 점추정, 후자를 구간추정의 방법이라 한다. 추정을 하는 과정에서 선택된 표본을 $x_1, x_2, x_3, ... , x_n$이라 할 때, 이를 대상으로 계산하여 구체적으로 도출된 통계량을 추정치(estima.. 2019. 9. 8.
[기초통계] 확률분포, 이산확률분포 vs 연속확률분포, 이항분포(+베르누이분포), 포아송분포 - 확률분포 확률분포(probability distribution)는 확률 변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다. - 확률분포의 중요성 확률분포를 활용하는데에 대한 의미와 중요성은 아래와 같다. 1. 확률변수가 일어날 확률을 전체 1.0(100%)인 분포로 표현하여 관측된 통계량이 일어날 확률을 계산할 수 있게 한다. 2. 확률변수의 특성(이산 or 연속) 및 분석특성(일표본, 차이검정 등)에 따라 이론적으로 성립된 확률분포를 기준으로 모집단의 추론 및 가설검정이 가능하다. 3. 각 확률분포는 변수와 분석의 특성에 맞는 최적의 이론적 모형을 의미한다. 4. 확률분포는 통계량을 파악하여 통계적 의사결정을 내리는 기준을 제시한다. - 확률분포의 종류 이산 확률 분포 연속 확률 분포 이산 .. 2019. 9. 6.
[기초 통계] 표준화, 정규분포, z분포, t분포, 카이제곱분포, F분포 - 표준화 표준화란 기준점을 동일하게 맞춰 조사자가 자료들을 쉽게 비교할 수 있도록 만드는 과정으로, 대표적인 표준화 분포인 표준정규분포(z분포)는 평균을 0, 표준편차를 1로 만든다. 표준화과 필요한 이유는 다음의 예시에서 설명이 가능하다. 예시) A가 영어 80점, 수학을 70점 맞았다고 했을 때, 영어를 더 잘했다고 판단할 수 있는가? 위의 예시에서 단순히 점수를 비교한다면 영어의 점수가 더 우위에 있다는 것을 알 수 있다. 하지만 반 평균 점수가 영어의 경우 90점, 수학의 경우 60점이라 한다면, 위의 판단이 틀렸다는 것을 알 수있다. 위의 판단의 오류를 방지하려면, 각 과목 점수에 대한 표준화를 실시하여 기준점을 동일하게 맞춘 후 비교하는 것이 바람직하다. 이것이 표준화가 필요한 이유이다. -.. 2019. 9. 4.
[기초통계] 확률변수와 확률함수의 관계, 이산 확률변수 vs 연속 확률변수 - 확률변수와 확률함수의 관계 확률변수(random variable)는 사건에 실수값을 대응시키고 그 값에 확률을 부여한 것이다. 다시 말해, 확률로 표현할 사건 및 이벤트를 정의하는 것으로 일어나는 사건의 경우의 수에 대해 숫자화 한 것을 뜻한다. 확률함수는 확률을 가진 어떤 사건이 일어날 확률을 통해 파라미터를 만들고, 이를 활용한 수학적 함수를 만드는 것을 뜻한다. 수학적으로 설명하면, 확률 P를 가진 어떤 사건이 n회 시행 중에서 x회 나타날 때, 확률변수 x와 이에 대응되는 P(x)의 관계를 나타낸 함수라 말할 수 있다. 이렇게 설명을 해도, 단순히 말로 설명하면 직관적으로 이해가 가지 않기 마련이다. 예시를 통한 설명은 아래에서 함께 진행하겠다. [ 예시 - 동전을 두 번 던질 때, 앞면이 나.. 2019. 9. 4.
반응형