devFancy BE Developer

09. 추정과 신뢰구간

2022-06-23
devfancy

이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.

Contents

  • 모평균에 대한 점추정을 구하고 해석한다.

  • 모평균에 대한 신뢰구간을 구하고 해석한다.

  • 모비율에 대한 신뢰구간을 구하고 해석한다.

  • 모평균과 모비율을 추정하기 위해 필요한 표본크기를 계산한다.

모평균에 대한 점추정

  • 점추정(Point estimate): 표본 통계량으로부터 모수의 단일 값을 추정

모평균에 대한 신뢰구간

  • 구간추정(Interval esitmate): 모수의 실제값이 들어 있을 구간을 추정

    • 모평균 → $\sigma$ 알려짐 / $\sigma$ 알려지지 않음

    • 모비율

  • 신뢰구간(Confidence interval)

    • 어떤 구간(하한, ,상한)내에 모수의 실제값이 있을 것으로 추정되는 구간 값

    • 신뢰수준, ($1-\alpha$)

      • $\alpha$ : 유의 수준(significance level)

      • $1-\alpha$ : 신뢰수준(confidence level)

      • 예) 유의수준 $\alpha$ = 5% ⇒ 95% 신뢰구간

      • 신뢰구간 = 점추정량 $\pm$ 오차범위

  • 모평균에 대한 신뢰구간의 폭(오차범위)을 결정하는 요인

    [1] 표본수 : 표본 크기 n이 증가할수록 신뢰구간 폭이 좁아진다.

    [2] 모집단의 표준편차, 모를 경우 표본표준편차 : 표준편차가 클수록 신뢰구간 폭이 넓어진다.

    [3] 원하는 신뢰수준: 신뢰수준이 클수록 신뢰구간 폭이 넓어진다.

신뢰구간 도출 과정

  • [1] 신뢰수준을 설정한다. (주로 문제에 주어짐, ex) 95%)

  • [2] $\alpha$ 와 $\alpha / 2$ 계산 ⇒ $1-\alpha$ = 0.95, $\alpha$ = 0.05

  • [3] 대응하는 Z값을 찾는다 : $Z값$ → $Z_{0.025}$ = 1.96

  • [4] 오차범위(margin of error)를 구하기 위해 Z값에 표준오차를 곱한다.

$Z_{\alpha / 2} = \frac{\sigma}{\sqrt{n}}$

  • [5] 표본평균에 오차범위를 더하고 빼서 신뢰구간을 결정한다.

$( \bar{X} - 1.96\frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96\frac{\sigma}{\sqrt{n}} )$

T분포

t분포의 특성

  • $\sigma$ 대신 $S$로 표준화를 할 경우, 표준정규분포를 따르지 않음.

  • 종모양 대칭의 연속확률분포

  • 자유도(df, degree of freedom)에 따라 모양이 결정되어 여러개의 분포가 존재함

    • df = n - 1
  • t분포는 z분포에 비해 평평한 분포를 가짐.

  • 표본크기 n의 증가함에 따라 폭이 좁아져 z분포에 가까워짐

자유도(df)

  • 어떤 데이터 집합 내에서 자유로운 값들의 수

  • 예) n=4, 표본 평균 = 10일때

  • 자유도 = 3 = (n-1)

t값 구하기 (중요)

  • 모집단의 분포가 정규분포라고 가정

  • 자유도(df)값을 구한다. ⇒ df = n - 1(표본크기 n = 10 → 자유도 = 9)

  • $\bar{X} \pm t_{n-1} \frac{s}{\sqrt{n}}$

  • t 분포표 에서 해당 신뢰구간에 대한 t값을 구한다.

모비율에 대한 신뢰구간 (중요)

  • 표본비율: $p = \frac{x}{n}$ (⇒ 모비율에 대한 점추정치)

  • 표본비율의 표본분포(Sampling distribution of the sample proportion)

  • $\mu = n\pi, \sigma^{2} = n\pi(1-\pi)$

    • $\pi$ : 성공확률

    • 표본비율의 표본분포의 평균과 분산

      • 평균 E(p) = $\pi$

      • 분산 V(p) = $\frac{\pi(1-\pi)}{n}$

  • 모비율 추정 시 중심극한정리 적용을 위한 조건

    • np ≥ 5이고 n(1-p) ≥ 5 일때 → 중심극한정리 적용, 표준정규분포(z) 활용
  • 모비율에 대한 구간 추정 (중요)

    • 모비율 $\pi$ 의 신뢰구간 = $p \pm z\sqrt{\frac{p(1-p)}{n}}$

표본크기 결정 (중요)

  • 구간추정에서 표본크기를 정할 때 고려요인

    • 오차한계(E): 신뢰구간의 폭을 좁히기 위해서는 작은 오차한계가 필요하며 이를 위한 표본크기는 커지게 됨 ⇒ $E = X - \mu$

    • 원하는 신뢰수준: 신뢰수준이 커질 수록, 필요한 표본크기는 커짐

    • 모집단의 변동성: 모표준편차가 커지면, 더 많은 표본자료가 필요함

  • 구간추정에서 사용된 오차한계(E)를 통해 표본크기를 정할 수 있다.

    • 모평균에 대한 구간추정 : $E = z\frac{\sigma}{\sqrt{n}}$ ⇒ $n = ({\frac{z\sigma}{E}})^{2}$

    • 모비율에 대한 구간추정: $E = z\sqrt{\frac{p(1-p)}{n}}$ ⇒ $n = p(1-p)(\frac{z}{E})^{2}$

    • 모분산과 표본분산을 모른다면? ⇒ 자료의 범위 사용 : R = 4$\sigma$ ↔ $\sigma = \frac{R}{4}$)

Reference


Comments

Index