09. 추정과 신뢰구간

이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.

모평균에 대한 점추정

구간추정(Interval esitmate): 모수의 실제값이 들어 있을 구간을 추정
- 모평균 → $\sigma$ 알려짐 / $\sigma$ 알려지지 않음
- 모비율
신뢰구간(Confidence interval)
- 어떤 구간(하한, ,상한)내에 모수의 실제값이 있을 것으로 추정되는 구간 값
- 신뢰수준, ($1-\alpha$)
  - $\alpha$ : 유의 수준(significance level)
  - $1-\alpha$ : 신뢰수준(confidence level)
  - 예) 유의수준 $\alpha$ = 5% ⇒ 95% 신뢰구간
  - 신뢰구간 = 점추정량 $\pm$ 오차범위
모평균에 대한 신뢰구간의 폭(오차범위)을 결정하는 요인

[1] 표본수 : 표본 크기 n이 증가할수록 신뢰구간 폭이 좁아진다.

[2] 모집단의 표준편차, 모를 경우 표본표준편차 : 표준편차가 클수록 신뢰구간 폭이 넓어진다.

[3] 원하는 신뢰수준: 신뢰수준이 클수록 신뢰구간 폭이 넓어진다.

$Z_{\alpha / 2} = \frac{\sigma}{\sqrt{n}}$

$( \bar{X} - 1.96\frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96\frac{\sigma}{\sqrt{n}} )$

표본비율: $p = \frac{x}{n}$ (⇒ 모비율에 대한 점추정치)
표본비율의 표본분포(Sampling distribution of the sample proportion)
$\mu = n\pi, \sigma^{2} = n\pi(1-\pi)$
- $\pi$ : 성공확률
- 표본비율의 표본분포의 평균과 분산
  - 평균 E(p) = $\pi$
  - 분산 V(p) = $\frac{\pi(1-\pi)}{n}$
모비율 추정 시 중심극한정리 적용을 위한 조건
- np ≥ 5이고 n(1-p) ≥ 5 일때 → 중심극한정리 적용, 표준정규분포(z) 활용
모비율에 대한 구간 추정 (중요)
- 모비율 $\pi$ 의 신뢰구간 = $p \pm z\sqrt{\frac{p(1-p)}{n}}$

구간추정에서 표본크기를 정할 때 고려요인
- 오차한계(E): 신뢰구간의 폭을 좁히기 위해서는 작은 오차한계가 필요하며 이를 위한 표본크기는 커지게 됨 ⇒ $E = X - \mu$
- 원하는 신뢰수준: 신뢰수준이 커질 수록, 필요한 표본크기는 커짐
- 모집단의 변동성: 모표준편차가 커지면, 더 많은 표본자료가 필요함
구간추정에서 사용된 오차한계(E)를 통해 표본크기를 정할 수 있다.
- 모평균에 대한 구간추정 : $E = z\frac{\sigma}{\sqrt{n}}$ ⇒ $n = ({\frac{z\sigma}{E}})^{2}$
- 모비율에 대한 구간추정: $E = z\sqrt{\frac{p(1-p)}{n}}$ ⇒ $n = p(1-p)(\frac{z}{E})^{2}$
- 모분산과 표본분산을 모른다면? ⇒ 자료의 범위 사용 : R = 4$\sigma$ ↔ $\sigma = \frac{R}{4}$)