- Contents
- 도수표 작성하기
- 정성데이터에 대한 그래프적 표현
- 도수분포(frequency distribution)작성하기 ⇒ pdf 참고
- 분포에 대한 도식적 표현
- Reference
이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
- Key Point : 도수분표 작성 / 도수분포, 상대도수분포
Contents
-
정성변수를 도수표와 상대도수표로 요약한다.
-
도수표를 막대도표 또는 파이도표로 표현한다.
-
정량변수를 도수분포 또는 상대도수분포로 요약한다.
-
도수분포를 히스토그램 또는 도수다각형으로 표현한다.
도수표 작성하기
-
도수표(frequency table)
-
정성적 데이터를 상호배타적(mutually exclusive)이고, 전체포괄(collectively exhaustive)인 계급으로 분류한 후 각 계급에 존재하는 관측지의 도수를 나타낸 표
-
상호배타적은 데이터가 단 하나의 계급에만 소속된다는 것을 의미 ⇒ 중복 X
-
-
도수표 작성하기
-
도수표
-
Class(계급) : 분류 카테고리
-
Frequency(도수) : 각 계급의 원소 개수
-
-
제표(Tabulation): 각 범주에 속하는 빈도수를 구분하여 보여주는 표
-
단순제표(도수표) : 범주가 한가지 기준으로 나뉘어진 경우
-
교차제표(분할표) : 범주가 두개이상 기준으로 나뉘어진 경우
-
-
정성데이터에 대한 그래프적 표현
-
막대도표
- 수평축에는 정성계급 , 수직축에는 계급의 도수
-
파이도표
- 각 계급을 총 도수에 대한 비율 또는 백분율로 나타내는 도표
도수분포(frequency distribution)작성하기 ⇒ pdf 참고
도수분포
-
정량적 데이터를 상호배타적이고, 총망라된(포괄적인) 계급으로 분류한 후 각 계급에 존재하는 관측치의 도수를 나타낸것
-
계급(Class) : 분류 카테고리
-
빈도수(Frequency) : 각 계급의 원소개수
-
계급한계(Class limits) : 각 계급의 경계 값
-
계급구간(Class interval, 폭) : 각 계급의 폭
-
계급값(Class mark) : 각 계급의 가운데 값
-
도수분포 작성법
-
[1] 계급의 수를 정한다. ⇒
k
- $2^k > n$
-
[2] 계급구간을 정한다
- 계급구간 = (최대값 - 최소값) / 계급의 수
-
[3] 첫 번째 계급의 하한을 정한다.
-
일반적으로 계급구간의 배수(1.6이면 ⇒ 반올림해서 ⇒ 2)
-
예시) 계급구간이 2라면 0~2 / 2~4 / 4~6 이런식으로 정한다.
-
-
[4] 각 계급의 빈도수를 구한다.
상대도수분포표, 누적도수분포표 (중요)
-
상대도수분포표(Relative frequency distribution)
- 각 계급에 변수가 존재할 확률(백분율) = 계급 빈도 / 빈도합계
-
누적도수분포표(Cumulative frequency distribution)
- 특정 계급 이하까지의 데이터 빈도(특정 계급 이하 빈도를 모두 더함)
분포에 대한 도식적 표현
-
히스토그램 → 도수분포를 시각화
-
도수다각형
- 두개 또는 그 이상의 분포를 비교할 때 사용하기 좋다.
-
그림은 pdf 참고
Reference
-
- Lind, Marchal, Wathen, (2018), McGrawHill, 강종열 등 역, 지필미디어