devFancy BE Developer

02. 데이터 기술하기: 도수표, 도수분포 및 도표표현

2022-04-17
devfancy

이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.

  • Key Point : 도수분표 작성 / 도수분포, 상대도수분포

Contents

  • 정성변수를 도수표와 상대도수표로 요약한다.

  • 도수표를 막대도표 또는 파이도표로 표현한다.

  • 정량변수를 도수분포 또는 상대도수분포로 요약한다.

  • 도수분포를 히스토그램 또는 도수다각형으로 표현한다.

도수표 작성하기

  • 도수표(frequency table)

    • 정성적 데이터를 상호배타적(mutually exclusive)이고, 전체포괄(collectively exhaustive)인 계급으로 분류한 후 각 계급에 존재하는 관측지의 도수를 나타낸 표

    • 상호배타적은 데이터가 단 하나의 계급에만 소속된다는 것을 의미 ⇒ 중복 X

  • 도수표 작성하기

    • 도수표

      • Class(계급) : 분류 카테고리

      • Frequency(도수) : 각 계급의 원소 개수

    • 제표(Tabulation): 각 범주에 속하는 빈도수를 구분하여 보여주는 표

      • 단순제표(도수표) : 범주가 한가지 기준으로 나뉘어진 경우

      • 교차제표(분할표) : 범주가 두개이상 기준으로 나뉘어진 경우

정성데이터에 대한 그래프적 표현

  • 막대도표

    • 수평축에는 정성계급 , 수직축에는 계급의 도수
  • 파이도표

    • 각 계급을 총 도수에 대한 비율 또는 백분율로 나타내는 도표

도수분포(frequency distribution)작성하기 ⇒ pdf 참고

도수분포

  • 정량적 데이터를 상호배타적이고, 총망라된(포괄적인) 계급으로 분류한 후 각 계급에 존재하는 관측치의 도수를 나타낸것

    • 계급(Class) : 분류 카테고리

    • 빈도수(Frequency) : 각 계급의 원소개수

    • 계급한계(Class limits) : 각 계급의 경계 값

    • 계급구간(Class interval, 폭) : 각 계급의 폭

    • 계급값(Class mark) : 각 계급의 가운데 값

도수분포 작성법

  • [1] 계급의 수를 정한다. ⇒ k

    • $2^k > n$
  • [2] 계급구간을 정한다

    • 계급구간 = (최대값 - 최소값) / 계급의 수
  • [3] 첫 번째 계급의 하한을 정한다.

    • 일반적으로 계급구간의 배수(1.6이면 ⇒ 반올림해서 ⇒ 2)

    • 예시) 계급구간이 2라면 0~2 / 2~4 / 4~6 이런식으로 정한다.

  • [4] 각 계급의 빈도수를 구한다.

상대도수분포표, 누적도수분포표 (중요)

  • 상대도수분포표(Relative frequency distribution)

    • 각 계급에 변수가 존재할 확률(백분율) = 계급 빈도 / 빈도합계
  • 누적도수분포표(Cumulative frequency distribution)

    • 특정 계급 이하까지의 데이터 빈도(특정 계급 이하 빈도를 모두 더함)

분포에 대한 도식적 표현

  • 히스토그램 → 도수분포를 시각화

  • 도수다각형

    • 두개 또는 그 이상의 분포를 비교할 때 사용하기 좋다.
  • 그림은 pdf 참고

Reference


Comments

Index