devFancy BE Developer

01. 통계학은 어떠한 학문인가

2022-04-16
devfancy

이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.

  • Key Point : 정성변수 vs 정량변수 / 이산변수 vs 연속변수/ 4가지 척도

Contents

  • 통계학을 정의한다.

  • 기술통계학과 추론통계학 차이를 구분한다.

  • 정성변수와 정량변수, 이산변수와 연속변수를 분류한다.

  • 명목척도, 순서척도, 등간척도, 비율척도를 구분한다.

통계학 정의

  • 통계(statistic): 수치적인 사실

  • 통계학: 보다 효과적인 의사결정을 도와주는 데이터 수집, 정리, 표현, 분석 및 해석에 대한 과학

  • 변동성(Variability)

    • 통계는 변동성이 있는 데이터를 다루는 과학이다

통계학의 종류

  • 기술통계학(descriptive statistics)

    • 데이터를 이용하여 유용한 정보를 주는 방식으로 체계화하고, 요약하고, 표현하는 방법 → 2~4장에서 다룰 내용
  • 추론통계학(inferential statistics)

    • 표본에 기반하여 모집단의 특성으 추정하기 위한 방법

    • 한정된 크기의 데이터(표본)을 사용하여 의사결정을 하게 됨

    • 모집단(population): 관심의 대상인 모든 개인이나 개체

    • 표본(sample): 관심의 대상인 모집단의 부분 또는 일부

모집단과 표본

  • 모집단과 모수

    • 모집단(population): 통계분석의 대상이 되는 모든 개체들의 집합

    • 모수(parameter): 모집단의 특성을 나타내는 수치로 모평분, 모분산, 모비율이 쓰임

  • 표본과 표본 통계량

    • 표본(sample): 모집단으로부터 임의로 추출된 모집단의 부분집합

    • 표본통계량(sample statistic): 표본의 특성을 나타내는 척도로 표본평균, 표본분산, 표본비율이 쓰임

  • 표본조사의 이유

    • 모집단의 수가 클 경우의 전수 조사: 시간, 비용 등의 이유로 불가능한 경우가 많다.

통계적 의사결정(Statistical decision making)

  • 통계학의 목적은 표본정보를 바탕으로 모집단의 특성을 추측하는 것

  • 부분적인 정보를 근거로 예측이나 의사결정을 내리는 것을 통계적 의사결정

변수의 종류

  • 정성적 변수(qualitative Variables)

    • 비 수치적인 특성치 또는 속성으로서 관찰 또는 기록된 변수

    • 예시) 성별, 음료수 선호도, 눈의 색깔

  • 정량적 변수(quantative Variables)

    • 수치적으로 기록된 변수

    • 예시) 계좌에 있는 잔액, 자동차 배터리의 수명, 회사의 직원 수

  • 정량적 변수(quantative variables)는 이산변수와 연속변수로 분리됨

  • 이산변수(discrete variables)

    • 대개 수를 센(counting) 것의 결과

    • 두 값 사이에 “차이”가 존재

    • 예시) 집의 침실 수, 경영통계학 각 분반의 학생 수

  • 연속변수(continuous variables)

    • 대개 측정(measurement)의 결과

    • 특정한 범위 내의 어떤 값도 가질 수 있다고 가정

    • 예시) 타이어 내부의 공기압, 한국에서 LA까지의 비행시간

변수의 종류 요약

  • 변수의 유형

    • 정성변수

      • 혼인 여부

      • 머리카라 색깔

      • PC의 상표

    • 정량변수

      • 이산변수

        • 가구당 자녀 수

        • TV 세트 수

      • 연속변수

        • 납부한 소득세 금액

        • 학생의 체중

        • 대한민국 연중 강우량

    • 정성적변수 vs 정량적변수 구분

측정의 척도(levels of measurement)

  • 측정의 척도는 명목, 순서, 등간, 비율 4가지로 구분
  1. 명목 척도 : 카테고리로 분류됨. 하지만, 특정 순서대로 정렬할 수 없음

  2. 순서 척도 : 순서대로 정렬 O. 하지만, 데이터 값 간의 차이를 확인할 수 없고 차이가 의미가 없음.

  3. 등간 척도 : 순서대로 정렬 O, 데이터 값 간의 차이 계산 및 차이가 의미 O, 하지만, 절대적인 0점이 없음.

  4. 비율 척도 : 순서대로 정렬 O, 데이터 값 간의 차이 계산 및 차이가 의미 O, 절대적인 0점 존재 O 및 의미가 있음. 비율을 측정하는 것이 가능 및 의미 O

  • 명목의 척도는 가장 하위의 측정척도

    • 카테고리 분류 가능, 빈도수 셀 수 있음

    • 특정한 순서 X

    • 예시) 초콜릿에 대한 색상별 분류, 학생에 대한 성별 분류

  • 순서 척도

    • 정의된 속성 또는 정성변수에 대한 상대적인 순위 또는 등급에 기반

    • 변수는 오로지 순위가 매겨지거나 빈도수가 세어 짐

    • 각 그룹간의 차이는 알 수 없으며 의미가 없음

    • 예시) 상위 10위까지 사업하기 가장 좋은 환경을 가진 주, 교수에 대한 학생의 강의평가

  • 등간 척도

    • 서열척도의 모든 특징을 포함하면서 값들 사이의 간격 또는 차이가 의미 있음.

    • 알려진 측정단위의 척도를 기반으로 함

    • 절대적인 “0”이란 값이 존재하지 않음

    • 예시) 온도 체계(섭씨), 의복 사이즈

  • 비율 척도

    • 등간척도 + 두 숫자 사이의 비율이 의미가 있음, 절대적인 “0” 존재

    • 예시) 임금, 주가의 변화, 무게

  • 4가지 척도 비교-1

  • 4가지 척도 비교-2

Reference


Comments

Index