이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
- Key Point : 정성변수 vs 정량변수 / 이산변수 vs 연속변수/ 4가지 척도
Contents
-
통계학을 정의한다.
-
기술통계학과 추론통계학 차이를 구분한다.
-
정성변수와 정량변수, 이산변수와 연속변수를 분류한다.
-
명목척도, 순서척도, 등간척도, 비율척도를 구분한다.
통계학 정의
-
통계(statistic): 수치적인 사실
-
통계학: 보다 효과적인 의사결정을 도와주는 데이터 수집, 정리, 표현, 분석 및 해석에 대한 과학
-
변동성(Variability)
- 통계는 변동성이 있는 데이터를 다루는 과학이다
통계학의 종류
-
기술통계학(descriptive statistics)
- 데이터를 이용하여 유용한 정보를 주는 방식으로 체계화하고, 요약하고, 표현하는 방법 → 2~4장에서 다룰 내용
-
추론통계학(inferential statistics)
-
표본에 기반하여 모집단의 특성으 추정하기 위한 방법
-
한정된 크기의 데이터(표본)을 사용하여 의사결정을 하게 됨
-
모집단(population): 관심의 대상인 모든 개인이나 개체
-
표본(sample): 관심의 대상인 모집단의 부분 또는 일부
-
모집단과 표본
-
모집단과 모수
-
모집단(population): 통계분석의 대상이 되는 모든 개체들의 집합
-
모수(parameter): 모집단의 특성을 나타내는 수치로 모평분, 모분산, 모비율이 쓰임
-
-
표본과 표본 통계량
-
표본(sample): 모집단으로부터 임의로 추출된 모집단의 부분집합
-
표본통계량(sample statistic): 표본의 특성을 나타내는 척도로 표본평균, 표본분산, 표본비율이 쓰임
-
-
표본조사의 이유
- 모집단의 수가 클 경우의 전수 조사: 시간, 비용 등의 이유로 불가능한 경우가 많다.
통계적 의사결정(Statistical decision making)
-
통계학의 목적은 표본정보를 바탕으로 모집단의 특성을 추측하는 것
-
부분적인 정보를 근거로 예측이나 의사결정을 내리는 것을 통계적 의사결정
변수의 종류
-
정성적 변수(qualitative Variables)
-
비 수치적인 특성치 또는 속성으로서 관찰 또는 기록된 변수
-
예시) 성별, 음료수 선호도, 눈의 색깔
-
-
정량적 변수(quantative Variables)
-
수치적으로 기록된 변수
-
예시) 계좌에 있는 잔액, 자동차 배터리의 수명, 회사의 직원 수
-
-
정량적 변수(quantative variables)는 이산변수와 연속변수로 분리됨
-
이산변수(discrete variables)
-
대개 수를 센(counting) 것의 결과
-
두 값 사이에 “차이”가 존재
-
예시) 집의 침실 수, 경영통계학 각 분반의 학생 수
-
-
연속변수(continuous variables)
-
대개 측정(measurement)의 결과
-
특정한 범위 내의 어떤 값도 가질 수 있다고 가정
-
예시) 타이어 내부의 공기압, 한국에서 LA까지의 비행시간
-
변수의 종류 요약
-
변수의 유형
-
정성변수
-
혼인 여부
-
머리카라 색깔
-
PC의 상표
-
-
정량변수
-
이산변수
-
가구당 자녀 수
-
TV 세트 수
-
-
연속변수
-
납부한 소득세 금액
-
학생의 체중
-
대한민국 연중 강우량
-
-
-
정성적변수 vs 정량적변수 구분
-
측정의 척도(levels of measurement)
- 측정의 척도는 명목, 순서, 등간, 비율 4가지로 구분
-
명목 척도
: 카테고리로 분류됨. 하지만, 특정 순서대로 정렬할 수 없음 -
순서 척도
: 순서대로 정렬 O. 하지만, 데이터 값 간의 차이를 확인할 수 없고 차이가 의미가 없음. -
등간 척도
: 순서대로 정렬 O, 데이터 값 간의 차이 계산 및 차이가 의미 O, 하지만, 절대적인 0점이 없음. -
비율 척도
: 순서대로 정렬 O, 데이터 값 간의 차이 계산 및 차이가 의미 O, 절대적인 0점 존재 O 및 의미가 있음. 비율을 측정하는 것이 가능 및 의미 O
-
명목의 척도는 가장 하위의 측정척도
-
카테고리 분류 가능, 빈도수 셀 수 있음
-
특정한 순서 X
-
예시) 초콜릿에 대한 색상별 분류, 학생에 대한 성별 분류
-
-
순서 척도
-
정의된 속성 또는 정성변수에 대한 상대적인 순위 또는 등급에 기반
-
변수는 오로지 순위가 매겨지거나 빈도수가 세어 짐
-
각 그룹간의 차이는 알 수 없으며 의미가 없음
-
예시) 상위 10위까지 사업하기 가장 좋은 환경을 가진 주, 교수에 대한 학생의 강의평가
-
-
등간 척도
-
서열척도의 모든 특징을 포함하면서 값들 사이의 간격 또는 차이가 의미 있음.
-
알려진 측정단위의 척도를 기반으로 함
-
절대적인 “0”이란 값이 존재하지 않음
-
예시) 온도 체계(섭씨), 의복 사이즈
-
-
비율 척도
-
등간척도 + 두 숫자 사이의 비율이 의미가 있음, 절대적인 “0” 존재
-
예시) 임금, 주가의 변화, 무게
-
-
4가지 척도 비교-1
- 4가지 척도 비교-2
Reference
-
- Lind, Marchal, Wathen, (2018), McGrawHill, 강종열 등 역, 지필미디어