이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
점도표 작성과 해석
줄기 - 잎 도표 작성과 해석
분위수들에 대한 이해와 계산
상자도표의 작성과 분석
왜도 계수의 계산과 해석
산점도 작성과 해석
분할표의 작성과 해석
자료의 가능한 값들을 나타내는 수평선을 따라서 각 관측치를 하나의 점으로 표현
분포의 모양, 최대값, 최소값을 한 눈에 볼 수 있다.
줄기-잎 도표의 장점 (도수분포와 히스토그램의 단점을 보완)
각 관측치의 실제값이 유지됨
각 자리수의 값들이 도표에 표시됨
각 관측치 값 → 2개의 부분으로 나누어짐
앞 자리 → 줄기 / 뒤에 오는 수 → 잎
줄기들은 수직 축에 표현되고, 잎들은 수평 축에 다른 값들과 서로 쌓이는 형태로 표현된다.
산포, 분포의 형태를 측정하는 방법 중 하나
관측치들의 여러 부분으로 나눈 값들의 위치를 정한다.
사분위수, 십분위수, 백분위수
특정 백분위 수의 위치 $L_p = (n + 1) \frac{P}{100}$ㅜ
이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
정성변수를 도수표와 상대도수표로 요약한다.
도수표를 막대도표 또는 파이도표로 표현한다.
정량변수를 도수분포 또는 상대도수분포로 요약한다.
도수분포를 히스토그램 또는 도수다각형으로 표현한다.
이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
산술평균, 중위수, 최반값을 계산하고 해석한다.
가중평균을 계산한다.
기하평균을 계산하고 해석한다.
범위, 분산, 표준편차, 변동계수를 계산하고 해석한다.
그룹 데이터에 대한 산술평균과 표준편차를 계산한다.
위치척도
: 데이터의 집합의 중심 경향을 기술하는 데 사용
산술평균
모평균 $\mu = \frac{\Sigma x}{N}$
$\mu$ : 모평균을 나타낸다.
$x$ : 특정한 값을 타나낸다.
N : 모집단 내의 값의 개수이다.
표본평균 $\bar{x} = \frac{\Sigma x}{n}$
$\bar{x}$ : 표본평균을 나타낸다.
n : 표본의 개수이다.
특성
등간척도 또는 비율척도가 요구된다.
평균은 유일한 값
평균으로부터 각 값들까지의 편차의 합은 0
매우 크거나 작은값에 영향을 받는다.
중위수(중앙값) (median)
최소에서 최대의 순서로 정렬된 값들의 중간점
중위수 = $\frac{(n+1)}{2}$
짝수일 경우 두 값의 산술 평균이 중위수이다.
적어도 순서척도가 요구된다.
최빈값
가장 빈번하게 출현하는 관측치 값
특성
명목척도 데이터에서 사용될 수 있다.
(=중위수)극도로 작거나 큰 값에 영향을 받지 않는다. $\nleftrightarrow$ 평균은 영향을 받는다.
평균, 중앙값과 달리 값이 여러개 일 수 있다 $\nleftrightarrow$ 평균, 중앙값은 값이 하나
최빈값은 항상 분포의 봉우리, 중위수는 최빈값과 평균의 사이
가중평균(weighted mean)
같은 값을 가진 여러 개의 관측치가 있을 때 산술평균을 계산하는 방법
가중평균은 각 관측치 x와 이에 상응하는 가중치 w를 곱하여 구한다
가중평균 $\frac{\Sigma 판매량 * 개당이익}{\Sigma 판매량} = \frac{\sum_{i=1}^N W_iX_i}{\sum_{i=1}^N W_i}$
W: 가중치(갯수) , X: 관측치(값)
기하평균(geometric mean)
시간에 따른 백분율, 비율, 지수, 성장률의 변화의 평균
기하평균 $GM = \sqrt[n]{ {(x_1)}{(x_2)}…{(x_n)} }$
시간에 따른 증가율 $GM = \sqrt[n]{\frac{기말의 값}{기초의 값}} - 1$
이 글은 경영학부 경영통계 수업에서 배운 자료들을 정리한 내용입니다.
통계학을 정의한다.
기술통계학과 추론통계학 차이를 구분한다.
정성변수와 정량변수, 이산변수와 연속변수를 분류한다.
명목척도, 순서척도, 등간척도, 비율척도를 구분한다.
이 카테고리는 경영학부 경영통계 수업을 듣고 정리한 내용을 바탕으로 글을 작성하였습니다.