본문 바로가기
고등 수학/확률과 통계 개인학습 노트

기초 통계량 - 1주차 정리

by 배고픈 대학원생 2021. 9. 7.
반응형
참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller

통계 분석을 위한 자료의 종류


 

자료의 종류
구분 소분류 설명 예시
질적자료
(Qualitative Data)
또는
범주형 자료
명목 자료(nominal data) 범주를 나타내는 자료 1. 성별 : 남,녀
2. 산업의 구분 : 전자, 전기, 화공, 기계, 식품
서열 자료(ordinal data) 순위의 개념을 갖는 자료 1. 서비스의 질 : 상 중 하
2. 의류 사이즈 : S M L XL XXL ...
양적 자료
(Quantitative data)
-일반적으로 숫자로 나타냄
이산형 자료
(discrete data)
관측의 의한 자료 불량품의 수, 주문 건수
연속형 자료
(continuous data)
측정에 의한 자료 키, 몸무게, 인장강도 등

 

 

사진 1. 양적 자료

 

사진 1과 같은 가정을 통해 (여기서 x는 표본값 아랫첨자는 순서를 의미한다)

백분위수(percentile) : 자료를 크기 순으로 나열하고 100등분 했을 때 각 위치의 값

 

사분위수(Quartile) : Quarter + Percentile의 합성어로 자료를 크기 순으로 나열하고 4 등분했을 때 각 위치의 값

‣ 1사분위수(Q1) = 25백분위수(Q1 보다 작은 자료가 전체의 25%)
‣ 2사분위수(Q2) = 50백분위수(Q2 보다 작은 자료가 전체의 50%) 

‣ 3사분위수(Q3) = 75백분위수(Q3 보다 작은 자료가 전체의 75%)

 

 

 

중심 위치의 척도 (Measure of Location)

 

자료가 많이 있을 때 흩어진 자료의 중심을 사용할 때 중심 위치의 척도를 사용한다.

 

평균(mean)은 아래와 같다.

 

식 1. 평균의 식

 

중앙값(median)은 전체 자료 값들을 가장 작은 값부터 크기 순으로 배열했을 때 중앙값 가장 가운데에 위치하는 값 (Q2 와 동일한 값이다.

 

주어진 값이 1 2 3 4 5인 n 이 홀수 일 때 식 2를 통해서 중앙값은 3이 된다.

식 2. n이 홀수일 때

 

 

 

1 2 3 4 5 6인 n 이 짝수 일 때 n 이 홀수 일 때 식 3을 통해 (3+4)/2의 계산 과정으로 중앙값은 3.5가 된다.

 

n이 짝수일 때

 

최빈값(mode) : 발생빈도가 가장 높은 값 즉 분포의 중심에 있진 않을 수 있지만 가장 빈번하게 나타나는 값이다.

 

절사 평균(Trimmed mean) : 자료를 크기 순으로 나열하고 상위 및 하위 몇 % 자료를 제외하고 계산한 평균
예 ‣ 10% 절사평균 – 상위 10%, 하위 10% 자료를 제외하고 계산한 평균

 


문제 : 만약 자료에 한 개의 큰 값이 포함되면 어떻게 될까?

 

문제

 

위 문제에서 알 수 있는 것은 한 개의 큰 값이 들어가게 되면 평균이 크게 변동되게 된다.(평균의 단점)

중앙값은 크게 바뀌지 않는다.

 

평균만 보지 말고 중앙값도 같이 보아야 한다.


 

산포의 척도(Measure of Dispersion)

 

 

범위는 최대 최소값의 차

분산은 평균으로부터 흩어져있는 거리 편차의 제곱 항을 n-1로 나눈다

표준편차는 분산의 제곱근 값

변동계수는 주로 스케일의 다른 자료들의 변동성을 확인하기 위해 사용된다.

 


문제 : 어떤 자료의 변동이 클까?

 

 

1. 분산을 계산한다.

 -> 자료 2의 분산이 자료 1의 분산보다 100배 큰 것을 알 수 있다.

 

2. 평균을 본다
 -> 스케일이 다르다

 

3. 변동 계수를 본다.

 -> 자료 1이 변동이 큰 것을 알 수 있다.



감사의 글

 
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.


 

반응형

댓글