본문 바로가기
고등 수학/확률과 통계 개인학습 노트

모집단과 표본의 확률분포, 통계량, 표본평균의 분포, 표본분산의 분포 -6주차 정리

by 배고픈 대학원생 2021. 10. 12.
반응형
참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller




모집단과 표본의 확률분포


 

모집단과 모수

 

모집단(Population)

 

- 연구대상이 되는 개체들의 전체 집합이다.

 

모수(parameter)

 

- 모집단의 분포를 결정하는 상수

 

 

모집단의 분포는 일반적으로 평균이 mu이고 분산이  sigma^2인 정규분포를 따른다고 가정한다. 그 이유는 모집단의 분포를 모르기 때문이다.

 

모수를 알기 위해서 모집단을 대상으로 연구해야 하지만, 모집단은 일반적으로 아주 많은 개체로 구성되어 있음

 

1. 모든 개체를 조사하는 것이 불가능할 수 있음
2. 시간과 비용이 너무 많이 소요되므로 비경제적임
3. 너무 많은 개체를 조사하다 보면 정확성이 떨어짐

 

모평군과 모집단

 

모집단과 확률분포

 

모집단(𝑋1,𝑋2,........,𝑋N) 은 정규분포를 따르고 있다고 가정함

 

 

표본과 표본추출법

 

표본 추출에서 선택된 것이 표본이다. 위의 가정을 따랐기 때문에 모집단의 분포와 똑같다고 보는 것.

 

 

위 사진에서 붉은색 i는 서로 독립적이고, 검정색 i는 동일함을 의미한다.

따라서 표본 x1, x2~ xn은 서로 독립적이고 모집단과 똑같은 분포 평균이 뮤이고, 분산이 시그마 제곱인 정규분포를 다른다.

이것이 모집단과 표본에 대한 중요한 가정이다.

 

 

이를 통해서 표본 개체들은 모집단의 분포와 동일한 분포를 따르고 있음을 알 수 있다.

 

통계적 추론(Statistical Inference)

 

표본 자료를 이용하여 모수에 대한 정보를 얻는 방법론, 모집단으로 부터 표본을 추출해서 표본의 분포를 보면 정규분포 모양과 같으며 이 표본으로부터 통계량을 구하는 것이다. 

 

 


통계량


통계량 (Statistic)


통계량은 확률변수이며 대문자를 사용함 그러나 특정 표본의 자료를 이용하여 계산한 결과는 소문자를 사용함

 

 

가장 대표적인 통계량은 X`이다.

 

여러가지 기초통계량들은 최대, 최소값, 순위 통계량, 중앙값이 된다.

 

 


표본평균의 분포


모든 확률변수는 고유한 확률분포를 갖는다.

 

 

표본평균의 분포는 X들의 선형함수이다. 정규분포 특징 3번에 의해 정규분포를 따른다.

 

 

X 바가 평균의 뮤이고 분산이 n분의 시그마 제곱인 정규분포를 따르기 때문에 Z로도 표기 가능하다.


표본분산의 분포


카이제곱분포의 정의

 

선형함수가 아니기 때문에 새로운 분포가 필요함

 

 

 

 

 

표본분산의 분포 유도

 

S^2의 분포는 아래와 같다.

 

X바 마이너스 뮤는 i와 관계가 없어 밖으로 빼낼 수 있고, 남는 앞에 항은 편차의 합은 항상 0이다 따라서 2[ ~~ ]는 없는 항이 되게 된다.

 

 

양변을 시그마제곱으로 나누게 되면 좌변은 Sum of Xi 마이너스 뮤의 제곱 나누기 시그마 제곱인데 이것은 시그마분의 Xi 마이너스 뮤의 제곱으로 표현 가능하다.

 

 Xi가 평균이 뮤이고 분산이 시그마제곱인 정규분포를 따르고 있기 때문에 표준정규분포를 따르는 변수의 제곱은 카이제곱의 자유도가 1이다.

 

이러한 것이 n개가 더해짐으로 카이 제곱의 n개의 분포를 다르게 된다.

 

 

 

우변을 먼저 보게 되면 n배의 X바 마이너스 뮤의 전체 제곱을 시그마로 나눈 것이다. 

 

 

 

S제곱에 관련된 분포는

 


문제 1.

 

표본 𝑋𝟏,𝑋𝟐,……,𝑋𝑛에서 다음 중 통계량으로서 적합하지 않은 것은 무엇인가

 

 

정답은 1번이다. 통계량은 표본의 함수만으로 나타나야만 한다. 즉 모수가 포함되어 있기 때문에 틀린 것이다.

 

2-4는 표본자료의 함수이다.

 

 

문제 2.

 

다음과 같이 주어졌을 때 X(bar)의 분포는?

 

 

X바도 정규분포를 따른다.

 

풀이 1

 

풀이 2

 

문제 3

 

다음과 같이 주어졌을 때 각각의 분포와 평균 , 분산을 구하라

 

(1) 새로운 확률변수확률변수Y=𝑋_1+𝑋_2−2𝑋_3의 분포와 평균과 분산을 구하라
(2) 새로운 확률변수 𝑉=[(𝑋_1−100)/4]^2 의 분포와 평균과 분산을 구하라

 

풀이 1)

 

 

 

 

 

 

문제 4

 

확률변수 X 가 자유도 15 인 카이제곱분포를 따른다면
통계 소프트웨어를 이용하여 P( X < 12.5 ) 를 구하라

 

 

 

 

문제 5

 

확률변수 X 는 자유도 21 인 카이제곱분포를 따르고 확률변수 Y 는 자유도가 18 인 카이제곱분포를 따른다 .
만약 X 와 Y 가 서로 독립이고 , V = X + Y 이라면 P( V < 27.5) 을 구하라

 

 

풀이

 

 

 

 

문제 6

 

다음과 같이 주어졌을 때 각각의 분포와 평균 , 분산을 구하라

 

(1) E(𝑉+𝑌)
(2) E(𝑊+𝑌)
(3) Var(𝑉+𝑊)
(4) Var(𝑉+𝑊+𝑌)

 

 

 


감사의 글

 
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.


 

반응형

댓글