본문 바로가기
고등 수학/확률과 통계 개인학습 노트

이산형 확률분포(베르누이분포, 이항분포, 기하분포, 초기하분포, 푸아송분포)-5주차 정리

by 배고픈 대학원생 2021. 10. 1.
반응형
참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller

 

확률분포(Distribution)란?

 

확률변수가 특정한 값을 가질 확률을 나타내는 함수이며 그러한 값들이 흩어져 있는 것

 

 


베르누이 분포


베르누이 분포에는 아래의 과정을 다루게 된다.(다른 분포도 거의 비슷한 과정으로 진행이 된다.)

1. 베르누이 프로세스
  
2. 베르누이 분포
  - 베르누이분포의 확률함수
  - 베르누이분포의 표기
  - 베르누이분포의 평균과 분산

 

베르누이 프로세스

 

1. 베르누이 실험은 결과가 성공 또는 실패로 분류된다
2. 베르누이 실험을 n 번 동일한 조건에서 실행한다
3. 베르누이 실험의 성공확률 p 는 모든 실행에서 동일하다
4. 모든 베르누이 실험은 독립적이다

 

베르누이분포

 

베르누이 실험을 한 번만 시행한다는 의미이며, 성공과 실패가 각각 다르게 정의된다.

 

베르누이분포의 확률함수

 

성공(X=1), 실패(X=0)일때 Rx={0,1}, 확률함수는 아래와 같이 표기한다.

 

베르누이분포의 확률함수

 

베르누이분포의 표기

 

확률변수 X는 성공확률이 p 인 베르누이분포를 따른다.

 

베르누이의 표기

 

베르누이분포의 평균과 분산

 

E(X)의 정의와 Var(X)의 정의를 사용하면 알 수 있다.

 

베르누이의 평균과 분산

 


이항분포


 

베르누이 실험을 n 번 독립 시행, 베르누이 실험을 n 번 동일한 조건에서 실행, 베르누이 실험의 성공확률 p 는 매번 동일하다.

 

확률변수 X 는 n 번의 실행에서 성공의 횟수

 

이항분포는 주로 n번 실행을 했을 때 몇 번의 성공을 할 것인가 그에  대한 확율을 찾을 때 주로 이항분포 확률함수를 많이 활용한다.

 

 

Rx={0,1,2, ... n}

 

0 은 X 가 n 번 실행해서 모두 실패한 경우, n 은 모든 실행이 다 성공인 경우

 

이항분포의 확률함수

 

이항분포의 확률함수

 

이항분포의 표기

 

확률변수 X는 n번의 베르누이실험 시행과 성공확률이 p인 이항분포를 따른다.

 

이항분포 표기

이항분포의 평균과 분산

 

이항분포의 평균과 분산

 

이항분포와 베르누이분포와의 관계

 

이항분포의 평균과 분산은 각각의 베르누이 분포의 평균과 분산을 다 더한 것 과 같다

 


기하분포


베르누이 실험을 독립 시행, 확률변수 X 는 첫 번째 성공이 나올 때까지의 시행횟수

 

Rx={1,2, 3, ...} 

 

확률변수 X는 첫번째 성공이 나올 때까지의 시행횟수부터 나오니 Rx는 최소한 한번의 실행부터 시작 셀 수 있는 무한집합이 된다.

 

기하분포의 확률함수

 

기하분포의 확률함수

첫번째 성공이 나오기 전까지 x-1번째까지는 계속 실패를 해야함으로 f(x)는 위와 같다.

 

기하분포의 표기

 

기하분포의 표기

 

확률변수 X는 성공확률이 p인 기하분포를 따른다

 

 

기하분포의 평균과 분산

 

기하분포의 평균과 분산

 


초기하분포


전체 N 개의 개체 중에 k 개의 성공과 N-k 실패가 존재 (전체 N은 성공과 실패를 전체 합한 것이다)

확률변수 X 는 n 개체를 비복원 추출 했을 때 성공의 갯수

 

Rx={0,1,2, 3, ..., min(n, k)}

 

초기하분포의 확률함수

 

초기하분포의 확률함수

 

초기하분포의 표기

 

확률변수 X는 전체 N개, 성공 k개 있을 때 n개를 추출하는 초기하분포를 따른다. 

 

초기하분포의 표기

 

초기하분포의 평균과 분산

 

초기하분포의 평균과 분산

 

식을 통해 알 수 있는 것은 𝑛=1인 경우(하나만 뽑음)에는 성공확률이 𝑘/𝑁인 베르누이 분포와 같다.

𝑛=𝑁인 경우에는 X 는 확률변수가 아닌 상수이므로 분산은 0 이다

 

 


포아송 분포


포아송 프로세스

 

1. 서로 다른 시간 의 구간에서 일어나는 사건의 수는 독립이다
2. 사건의 발생확률 은 시간의 위치와 관계없이 동일하다
3. 사건의 발생 수는 시간의 길이에 비례 한다
4. 짧은 시간에 사건이 두 번 이상 발생하는 확률은 무시한다(동시 입장은 무시)

 

포아송 분포

 

 

실행은 포아송 프로세스를 따르며, 확률변수 X 는 시간 (0,t) 에서 사건의 발생 횟수이다.

 

Rx={1, 2, 3, ... } 

 

Rx 는 셀 수 있는 무한집합이다.

 

포아송분포의 확률함수

 

푸아송분포의 확률함수

 

람다는 푸아송 분포의 평균, t는 주어진 시간이다

 

푸아송분포의 표기

 

확률변수 X는 평균 발생건수가 λt인 포아송분포를 따른다.

 

푸아송 분포 표기

 

푸아송분포의 평균과 분산

 

푸아송 분포의 평균과 분산

 

식에서 알 수 있는건 평균과 분산이 같다는 것을 알 수 있다.

 


문제 1. 이항분포와 관련된 문제

 

새로운 수술방법을 사용할 경우 수술 성공 확률이 0.8 이다. 만약 5 명의 환자에게 적용했을 경우 질문에 답하시오

 

(1) 5 명 모두의 수술이 성공할 확률은
(2) 정확히 4 명만이 성공할 확률은
(3) 2 명보다 적은 환자가 수술에 성공할 확률은

(4) R을 이용해 문제를 반복해보아라

 

풀이)

 

1,2,3) P=0.8, n=5 이므로

 

문제 1 풀이

4) 

문제 1 풀이 2

 

 

문제 2. 이항분포 관련 문제

 

제품의 최종 조립과정에 필요한 불량품이 5% 인 부품을 납품받고 있는 회사가 있다 . 납품된 부품 중 10 개를 샘플링하여 그 중 2 개 이상의 불량품이 나타날 경우 반송처리 하기로 되어 있다

 

(1) 부품이 납품에 성공할 확률은 얼마인가?
(2) 반송될 확률은?

 

풀이)

 

1) 

 

납품이 성공할 확률은 불량품이 2개 미만일 때 납품이 성공하고 10개를 샘플링함으로써  P(X>=9 )이 되어야한다.

문제 2 풀이 1

2) 2번의 문제인 경우 실패를 물어보는 것임으로 P=(X<9)=1-P(X>=9)로 알 수 있다.  

 

 

문제 3. 기하분포에 대한 문제

 

엔진생산라인에서 만들어진 엔진의 10% 가 불량으로 판정된다
만약 생산된 엔진 중에서 임의로 선정하여 하나씩 검사를 수행할 경우 첫 불량 엔진이 세 번째 검사에서 나타날 확률은?

(R을 이용해 다시 한번 풀어봐라)

 

풀이)

 

문제 3 풀이

 

풀이 2-R을 이용)

 

R을 이용한 풀이

dgeom(3,0,1)을 적어본다.

 

문제 4. 기하분포관련 문제

 

주사위 굴리기를 6 이 나올 때까지 시행하기로 한다 . 3 번째 시행에서 6 이 나올 확률을 구하라 .
그리고 첫 6 이 나올 때까지 시행 횟수의 평균을 구하라

 

문제 4 풀이1
문제 4 풀이 2

 

문제 5. 초기하분포 관련 문제

 

한컨테이너에 대형제품 100 개가 실려 있다 . 그 중에서 5 개가 문제가 있다고 한다 . 확률변수 X 는 비복원 추출 방식으로 10 개 제품 을 뽑았을 때 포함된 불량품의 수로 정의한다


(1) 확률변수는 무슨 분포를 따르는가
(2) 샘플에 단 1 개의 불량품이 포함되어 있을 확률을 구하라
(3) 𝑃(𝑋≥2)를 구하라

 

풀이 1)

 

풀이 1

 

풀이 2)

 

풀이 2
R을 이용

 

R을 이용하면 위와 같다.

dhyper(1,5,95,10) / X, 불량품, 양품, n 

 

 

 

풀이 3)

 

풀이 3

 

 

문제 6. 초기하분포 관련 문제

 

창고에 보관되어 있는 10 대의 프린터 중 4 대가 사용불능 상태인 것으로 밝혀졌다 .
만약 5 대를 골랐을 때 모두가 사용 가능한 프린터일 확률은?

 

풀이 )

 

문제 6 풀이

 

 

문제 7. 푸아송분포 관련 문제

 

대형마켓의 고객서비스 센터에는 시간당 평균 5 명의 고객이 방문하고있다고 한다 . 방문 고객의 수는 포아송분포를 따른다고 가정한다 . 오후 2 시 ~ 4 시 사이에 고객 8 명이 고객서비스 센터를 방문할 확률을 구하라 .

 

풀이)

 

문제 7 풀이

 

R 이용

 

문제 8

 

재난대응본부에는 전화 건수가 평균 시간당 20 건인 포아송분포를 따른다고 가정한다 . 5 분 동안 전화 접속이 0 인 확률을 구하라.

 

풀이)

 

문제 8 풀이

5분이기 때문에 t가 5/60=1/12가 나옴을 유의 하자

 

 


감사의 글

 
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.


 

 


이전 진도

 

2021.09.28 - [고등 수학/확률과 통계] - 확률변수의 독립성, 상관계수-4주차 정리

 

확률변수의 독립성, 상관계수-4주차 정리

참조 문헌 1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye 2. Statistics for Management and Economics, Keller 확률변수의 독립성 확률변수 X, Y의 독립 사건 A,B..

doctorinformationgs.tistory.com

 

반응형

댓글