참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller
확률분포(Distribution)란?
확률변수가 특정한 값을 가질 확률을 나타내는 함수이며 그러한 값들이 흩어져 있는 것
베르누이 분포
베르누이 분포에는 아래의 과정을 다루게 된다.(다른 분포도 거의 비슷한 과정으로 진행이 된다.)
1. 베르누이 프로세스
2. 베르누이 분포
- 베르누이분포의 확률함수
- 베르누이분포의 표기
- 베르누이분포의 평균과 분산
베르누이 프로세스
1. 베르누이 실험은 결과가 성공 또는 실패로 분류된다
2. 베르누이 실험을 n 번 동일한 조건에서 실행한다
3. 베르누이 실험의 성공확률 p 는 모든 실행에서 동일하다
4. 모든 베르누이 실험은 독립적이다
베르누이분포
베르누이 실험을 한 번만 시행한다는 의미이며, 성공과 실패가 각각 다르게 정의된다.
베르누이분포의 확률함수
성공(X=1), 실패(X=0)일때 Rx={0,1}, 확률함수는 아래와 같이 표기한다.
베르누이분포의 표기
확률변수 X는 성공확률이 p 인 베르누이분포를 따른다.
베르누이분포의 평균과 분산
E(X)의 정의와 Var(X)의 정의를 사용하면 알 수 있다.
이항분포
베르누이 실험을 n 번 독립 시행, 베르누이 실험을 n 번 동일한 조건에서 실행, 베르누이 실험의 성공확률 p 는 매번 동일하다.
확률변수 X 는 n 번의 실행에서 성공의 횟수
이항분포는 주로 n번 실행을 했을 때 몇 번의 성공을 할 것인가 그에 대한 확율을 찾을 때 주로 이항분포 확률함수를 많이 활용한다.
Rx={0,1,2, ... n}
0 은 X 가 n 번 실행해서 모두 실패한 경우, n 은 모든 실행이 다 성공인 경우
이항분포의 확률함수
이항분포의 표기
확률변수 X는 n번의 베르누이실험 시행과 성공확률이 p인 이항분포를 따른다.
이항분포의 평균과 분산
이항분포와 베르누이분포와의 관계
이항분포의 평균과 분산은 각각의 베르누이 분포의 평균과 분산을 다 더한 것 과 같다
기하분포
베르누이 실험을 독립 시행, 확률변수 X 는 첫 번째 성공이 나올 때까지의 시행횟수
Rx={1,2, 3, ...}
확률변수 X는 첫번째 성공이 나올 때까지의 시행횟수부터 나오니 Rx는 최소한 한번의 실행부터 시작 셀 수 있는 무한집합이 된다.
기하분포의 확률함수
첫번째 성공이 나오기 전까지 x-1번째까지는 계속 실패를 해야함으로 f(x)는 위와 같다.
기하분포의 표기
확률변수 X는 성공확률이 p인 기하분포를 따른다
기하분포의 평균과 분산
초기하분포
전체 N 개의 개체 중에 k 개의 성공과 N-k 실패가 존재 (전체 N은 성공과 실패를 전체 합한 것이다)
확률변수 X 는 n 개체를 비복원 추출 했을 때 성공의 갯수
Rx={0,1,2, 3, ..., min(n, k)}
초기하분포의 확률함수
초기하분포의 표기
확률변수 X는 전체 N개, 성공 k개 있을 때 n개를 추출하는 초기하분포를 따른다.
초기하분포의 평균과 분산
식을 통해 알 수 있는 것은 𝑛=1인 경우(하나만 뽑음)에는 성공확률이 𝑘/𝑁인 베르누이 분포와 같다.
𝑛=𝑁인 경우에는 X 는 확률변수가 아닌 상수이므로 분산은 0 이다
포아송 분포
포아송 프로세스
1. 서로 다른 시간 의 구간에서 일어나는 사건의 수는 독립이다
2. 사건의 발생확률 은 시간의 위치와 관계없이 동일하다
3. 사건의 발생 수는 시간의 길이에 비례 한다
4. 짧은 시간에 사건이 두 번 이상 발생하는 확률은 무시한다(동시 입장은 무시)
포아송 분포
실행은 포아송 프로세스를 따르며, 확률변수 X 는 시간 (0,t) 에서 사건의 발생 횟수이다.
Rx={1, 2, 3, ... }
Rx 는 셀 수 있는 무한집합이다.
포아송분포의 확률함수
람다는 푸아송 분포의 평균, t는 주어진 시간이다
푸아송분포의 표기
확률변수 X는 평균 발생건수가 λt인 포아송분포를 따른다.
푸아송분포의 평균과 분산
식에서 알 수 있는건 평균과 분산이 같다는 것을 알 수 있다.
문제 1. 이항분포와 관련된 문제
새로운 수술방법을 사용할 경우 수술 성공 확률이 0.8 이다. 만약 5 명의 환자에게 적용했을 경우 질문에 답하시오
(1) 5 명 모두의 수술이 성공할 확률은
(2) 정확히 4 명만이 성공할 확률은
(3) 2 명보다 적은 환자가 수술에 성공할 확률은
(4) R을 이용해 문제를 반복해보아라
풀이)
1,2,3) P=0.8, n=5 이므로
4)
문제 2. 이항분포 관련 문제
제품의 최종 조립과정에 필요한 불량품이 5% 인 부품을 납품받고 있는 회사가 있다 . 납품된 부품 중 10 개를 샘플링하여 그 중 2 개 이상의 불량품이 나타날 경우 반송처리 하기로 되어 있다
(1) 부품이 납품에 성공할 확률은 얼마인가?
(2) 반송될 확률은?
풀이)
1)
납품이 성공할 확률은 불량품이 2개 미만일 때 납품이 성공하고 10개를 샘플링함으로써 P(X>=9 )이 되어야한다.
2) 2번의 문제인 경우 실패를 물어보는 것임으로 P=(X<9)=1-P(X>=9)로 알 수 있다.
문제 3. 기하분포에 대한 문제
엔진생산라인에서 만들어진 엔진의 10% 가 불량으로 판정된다
만약 생산된 엔진 중에서 임의로 선정하여 하나씩 검사를 수행할 경우 첫 불량 엔진이 세 번째 검사에서 나타날 확률은?
(R을 이용해 다시 한번 풀어봐라)
풀이)
풀이 2-R을 이용)
dgeom(3,0,1)을 적어본다.
문제 4. 기하분포관련 문제
주사위 굴리기를 6 이 나올 때까지 시행하기로 한다 . 3 번째 시행에서 6 이 나올 확률을 구하라 .
그리고 첫 6 이 나올 때까지 시행 횟수의 평균을 구하라
문제 5. 초기하분포 관련 문제
한컨테이너에 대형제품 100 개가 실려 있다 . 그 중에서 5 개가 문제가 있다고 한다 . 확률변수 X 는 비복원 추출 방식으로 10 개 제품 을 뽑았을 때 포함된 불량품의 수로 정의한다
(1) 확률변수는 무슨 분포를 따르는가
(2) 샘플에 단 1 개의 불량품이 포함되어 있을 확률을 구하라
(3) 𝑃(𝑋≥2)를 구하라
풀이 1)
풀이 2)
R을 이용하면 위와 같다.
dhyper(1,5,95,10) / X, 불량품, 양품, n
풀이 3)
문제 6. 초기하분포 관련 문제
창고에 보관되어 있는 10 대의 프린터 중 4 대가 사용불능 상태인 것으로 밝혀졌다 .
만약 5 대를 골랐을 때 모두가 사용 가능한 프린터일 확률은?
풀이 )
문제 7. 푸아송분포 관련 문제
대형마켓의 고객서비스 센터에는 시간당 평균 5 명의 고객이 방문하고있다고 한다 . 방문 고객의 수는 포아송분포를 따른다고 가정한다 . 오후 2 시 ~ 4 시 사이에 고객 8 명이 고객서비스 센터를 방문할 확률을 구하라 .
풀이)
문제 8
재난대응본부에는 전화 건수가 평균 시간당 20 건인 포아송분포를 따른다고 가정한다 . 5 분 동안 전화 접속이 0 인 확률을 구하라.
풀이)
5분이기 때문에 t가 5/60=1/12가 나옴을 유의 하자
감사의 글
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.
이전 진도
2021.09.28 - [고등 수학/확률과 통계] - 확률변수의 독립성, 상관계수-4주차 정리
'고등 수학 > 확률과 통계 개인학습 노트' 카테고리의 다른 글
모집단과 표본의 확률분포, 통계량, 표본평균의 분포, 표본분산의 분포 -6주차 정리 (2) | 2021.10.12 |
---|---|
연속형 확률분포, 중심극한정리(균일분포, 지수분포, 정규분포)-5주차 정리 (0) | 2021.10.01 |
확률변수의 독립성, 상관계수-4주차 정리 (0) | 2021.09.28 |
이변량 확률변수, 결합확률함수, 결합밀도함수, 주변확률함수, 공분산 - 4주차 정리 (0) | 2021.09.27 |
분포함수, 확류 변수의 평균과 분산, 함수 - 3주차 정리 (0) | 2021.09.22 |
댓글