본문 바로가기
고등 수학/확률과 통계 개인학습 노트

조건부 확률과 베이즈 정리 - 2주차 정리

by 배고픈 대학원생 2021. 9. 14.
반응형

이전 진도

 

2021.09.11 - [고등 수학/확률과 통계] - 확률의 정의 - 2주차 정리

 

확률의 정의 - 2주차 정리

참조 문헌 1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye 2. Statistics for Management and Economics, Keller 이 포스팅은 기존의 확률 실험과 이어진 내용입니..

doctorinformationgs.tistory.com


참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller

 

조건부 확률 (conditional probability)

 

사건 A 가 일어났다는 조건 하에 사상 B 가 발생할 확률 기호는 𝑃(𝐵|𝐴)를 사용

 

식 1. 조건부 확률 공식

P(B)는 조건부 확률로 표기해보면 P(B|S)는 사건 B의 확률을 구할 때 관심의 대상이 표본공간(S)이였다 S에서 B가 발생할 확률을 보았기 때문에 아래 사진 처럼 표기한다.

 

하지만 P(B|A)에서는 표본공간(S)에서 사건 A로 축소 되었기 때문에 그 조건하에서 사건 B의 발생확률이다.

 


이해를 돕기 위한 예제 1.

 

50 명이 수강하는 과목 A 라는 수업에는 안경을 쓴 학생의 비율이 70%, 3 학년 학생의 비율이 35%, 그리고 안경을 쓴 3 학년 학생의 비율은 20% 이다 . 한 학생을 임의로 불렀을 때 그 학생이 안경을 쓴 학생이다 . 그렇다면 이 사람이 3 학년 학생일 확률P(A|B)을 구해보자

 

3학년 학생을 "A" 안경쓴 학생을 "B"라고 가정하자

 

P(A|B)=P(AB)/P(B)=0.35/0.7 

 

전체 학년에서의 안경을 쓴 학생의 비율이 0.7이며, 해당되는 교집합 즉 안경쓴 학생의 비율이 0.35임으로 P(AB)는 0.35이다. 그 중에서 전체 안경 쓴 학생으로 나눈 비율로 계산한다.

 

예제 2. (비복원 추출법에 관한 문제)

 

상자에 8 개의 white chip 과 12 개의 black chip 이 들어 있다 . 랜덤으로 한 개를 뽑아서 색깔을 확인한 후 상자에 넣지 않고 따로 보관한다(비복원 추출)  이때 결과가 WBBWB 가 나올 확률 즉 P(WBBWB) 을 구하라.

 

풀이 )

 

W가 나올 확률은 8/20, B가 나올 확률은 12/20

 

문제에서 원하는 것은 "결과가 WBBWB 가 나올 확률 즉 P(WBBWB)" 이므로

 

처음 W가 나올 확률은 8/20 Chip을 확인하고 복원하지 않음으로 전체 개수는 19로 감소(=20-1), W또한 8개에서 7개로 감소한다.

 

그 다음 순서로 B가 나올 확률은 12/19 ... 전체 개수가 감소되었기 때문이다. 이것도 마찬가지로 확인하고 복원하지 않았음으로 19 -1=18개의 전체 개수가 되며 B는 12개에서 11개로 감소한다.

WBBWB로 계속 진행한 식의 결과는 아래와 같다

 

(8/20)*(12/19)*(11/18)*(7/17)*(10/16)=0.04 가 된다.

 

*복원 추출 With Replacement(상자에 여러공이 있을때 공을 빼고 확인하고 다시 넣는 것)

*비 복원 추출 (상자에 여러공이 있을 때 공을 빼고 확인하면 공을 다시 넣지 않는 것)


사건의 독립

 

주사위를 하나를 처음 굴렸는데 3이 나오고 같은 주사위를 두번 굴릴때의 결과는 첫번째 결과와 아무런 관련이 없다.

 

위와 같은 사건 A(처음 굴린 값) B(두번 째 굴린 값)은 서로 독립이라고 말한다. 즉 AB가 서로 영향을 주고 받지 않는다 즉 B라는 조건하에서 사건에서 A가 일어날 확률은 즉 P(A|B)=P(A) 또는 P(B|A)=P(B)

 

2개의 사건이 주어진 경우

 

사건 A 와 B 가 독립이라면 조건부 확률 공식을 이용하면

 

𝑃(𝐴│𝐵)=(𝑃(𝐴𝐵))/(𝑃(𝐵))=𝑃(𝐴)이므로 𝑃(𝐴𝐵)=𝑃(𝐴)𝑃(𝐵)가 성립

𝑃(𝐴𝐵)=𝑃(𝐴)𝑃(𝐵)이면 사상 A 와 사상 B 는 서로 독립

 

2개의 사건이 있을 때
이것들이 독립이지 않다면 조건부 확률의 계산이 필요 𝑃(𝐴)>𝟎,𝑃(𝐵)>𝟎이면 𝑃(𝐴∩𝐵)=𝑃(𝐴)𝑃(𝐵│𝐴)=𝑃(𝐵)𝑃(𝐴│𝐵)

 

 

3개 사건의 독립

 

사건 ABC의 교집합 발생 확률

𝑃(𝐴𝐵C)=P(A)𝑃(B│A)𝑃(C│AB)

 

사건 ABC가 독립일 때 교집합 발생 확률

P(ABC)=P(A)P(B)P(C)

 

사건 ABC가 상호 독립이 되기 위한 조건

 

4개 사건의 독립

 

사건 ABCD의 교집합 발생확률

P=(ABCD)=P(A)𝑃(B│A)𝑃(C│AB)𝑃(D│ABC)

 

사건 ABCD가 독립일 때 교집합 발생확률

P(ABCD)=P(A)P(B)P(C)P(D)

 

사건 ABCD가 상호 독립이 되기 위한 조건

 

순서 1. 사건 두 개를 선택하여 등식 성립 확인
순서 2. 사건 세 개를 선택하여 등식 성립 확인
순서 3. 사건 네 개를 선택하여 등식 성립 확인

 


이해를 돕기 위한 예시 1.

 

한 공장의 라인은 4 개의 부품생산 라인이 병렬로 연결되어 있어 적어도 하나의 부품생산라인만 작동을 하면 이 공정의 라인은 정상적으로 가동을 한다. 각 부품생산 중에 고장이 발생하는 사상은 독립적이고 각 부품생산 라인이 고장 날 확률은 0.10 이라고 할 때 이 공장의 라인이 정상적으로 가동할 확률은 얼마인가?

풀이 )

 

병렬라인인 경우 4개의 라인이 고장나지 않는 이상 생산 라인은 항상 운영된다 따라서 공장이 멈추는 확률만 구하게 되면 답을 알 수 있다.

 

P(정상가동)1-P(가동 하지 않는 것) = 1-(0.1)^4 = 0.9999

 

예시 2.

 

다음과 같은 표본공간 S 가 정의되었다 . x,y,z 축 값들이다 .

사건 A 는 x 축이 1 인 원소를 갖는다 .
사건 B 는 y 축이 1 인 원소를 갖는다 .
사건 C 는 z 축이 1 인 원소를 갖는다

주어진 표본공간은 아래와 같다.
𝑆={(𝟏,𝟎,𝟎),(𝟎,𝟏,𝟎),(𝟎,𝟎,𝟏),(𝟏,𝟏,𝟏)}

𝐴={(1,0,0),(1,1,1)} 𝐵={(0,1,0),(1,1,1)} 𝐶={(0,0,1),(1,1,1)}  ... 각 XYZ축에서 원소를 갖는 확률

𝑃(𝐴)=1/2, 𝑃(𝐵)=1/2, 𝑃(𝐶)=1/2

AB=BC=AC={(1,1,1)}

𝑃(𝐴𝐵)=1/4=𝑃(𝐴)𝑃(𝐵)
𝑃(𝐵C)=1/4=𝑃(B)𝑃(C)
𝑃(𝐴C)=1/4=𝑃(𝐴)𝑃(C)

P(ABC)=1/4이지만 P(A)P(B)P(C)=1/8이라서 아니다 따라서 서로 독립이라고 할 수 없다.


사건들의 관계

 

아래 사진처럼 표본공간 S 가 A1 A2 A3 …. An 으로분할이 되어 있다. 즉 , A1 A2 A3는 각각 상호배타관계이다.
A1 U A2 U A3 U … U An 했을 때 표본공간 S 가 됨

 

따라서 A1 A2 A3 …. An은 사건 표본공간S 를 분할한다.

사건들의 관계를 이해하기 위한 것

아래 사진처럼 사건 B가 발생할 확률은 아래와 같다.

각각의 A1,2,3 ... n까지가 서로 상호배타이기 때문에 사건 b와 각각의 a1,2,3 또한 상호배타이다.

 

𝑃(𝐵)=𝑃(𝐴1𝐵)+𝑃(𝐴2𝐵)+⋅⋅⋅+𝑃(𝐴𝑛𝐵)

      =𝑃(𝐵|𝐴1)𝑃(𝐴1)+𝑃(𝐵|𝐴2)𝑃(𝐴2)+⋅⋅⋅+𝑃(𝐵|𝐴𝑛)𝑃(𝐴𝑛)

그림

 

베이즈 정리(Bayes’ theorem)

 

위 사건들의 관계를 활용하면 베이즈 정리를 나타낼 수 있다.

 

만약 A1 A2 A 3 …. A n 이 표본공간을 분할하면

 

베이즈 정리 식

 


이해를 돕기 위한 예제

 

모기업은 협력회사 A,B,C 로 부터 각 30%, 30%, 40% 의 동일 부품을 공급받고 있다.
A회사와 B 회사의 불량율은 0.01, C 회사의 불량율은 0.005이다. 한 부품을 검사했더니 불량으로 판명되었다.

이 부품을 A 회사가 제조했을 확률을 구하라 ---> 베이즈 정리를 사용하면 편하다.

 

P(A)=30% .... 0.01=P(D|A) .... D는 불량품

P(B)=30% .... 0.01=P(D|B)

P(C)=40% .... 0.005=P(D|C)

 

결국 문제는 불량품이 A가 만들었을 확률을 구하는 것이다. 다시 말해서 P(A|D)를 구하는 것

 

P(A|D)는 어떻게 구할까? --> 베이즈 정리

 

P(A|D)=P(AD)/P(D)

 

P(D)=P(D|A)P(A)+P(D|B)P(B)+P(D|C)P(C) ... 불량품이 나올 확률은 A,B,C 회사가 다 있으므로 각각 회사가 만들고 불량인 확률을 구하는 것이다.

 

계산해보면 P(D)=0.08이다

 

P(AD)=P(D|A)P(A)=0.01*0.3=0.003



감사의 글

 
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.


 

반응형

댓글