참조 문헌
1. Probability and Statistics for Engineers and Scientists , Walpole, Myers, Myers and Ye
2. Statistics for Management and Economics, Keller
확률변수의 독립성
확률변수 X, Y의 독립
사건 A,B가 독립이면 P(AB)=P(A)P(B)로 표현이 가능하며 조건부 확률 계산이 필요 없다.
확률변수 X, Y가 독립이면 f(x,y)=g(x)h(y) 이다.
어떻게 두 확률변수 X와 Y가 독립인지 알 수있을까?
결합확률함수 또는 결합밀도함수가 각각 주변확률함수 또는 주변밀도함수의 곱인지 아닌지 확인한다.
더 확장해서 X1, X2, ... , Xn이 상호 독립이면
확률변수 X, Y 독립의 특징
확률변수 X, Y가 독립이면 f(x,y)=g(x)h(y) 임을 위에서 알 수 있었음.
따라서 확률변수 X와 Y가 독립이면 Cov(X,Y)=0
Cov(X,Y)=0 이면 X와 Y가 독립일까?
답은 일방향이다. 확률변수 X 와 Y 가 독립이면 , 반드시 𝑪𝒐𝒗(𝑿,𝒀)=𝟎
그러나 𝑪𝒐𝒗(𝑿,𝒀)=𝟎는 X 와 Y 의 독립성을 보장하지 않는다.
𝑪𝒐𝒗(𝑿,𝒀)=𝟎일 때 X와 Y의 독립 판별 방법은 f(x,y)=g(x)h(y) 인지 확인해야 하며 모든 x, y에 대해 확인을 해야한다.
다음 특징으로 넘어가서 확률변수 X와 Y가 독립이면
그 이유는 𝑪𝒐𝒗(𝑿,𝒀)=𝟎 이므로 +- 𝑪𝒐𝒗(𝑿,𝒀)가 사라지기 때문이다.
여러개의 사건이 서로 독립일 때는 조건부 확률을 계산하지 않아도 되기 때문에 편리했었다. 마찬가지로 독립변수가 여러개 있을 때 서로 독립이라고 하는 조건은 여러가지 계산상 편리성를 주고 간편하기 때문에 유리하다 확률변수 2개 이상이 있을 때 서로 독립의 유무를 확인해야한다.
확률변수의 선형결합
확률변수 X 와 Y 의 선형결합 [𝑼=𝒂𝑿+𝒃𝒀]
𝐸(𝑈)=𝑎𝐸(𝑋)+𝑏𝐸(𝑌)
𝑉𝑎𝑟(𝑈)=𝑎^2*𝑉𝑎𝑟𝑋+𝑏^2*𝑉𝑎𝑟𝑌+2𝑎𝑏𝐶𝑜𝑣(𝑋,𝑌) ... 확률변수 X와 Y가 독립이면 C𝒐𝒗(𝑿,𝒀)=𝟎
만약 𝑋=𝑋1+𝑋2+⋯+𝑋𝑛이며 , 𝑋1,𝑋2,…,𝑋𝑛독립이라면
상관 계수
상관계수(correlation coefficient)는 확률변수 X의 증감에 따른 확률변수 Y의 증감 정도를 나타내는 척도이다.
Cov(X,Y)를 각각의 표준편차인 루트(Var X와 Y)로 나누어준 값이게 된다. 따라서 -1과 1 사이의 값을 가지는 것이다.
단위에 민감한 공분산의 문제점을 해결해주는 것이다.
정비례 0<𝜌_(𝑋,𝑌)<1
무상관 𝜌_(𝑋,𝑌)=0
서로 정보에 대해서 아무런 공유가 없다는 의미
반비례 −1<𝜌_(𝑋,𝑌)<0
여기서 정비례와 반비례는 𝜌_(𝑋,𝑌)가 각각 1과 -1이며 X와 Y가 100% 공유한다.
문제 1.
확률변수 (X,Y) 의 결합밀도함수는 다음과 같다
(1) E(X) 와 E(Y) 을 각각 구하여라
(2) 상관계수 𝜌𝑋,𝑌를 구하여라
풀이)
1) 먼저 g(x), h(y)를 먼저 구해야 한다
2)
g(x)와 h(y)의 곱이 같다 이 뜻은 서로 독립을 의미한다.
따라서 Cov(X,Y)=0이고 상관계수는 0이다 X,Y가 독립이기 때문에
독립이 아니라면 아래와 같은 계산과정을 거치게 된다.
문제 2.
확률변수 X 와 Y 는 서로 독립인가?
풀이
독립의 유무의 구분을 판별하기 위해 f(x,y)=g(x)h(y) 인지 확인해야한다.
문제 3.
𝑪𝒐𝒗(𝑿,𝑿+𝒀)=𝑽𝒂𝒓(𝑿)+𝑪𝒐𝒗(𝑿,𝒀)임을 증명하라
문제 4.
확률변수 (X, Y) 의 결합 확률함수는 다음과 같다
(1) 𝑪𝒐𝒗(𝑿,𝒀)를 구하라
(2) 𝑪𝒐𝒓𝒓(𝑿,𝒀)를 구하라
(3) 확률변수 X 와 Y 는 서로 독립인가
풀이
1)
위와 같이 수식을 이용해 계산을 하면
Cov(x,y)=4-4=0이 나온다.
2)
Cov(x,y)=0 이므로 상관계수도 0
3)
Cov(x,y)=4-4=0인ㄴ 사실은 두 변수가 독립이라는 것을 보장하지 못한다. 따라서 X,Y가 독립이 되려면 f(x,y)=g(x)h(y) 이여야 한다.
하지만 우리가 표에서 보았을 때 x와 y가 각각 2이일때 0임을 알았다.
f(2,2)=0 이지만 g(2)*h(2)=2/8 * 2/8 = 1/6이므로
f(2,2)는 g(2)*h(2)와 같지 않기 때문에 독립이 아니다
이전 진도
2021.09.27 - [고등 수학/확률과 통계] - 이변량 확률변수, 결합확률함수, 결합밀도함수, 주변확률함수, 공분산 - 4주차 정리
감사의 글
소정의 지식을 쌓는데에 도움이 되셨다면 광고 클릭을 하여 불쌍한 대학원 노예에게 10원의 기부를 부탁드립니다.
'고등 수학 > 확률과 통계 개인학습 노트' 카테고리의 다른 글
연속형 확률분포, 중심극한정리(균일분포, 지수분포, 정규분포)-5주차 정리 (0) | 2021.10.01 |
---|---|
이산형 확률분포(베르누이분포, 이항분포, 기하분포, 초기하분포, 푸아송분포)-5주차 정리 (0) | 2021.10.01 |
이변량 확률변수, 결합확률함수, 결합밀도함수, 주변확률함수, 공분산 - 4주차 정리 (0) | 2021.09.27 |
분포함수, 확류 변수의 평균과 분산, 함수 - 3주차 정리 (0) | 2021.09.22 |
확률 변수, 이산형 확률 변수, 연속형 확률 변수 - 3주차 정리 (0) | 2021.09.22 |
댓글