확률질량함수(PMF)와 확률밀도함수(PDF)
이번에는 확률변수의 유형에 대해 알아보도록 하겠습니다.
확률질량함수(probability mass function)
흔히 PMF라고 불리는 확률질량함수(probability mass function)에 대해 알아보도록 합시다.
우리가 앞에서 언급한 이산확률변수를 잠깐 복습하고 가도록 하겠습니다.
이산확률변수는 확률변수가 가질 수 있는 값들이 무한 수열 혹은 유한 수열로 수열을 이루는 경우 이산확률변수라고 하였습니다.
확률질량함수는 이산확률변수에서 특정 값에 대한 확률을 나타내는 함수입니다.
그리고 이 확률질량함수는 아래와 같이 정의가 됩니다.
\[p(a)=P(X=a)\]확률질량함수 p(a)는 많아야 셀 수 있는 개수의 a의 값에 대해 양이 됩니다.
즉, X가 x1, x2, … 등의 값들 중 하나를 가져야 한다면, 다음과 같이 쓸 수 있습니다.
\[p(x_i)>0, \,\,\,\,\,\,\,i=1,2,...\\ p(x)=0, \,\,\,\,\,\,\text{그 외의 모든 x에 대해}\]X는 xi 중 한 값을 가져야 하므로 다음 식이 성립함을 알 수 있습니다
\[\sum_{i=1}^\infty p(x_i)=1\]이를 이용하여 간단한 예제를 풀어보도록 합시다.
1,2,3 중의 한 값을 갖는 확률변수 X가 있고, 다음과 같은 사실이 알려져 있다고 하자.
\[p(1)=\frac{1}{2}\,\,\,\,\,\text{그리고}\,\,\,\,\,p(2)=\frac{1}{3}\]p(1)+p(2)+p(3)=1 이어야 하므로, 다음과 같은 결과를 얻는다.
\[p(3)=\frac{1}{3}\]누적분포함수 F는 p(x)를 이용하여 아래와 같이 표현될 수 있습니다.
\[F(a)=\sum_{x}^\infty p(x_i)=1\]확률밀도함수(probability density function)
다음은 확률 밀도 함수에 대해 알아보도록 하겠습니다.
확률 밀도 함수는 연속 확률 변수의 크기를 나타내는 함수입니다.
그럼 여기서 연속 확률 변수에 대해 조금 알아보고 가도록 합시다.
예를 들어 확률 변수 X=1일 때 확률은? 같은 경우 딱 떨어지는 확률 변수에서는 확률을 구할 수 있습니다. 하지만 연속 확률 변수는 그렇지 않습니다.
예를 들어 빈 페트병에 커피 500ml를 정확하게 채울 확률은? 이렇게 예시를 든다면 확률은 0에 가까운 값 입니다. 하지만 커피 450ml~500ml를 채울 확률은? 이라면 확률은 굉장히 올라갈 것이고 0에 가까운 확률이 아닐 것 입니다.
이와 같이 연속 확률 변수를 나타내는 연속 확률 분포에서 확률을 구할 때는 항상 범위로 표현 합니다.
그럼 확률 밀도 함수는 어떻게 생겼는지 혹은 어떤 특징이 있는지 알아보도록 하겠습니다.
\[P(X\in B)=\int_{B}^{} f(x)\,dx\]위의 조건을 만족하는 f(x)를 확률변수 X의 ‘확률밀도함수’라고 합니다.
연속확률변수에서의 특징은 연속확률변수에서 부등호에 붙은 등호는 의미가 없다는 것 입니다.
왜냐하면 연속확률변수는 -연속성-이라는 특징을 가지고 있기 때문에
만약 확률 변수 X의 P(1<X<3)의 확률을 구하라고 할 때 부등호의 조건상 1과 3는 포함이 되지 않지만 1.0000000000000001부터 2.999999999999는 해당 조건에 대해 만족합니다. 하지만 해당 실수를 극한을 취하면 결국에는 1과 3이 되기 때문에 부등호가 의미가 없습니다.
연속확률변수는 바로 이러한 특징을 가지고 있기 때문에 아래의 조건이 성립이 됩니다.
그렇기 때문에 확률 밀도 함수는 연속 확률 변수의 크기를 나타내는 값이 되는 것 입니다.(이러한 성질은 확률 질량 함수에도 똑같이 적용이 되며 확률 질량 함수의 경우 연속 확률 변수가 아닌 이산 확률 변수가 적용이 되는 것 뿐입니다.)
그럼 마지막으로 간단한 예제를 풀어보며 마치 도록 하겠습니다.
X가 아래와 같이 주어지는 확률 밀도 함수를 갖는 연속 확률 변수라고 하자.
1)C의 값을 구하라
2)P{X>1}를 구하라
댓글남기기