1 분 소요

해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.

이번에는 이산확률분포-이항분포와 포아송 분포에 대해 다루어보도록 하겠습니다.

이산확률분포: 이항분포


먼저 이항 분포에서 가장 핵심인 베르누이 시행을 다루어 보도록 하겠습니다.

베르누이 시행 먼가 이름은 어려워 보이지만, 사실 사상이 두 개뿐인 시행입니다.

즉 이진 분류 binary classification과 같은 개념인데요.

0아니면 1, 성공아니면 실패 이런 것과 같은 개념입니다.

즉 결과 값이 2개밖에 없는 시행인거죠.

그렇기 때문에 각 시행에서 성공확률과 실패확률의 합은 당연히 1 되겠죠.

그리고 각 시행은 서로 독립적으로 시행이 됩니다.

그리고 이러한 베르누이 시행은 n번 독립 시행했을 때의 확률변수 x의 분포는 이항분포가 되는겁니다.

즉, 이항분포는 베르누이 분포를 여러번 반복한 분포인 겁니다.

예시를 들어보도록 하겠습니다.

예를 들어 코인을 던져서 앞면이 나오는 경우 0 뒷면이 나오는 경우 1로 확률변수를 정의 하였을 때

이때 이를 표로 나타내면 아래와 같이 적용이 됩니다.

그리고 이 때 확률변수 X의 평균(기댓값):p, 분산은 p(1-p)가 됩니다.

베르누이는 너무 쉬운 개념이니 이렇게 짚고 넘어 가도록 하겠습니다.

이항확률분포


다음은 이항확률분포입니다.

이항확률분포는 위에서 말했다싶이 베르누이 시행을 여러 번 반복하여 특정한 횟수의 성공/실패가 나타날 확률을 분포로 나타낸 것 입니다.

다음은 이항확률분포의 확률질량함수 PMF에 대한 수식을 알아봅시다.

수식이 조금 복잡해 보이지만 이 수식하나만 외우면 괜찮아요.

n은 시행횟수, x는 성공한 횟수 예를 들면 동전을 던졌을 때 앞면이 나온 횟수, p는 성공확률을 의미합니다.

기댓값:np

분산: np(1-p)이 됩니다.

근데 뭐 어떤 분포일 때 기댓값과 분산을 굳이 암기할 필요는 없어 보입니다.

\[기댓값:\Sigma xf(x) \\ 분산: E(X^)-\mu^2\]

항상 그렇듯이 이 공식을 알고 있으면 어떤 확률분포든 간에 똑같이 적용할 수 있습니다.

그리고 이는 X~B(n,p)라고 표현을 합니다.

무슨 의미냐 X는 이항분포를 따른다. 이 확률 분포의 모수인 n,p를 따른다는 겁니다.

포아송 분포


이번에는 확률과 통계의 꽃인 포아송 분포입니다.

포아송 분포는 단위시간, 단위공간 내에서 발생하는 사건의 횟수를 확률변수 X라고 할 때라는 문장인데요.

이게 굉장히 중요합니다.

왜냐하면 여기서 단위시간 단위 공간이라는 것은 1시간, 1제곱미터와 같은 단위시간이나 단위공간이며, 이 단위공간과 단위시간내에서 발생하는 사건을 나타냅니다.

그래서 이 X는 lambda를 모수로 갖는 포아송 분포를 따릅니다.

그리고 포아송분포의 확률함수는 위의 수식을 따릅니다.

기댓값과 분산은 똑같이 lambda입니다.

여기서 중요한거는 우리가 데이터를 다룰 때 단위 시간, 단위 공간이라는 제약이 되어있는 조건에서 발생한 사건들을 다루게 된다면 포아송 분포를 사용해야 한다는 것이 핵심입니다.

다음은 예제를 풀어 보도록 하겠습니다.

댓글남기기