1 분 소요

해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.

이번에는 독립과 종속 그리고 확률과 통계의 꽃인 베이즈 정리에 대해 알려 다루도록 하겠습니다.

독립과 종속


먼저 독립 사건에 대해 다루어 보도록 하겠습니다.

독립 사건은 한마디로 한 사건의 발생이 다른 사건의 발생 확률에 영향을 주지 않는다는 겁니다.

우리가 고등학교 시간에 배웠던 것과 같은 개념이죠.

예를 들어서 우리가 집에서 커피를 마시는 것이 A라는 사건이고, 교통사고가 일어날 사건이 B라고 합시다.

그러면 이 두 사건이 서로 연관이 있을까요? 없죠

이렇게 서로 연관이 없으며, 한 사건이 발생이 다른 사건의 발생 확률에 영향을 주지 않는 사건을 독립 사건이라고 합니다.

다음은 종속 사건입니다.

종속 사건은 독립 사건과 정 반대 개념입니다.

한 사건의 발생이 다른 사건의 발생 확률에 영향을 준다는거죠.

만약 위의 예시처럼 A가 집에서 커피를 마시는거고 B가 집에서 공부를 하여 집중하는 사건이라면 A의 사건은 B에 영향을 주겠죠?

이렇게 한 사건의 발생이 다른 사건의 발생 확률에 영향을 주는 사건이 바로 종속 사건입니다.

베이즈 정리


확률과 통계의 꽃인 베이즈 정리입니다.

이 부분은 조금 깊고 길게 다루도록 하겠습니다.

먼저 베이즈 정리의 수식은 위와 같은데요, 이 수식만 보면 이해가 안되실 것 같습니다.

베이즈 정리의 핵심 개념은 사전 확률로 사후 확률을 예측(추정)할 수 있다는게 핵심입니다.

-먼저 P(A_k)는 사전확률

-P(B_k)는 원인 A_k의 결과로서 B가 관측될 확률→이는 가능도(likelihood)라고 표현이 됩니다.

-P(A_k B)는 B가 관측된 후에 해당 사건의 원인이 A_k의 가능성 즉 사후확률(posterior porbability)이라고 해봅시다.

이때 우리는 베이즈 정리를 통해서 얻을 수 있는 것은 바로 사전 확률을 통해 사후 확률을 예측할 수 있다는건데요.

이를 예시로 들어보도록 하겠습니다.

제가 시험에 만점을 맞을 확률을 P(A_k)라고 가정해봅시다. B는 그냥 데이터라고 생각 하구요.

이때 제가 시험에 맞을 확률 확률은 50프로라고 사람들이 측정했습니다.

근데 제가 모의고사를 보았더니 해당 시험이 100점이 나왔다는 데이터가 있을 때 이 데이터는 P(A_k)에 영향을 주는 데이터가 됩니다.

그리고 이 때 데이터 B에 의해 P(A_k)가 50프로 였다가 사람들이 음 .. 모의고사 만점이니까 시험도 만점 맞을 확률이 70프로겠구나 라고 생각하여 70프로라고 사람들이 측정을 하는겁니다.

이렇게 우리는 사전 확률 P(A_k)와 데이터 B를 가지고 데이터 B가 관측된 후에 원인 A_k의 가능성인 사후 확률을 측정 할 수 있다는게 바로 베이즈 정리에 핵심입니다.

그리고 이를 계산하는 공식이 위와 같지만 실제로는 거의 스스로 계산하는게 아니라 컴퓨터가 계산할 예정이니 걱정안하셔도 됩니다.

그래도 수식 자체는 외워야겟죠

그리고 핵심적으로는 사전확률과 가능도를 통해 사후확률을 표현할 수 있다.

이게 젤 중요합니다. 그리고 사전확률은 정해진게 아니라 사실 때려 맞추는 그냥 예상하는 확률입니다.

댓글남기기