메타코드 통계 기초의 모든 것 2강_통계량(4)
해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.
이번에는 확률 변수와 분포에 대해 조금 다루어 보도록 하겠습니다.
확률 변수와 분포는 굉장히 종류가 많으며 해당 종류에 따라서, 어떻게 분류하고 분석할지가 결정이 되는 요소 이기 때문에 다루도록 하겠습니다.
확률변수
먼저 확률 변수 입니다.
확률 변수는 위의 사진에서는 표본 공간에서 정의된 실수값 함수라고 되어있습니다.
이렇게 표현하면 너무나도 어렵죠?
그냥 직관적으로 표현하자면 실수 값을 가지는 변수(함수)라고 생각하시면 편한합니다.
이 확률 변수는 실수가 아니면 확률분포함수를 정의할 수 없다는 것이 가장 큰 특징이기 때문에 이러한 특징은 꼭 알고 계셔야합니다.
다음은 확률분포입니다.
확률분포는 확률변수의 값과, 확률을 대응시켜 표, 그래프,함수로 표현한 것인데요.
확률 변수는 위에서 뭐라고 다루었죠?
실수 값을 가지는 변수(함수)라고 다루었습니다.
그렇기 때문에 이 실수 값을 가지는 확률 변수들을 표나 그래프, 혹은 함수로 표현 한 것이 확률분포입니다.
이산/연속확률변수
우리를 괴롭히며 많이 햇갈리게 하는 용어인 이산확률변수가 나왔습니다.
이산확률변수는 이산표본공간에서 정의된 확률변수의 값이 유한 혹은 셀 수 있는 확률변수 입니다.
쉽게 표현하자면 셀 수 있는 확률 변수인 것 입니다.
그리고 셀 수 있는 확률변수이기 때문에 각 확률을 대응시킬 수 있으며,
이렇게 이산확률변수의 값에 각 확률을 대응 시킨 함수가 확률질량함수입니다.
이번에 가장 핵심적인 확률변수인 바로 연속 확률변수입니다.
연속확률 변수는 특정 구간 내에 모든 값을 취하는 확률변수입니다.
위의 이산확률변수 처럼 특정값으로 셀 수 있는 확률 변수가 아닌, 특정 구간내에 있는 모든 값이 확률변수가 될 수 있습니다.
그렇기 때문에 특정 구간내에 있는 값들은 우리가 셀 수도 없이 많기 때문에 무한개인 것 입니다.
그리고 만약 연속확률변수의 확률 구하고 싶다면 구하고 싶은 구간을 적분하여 구할 수 있습니다.
다음은 연속확률변수의 특징에 대해 다루도록 하겠습니다.
1.대표적으로 연속확률변수를 따르는 분포는 정규분포가 있습니다.
2.연속확률변수는 값이 특정이 되어 버려지면 확률이 0이 됩니다.
ex)P(X=170)=0
-이 부분에서 왜? 라고 생각하실 겁니다.
왜냐하면 연속확률변수는 취할수 있는 값이 무한개이기 때문에, 특정값을 취하여 해당 값의 확률을 구한다면 0.000001이런 값이 되기 때문에 거의 0에 수렴하게 됩니다.
이렇게 간단하게 확률변수에 대해 다루어 보았습니다.
다음은 기대값에 대해 다루어 보도록 하겠습니다.
댓글남기기