메타코드 통계 기초의 모든 것 2강_통계량(5)
해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.
이번에는 기대값, 분산과 표준편차에 대해 다루도록 하겠습니다.
기대값(Expectation)
먼저 기대값(Expectation value)에 대해 다루어 보도록 하겠습니다.
기대값은 확률변수의 모든 값의 평균 입니다. 그리고 기대할 수 있는 값이라고도 표현하기도 하죠.
그리고 기대값을 구하는 공식은 위의 사진과 같습니다.
그리고 확률변수의 종류에 따라 구하는 공식이 다릅니다.
우리가 앞서 다루었던 이산확률변수와 연속확률변수의 기대값을 구하는 공식은 서로 다릅니다.
왜냐하면 이산확률변수는 애초에 셀 수 있는 확률 변수이며 각 확률변수에 확률 부여가 가능했죠.
하지만 연속확률변수는 셀 수 없으며 확률을 구하고 싶다면 특정 구간을 적분해야 확률을 구할 수 있기 때문에 서로 기대값의 공식이 다른 것 입니다.
다음은 기대값의 성질입니다.
기대값의 성질은 딱 하나만 생각하면 됩니다.
기대값은 바로 상수에 영향을 받지 않는다는 겁니다.
위의 사진을 보시면 기대값은 상수에 대하여 영향을 1도 받지 않는 것을 알 수 있습니다.
분산과 표준편차
다음은 분산과 표준편차입니다.
분산의 수식은 위와 같습니다.
위의 수식에서 각 symbol에 대한 의미를 먼저 설명드릴려고 합니다.
먼저 E는 Expectation 기대값입니다.
그리고 X는 randomvariable 즉 확률변수입니다.
그 다음 mu는 E(X) random variable X의 Expectation 입니다.
그리고 확률 변수가 이산확률변수냐 연속확률변수냐에 따라 수식은 달라지니 꼭 확인하시길 바랍니다.
참고로 연속확률변수에서 f(x)는 pdf입니다.
다음은 표준편차 압니다.
표준편차는 여러분이 고등학교 때 배웠던 것과 같이 분산에 루트만 씌워주면 끝입니다.
다음은 분산과 표준편차의 성질입니다.
분산과 표준편차의 성질
다음은 분산과 표준편차의 성질 입니다.
이 부분에서 핵심은 먼저 +-상수를 할때는 결국 상수 값이 사라진다는 것 입니다.
여기서 상수를 더하거나 뺀다는 의미는 정규분포에서 중심값만 이동이 된 거지 정규분포의 모양이나 형태, 산포도는 전혀 바뀌지 않았기 때문입니다.
그 외에는 X와 상수를 곱했을 때는 제곱해서 나온다는 것만 인지하시면 됩니다.
표준편차도 똑같습니다. 상수를 더하거나 뺄 경우에는 결국 상수값이 사라지게 됩니다.
그리고 상수를 곱했을 때는 분산과 달리 제곱해서 나오는게 아니라 그대로 나옵니다.
왜냐하면 표준편차는 분산에 루트를 씌운 값이기 때문에 나올때도 루트를 통과해 나오기 때문에, 그대로 제곱이 사라져서 나오겟죠.
댓글남기기