메타코드 통계 기초의 모든 것 4강(4)-카이제곱분포
해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.
이번에는 카이제곱 분포에 대해 다루어보도록 하겠습니다.
카이제곱(x^2)분포
카이제곱 분포란 표본분산과 관련된 분포 입니다.
그렇기에 표본 분포에서 나온 애들입니다.
그리고 표본분산은 통계량이기 때문에 통계량과 관련된 분포입니다.
그리고 이때 확률변수 Z_1은 정규분포를 따르는 확률변수를 정규화 한 애들입니다.
그리고 이 확률변수가 각각 표준정규분포를 따르고 독립일 때 그들의 제곱합은 자유도가 k인 카이제곱 분포를 따릅니다.
이 때 이 자유도는 어디서 따라오는지 알아야하는데, 이 때 이 자유도는 확률변수의 개수를 따라옵니다.
그럼 이거는 어디서 어떨 때 쓰는걸까요?
바로 표본 분산은 알지만 모분산을 모를 때 이 모분산을 추정할 때 사용하는 분포입니다.
그리고 이 분포도의 크기는 표본크기가 클 수록 한쪽으로 그래프가 치우쳐지는 현상이 적어집니다.
왜냐하면 카이제곱 분포는 일반적으로 위의 그림과 같이 한쪽으로 치우쳐져 있습니다.
그리고 항상 0이상입니다. 왜냐하면 확률변수의 제곱값을 가지기 때문입니다.
그리고 만약에 표본크기가 충분히 크게 된다면 정규분포의 모양을 가지게 됩니다.
카이제곱분포도 굉장히 중요하지만 지금 깊게 다루기 보다는 뒤에 검증과 추정 쪽에서 더 깊게 다루도록 하겠습니다.
다음은 카이제곱 분포의 특징입니다.
ㅁ 카이제곱 분포는 다음과 같습니다.
1.단봉분포
단봉이 뭘까요? 바로 봉이 하나 입니다. 낙타 모양처럼 봉이 두 개가 아니라는 것 입니다.
2.오른쪽에 꼬리를 가집니다.
위의 예시 그림을 보면 알 수가 있죠?
3.항상 양수값을 가짐
확률변수의 제곱을 다루기 때문에 항상 양수값을 가지는 것 입니다.
4.자유도가 커지면 정규분포에 가까워짐
자유도는 확률변수의 개수를 따르며, 확률변수는 표준정규분포를 따르는 애들이기 때문에 확률변수의 개수가 많아진다.
즉, 자유도가 커진다는 것은, 표본이 많아진다는 의미가 됩니다.
5.모분산 추정 및 검정에 활용
6.적합성,동질성,독립성 검정 등에 사용
이거는 수치형 자료가 아닌 범주형 자료를 검정할 때 사용합니다.
댓글남기기