1 분 소요

해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.

이번 시간은 연속확률분포 중에서 표본 분포를 다루어 보도록 하겠습니다.

표본 분포(Sampling Distribution)


표본분표는 모집단에서 일정한 크기로 뽑을 수 있는 표본! 이 표본이라는 단어가 굉장히 중요 합니다.

그 모든 표본의 통계량의 확률분포.

여기서 표본분포의 핵심적인게 있는데요.

표본분포는 추정과 검정할 때 반드시 필요한 분포이며, 표본분포는 통계량의 확률 분포입니다.

여기서 중요한 단어가 통계량 입니다.

예를 들어 1000명의 샘플을 뽑아 키를 측정한다고 해봅시다.

이 때 여러 번 샘플을 뽑게 된다면, 샘플의 평균으로 분포를 만들 수 있습니다.

그리고 이럴 때 사용하는게 바로 표본 분포 입니다.

다음은 표본 평균의 평균과 표준편차 입니다.

이 표본평균은 통계량 중에 하나 입니다.

그렇기 때문에 표본평균의 평균과 표준편차는 그냥 X의 평균과 표준편차가 됩니다.

그리고 모평균과 모표준편차는 모두 동일한 모집단에서 나온 애들이기 때문에 모두 같습니다.

그렇기 때문에 모평균은 표본평균이 되는 것 입니다.

그리고 variance 는 표준편차의 제곱을 n만큼 나누어준 값이 되겟죠

중심극한정리


중심극한정리 굉장히 중요합니다.

이는 CLT라고 많이 다들 들어 보셧을 겁니다

먼저 정의부터 봅시다.

평균이 뮤, 표준편차가 시그마인 임의의 모집단으로부터 크기 n인 표본에서의 표본평균은 n이 크면 근사적으로 평균이 뮤이고, 분산이 sigma^2/n인 정규분포를 따른다고 합니다.

여기서 중요한 것은 n이 크면 이라는 문구입니다.

n 이 충분히 클때! 표본에서의 표본 평균은 근사적으로 평균이 뮤이고 분산이 sigma^2/n이라는 것 입니다. 그리고 제일 중요한 것은 정규분포를 따른다는 것 입니다.

왜 이게 중요한 걸까요? 이게 모집단이 뭔지도 모르지만, 이러한 조건에서 정규분포를 따르기에 분포를 알 수 있다는 것 입니다.

그리고 이 데이터가 정규분포를 따른다는게 아니라 표본 평균이 정규분포를 따른다는 것을 알아야 합니다.

예를 들어 키에 대한 데이터가 있다면, 이 데이터가 정규 분포가 아니라 표본을 뽑았을 때의 키의 평균들이 정균분포를 따른다는 것 입니다.

또한 모집단이 정규분포라면 표본평균은 표본 개수와 상관없이 항상 정규분포를 따른다는 특징이 있습니다.

그리고 위의 조건은 아래와 같이 쓸 수 있습니다.

댓글남기기