2 분 소요

이번에도 통계 용어에 대해 정리를 해보도록 하겠습니다.

해당 강의는 메타코드 기업에서 후원을 받아 수강한 뒤 해당 강의에 대해 수강한 뒤 제가 공부하여 정리하여 여러분들에게 제공해드리는 것 입니다.

최빈값(mode)


먼저 최빈값(mode)에 대해 알아보도록 합시다.

최빈값은 바로 발생빈도가 가장 높은 값입니다.

해당 데이터 표를 보게 되었을 때 해당 데이터 표에서 수량이 가장 많은 사이즈는 무엇일까요?

바로 M사이즈 입니다. 왜냐하면 모든 사이즈 중에서 수량이 가장 많기 때문이죠.

그렇기 때문에 최빈값은 사이즈 M이 됩니다.

그리고 이러한 최빈값은 위의 사진에 나와 있듯이, 극단 값에 영향을 받지 않으며, 주로 범주형 자료에 대한 대표 값입니다. 범주형 자료가 무엇이냐? 라고 물어보신다면 앞에 포스팅을 봐주세요

그리고 또한 최빈 값은 2개 이상 존재가 가능합니다

예를 들어 저 표에서 사이즈 S의 수량이 25개이며, M사이즈도 수량이 25개면 최빈값은 S와 M이 됩니다.

중앙값(median)


다음은 중앙값(median)입니다.

중앙값 즉 median이라는 용어는 논문이나 공부를 하실 때 자주 나오는 용어이니 꼭 기억해주시면 좋겠습니다.

중앙값은 쉽게 말하면 한마디로 중앙에 있는 값 입니다.

저 그림의 예시와 같이 1 2 3 4 5 6 7 8 9 이렇게 정렬 되어 있는 자료가 있을 때 해당 자료의 중앙 값은 뭐가 될까요 바로 5가 되겠죠.

그럼 1 2 3 4 5 6 7 8 9 10 이렇게 정렬 되어 있는 자료가 있을 때 해당 자료의 중앙 값은 멀까요?

5와 6? 아니죠. 자료 중앙 값이기 때문에 5와 6사이에 있는 값 5와 6의 평균인 5.5가 됩니다.

그리고 중앙 값의 중요한 특징이 있는데요.

관측값 변화에 민감하지 않으며, 극단값에 영향을 받지 않는다. 이 두 가지 특징이 바로 중앙값을 우리가 알아야 하는 이유 입니다.

왜냐하면 우리가 알고 있는 평균을 구하는 공식은 극단값에 영향을 많이 받기 때문인데요.

우리가 가지고 있는 데이터에 극단값이 좀 많이 존재 한다면, 평균보다는 중앙값을 사용하는 경우가 많습니다.

산술 평균


먼저 산술평균(Arithmetic Mean)에 대해 다루도록 하겠습니다.

이는 우리가 흔히 알고 있는 평균을 구하는 공식입니다. 이 공식의 특징은 모든 값이 반영이 되기 때문에 극단 값에 영향을 받는다는 특징이 있습니다.

가중 평균


다음은 가중평균(Weighted Mean)입니다.

이 가중 평균은 자료의 중요성에 따라서 평균 값이 전혀 달라집니다.

대표적인 예시로 우리 대학생들의 학점 계산기가 바로 가중평균을 이용한 계산입니다.

학점이 똑같이 A가 나왔더라도 2학점 , 3학점이냐에 따라 전체 평균 학점을 계산할 때 적용되는 가중치가 다르다는 걸 생각해보시면 쉽게 이해하실 수 있습니다.

기하평균


다음은 기하평균(Geometric Mean)입니다.

기하평균은 좀 다들 생소할 것 같아요.

그 이유는 이는 물가 상승률, 주가 상승률을 계산할 때 기하 평균을 사용하게 됩니다.

즉 성장률을 다루는 데이터를 사용할 때 사용하는 수식입니다.

근데 저기 이상한 ㅠ 자 모양의 기호가 있죠 이는 capital Phi라고 부릅니다.

이 공식은 데이터의 개수 만큼 곱한다는 의미며, 곱한 개수 만큼 제곱근을 씌워준다는 공식 입니다.

예제 적용


이번에는 간단한 예제를 보면서 해당 문제를 해결하기 위해 어떤 평균을 써야할까?

라는 고민을 해보도록 합시다.

단순히 중고등학교 수능 입시 보듯이 문제의 정답을 맞추고 해당 문제 유형 별 공식을 외워서 푼다는 느낌을 가져 가는게 아닌, 해당 문제를 어떤 관점으로 바라보고 어떻게 풀어 나가야할지 고민을 해보는게 가장 중요합니다.

1번 문제 같은 경우는 어떤 평균을 써서 적용 시켜야 할까요?

바로 산술 평균이겠죠.

왜냐하면 해당 점수 별 가중치가 필요 하지도 않고, 물가 상승률 같이 상승률을 다루지도 않기 때문입니다.

2번은 어떻게 할까요? 이거는 제가 위에서도 예시를 들었죠.

바로 우리가 학점 평균을 계산할 때 가중 평균을 사용하기 때문이죠.

왜냐 과목 별 부여된 학점이 바로 가중치이기 때문입니다.

다음 예제도 한번 봐보도록 합시다.

3번은 우리가 또 대표적인 문제죠 바로 물가 상승률의 평균을 구하는 문제이기 때문에 기하 평균을 사용할 수 있겠죠.

4.번은 문제에서 대놓고 물어보는거죠 바로 중앙 값이죠.

가운데에 있는걸 찾으면 되기 때문에 오름 차순으로 정렬 하였을 때 중앙 값은 무엇일까요?

2,3,4,5,6,8,9 그럼 바로 5가 중앙 값이 되겠죠.

나머지 1번 2번 3번은 여러분들이 직접 한번 풀어 보는게 좋을 것 같습니다.

댓글남기기