확률변수(random variable)
인공 지능을 공부하기 위해서는 기본 적으로 수학을 잘 알아야 도움이 됩니다.
여기서 수학을 잘 안다 라고 표현을 한 이유는 단순히 우리 고등학교 혹은 대학교 시험처럼 단순히 공식을 외우고 책에 있는 예제들 혹은 모의고사들을 n회독을 하며 문제를 잘 풀어야 한다라는 의미가 아닌 수학 용어, 수학적인 개념, 혹은 함수의 특징 , 해당 함수는 어떤 특징이 있기 때문에 일상 생활에서 어떤 상황일 때 적용이 가능하다 등등과 같이 이런 개념적인 부분을 잘 알아야 도움이 된다.
논문을 쓰거나 읽거나 혹은 모델의 구조나 작동 원리를 이해 해야 하는 경우에는 더욱 도움이 된다.
어짜피 파이토치가 다 해줄텐데 왜 알아야하는거임? 하실 수 있습니다.
하지만 여러분들이 어떤 프로젝트를 한다 했을 때 프로젝트 목적과 상황에 적합한 모델을 찾아야 할 겁니다. 그러기 위해선 해당 모델의 논문을 읽어보고 모델의 작동 원리와 구조를 알아야 프로젝트의 목적과 상황에 적합한 모델을 찾을 수 있기 때문에 결국에는 수학 개념을 알아야 합니다.
확률과 통계 같은 경우 전체를 다루지 않고 확률변수부터 회귀까지만 다룰 예정입니다.
그리고 확률과 통계는 shelldon M.Ross의 이공계용 확률과 통계 책을 기반으로 글을 정리할 예정입니다.
What is Random variable?
먼저 확률 변수에 대해 알아보도록 합시다.
확률 실험을 수행할 때 실험 결과의 모든 세부사항에 관심을 갖기보다는 결과에 의해 정해지는 어떤 수치적 양의 값에만 관심을 갖는 경우가 종종 있습니다.
주사위 던지기를 예시로 들어보도록 하겠습니다. 우리가 관심 있어 하는 것은 주사위 2개를 던졌을 때 2개의 주사위에서 나온 숫자의 합이 7인 경우라고 예시를 들어보도록 하겠습니다.
주사위 2개를 던졌을 때 합이 7인 경우는 (1,7),(2,6),(3,4),(4,3),(5,2),(6,1) 이렇게 총 6개의 경우의 수가 있을 겁니다.
하지만 우리는 주사위 2개의 숫자 개별 값이 어떻게 되든 상관 없습니다. 두 주사위의 숫자 합이 7인 것이 중요한 것이죠.
위의 경우와 같이 실험의 결과로 정해지는 관심 대상인 양을 확률변수(Random Variable)이라고 합니다.
이산형과 연속형
다음은 이산형(discrete)과 연속형(continuous)에 대해 알아보도록 합시다.
우리가 위에서 다루었던 확률 변수를 유한 수열 x1,x2,x3,x4…,xn 또는 무한 수열 x1,x2,….로 표현할 수 있을 때 우리는 이러한 확률 변수를 이산형(discrete)라고 합니다.
예를 들어 확률변수가 가질 수 있는 값의 집합이 음이 아닌 정수들의 집합 일 경우, 이 확률변수는 이산형이라고 합니다.
하지만 우리가 가지고 있는 확률변수가 연속체를 형성할 수도 있으며, 이러한 확률변수는 연속형(continous)라고 합니다.
예를 들어 자동차의 수명을 나타내는 확률 변수는 어떤 구간(a,b) 안의 어떤 값이라도 가질 수 있음으로 연속확률변수의 한 예로 볼 수 있습니다.
누적분포함수
다음은 누적분포함수 CDF라고 불리는 것에 대해 알아보도록 하겠습니다.
확률변수 X에 대한 누적분포함수(cumulative distribution function)또는 줄여서 분포함수(distribution)라고 불리는 것은 확률론에서 주어진 확률분포가 특정 값보다 작거나 같은 확률을 나타내는 함수입니다.
여기서 특정 값은 어떤 사건을 의미하며 누적분포함수는 어떤 사건이 얼마나 많이/적게 나타나는지에 관한 함수라고도 할 수 있습니다.
누적분포함수의 특징은 확률변수가 이산형 혹은 연속형과 무관하게 모든 실수 값을 출력한다는 것이 특징입니다.
누적분포함수 F는 임의의 실수 x에 대해 아래와 같이 정의가 됩니다.
\[F(x)=P(X\geq x)\]위의 수식을 해석하자면 F(x)는 확률변수 X가 x이하의 값을 가질 확률과 같다.
기호: F가 X에 대한 분포함수임을 나타내기 위해 X~F라고 표시합니다.
간단한 예제를 보고 마치도록 하겠습니다.
확률변수 X가 다음과 같은 분포함수를 갖는다고 할 때, X가 1보다 클 확률은 얼마인가?
댓글남기기