summ의 블로그

통계학개론 기본 용어 정리 2 본문

통계학개론

통계학개론 기본 용어 정리 2

summ._ 2023. 7. 2. 22:22

표본공간 / 확률의 정의 / 확률의 성질 / 조건부 확률 / 베이즈 정리 

 

 

 

표본공간의 정의 

 

표본공간: 통계적 실험에서 얻을 수 있는 모든 표본점들의 집합. S로 표기한다. 

 

동전을 던지는 실험에서 표본공간은 앞면, 뒷면을 얻을 수 있기 때문에 

이때 표기는 다음과 같다. 

                                                                                 S = {앞면, 뒷면}

 

 

확률변수 

 

표본공간 S가 정의역이고, 실수집합이 공역인 함수 X를 확률 변수라고 한다. 

실험에서 얻을 수 있는 모든 결과에 실수를 대응시키는 함수이다. 

 

 

확률의 정의 

 

우리가 흔히 알고 있는 확률은 "수학적 확률"이다. 

 

위에서 본 동전으로 확인해보자면

우리가 동전을 던졌을 때 앞면이 나올 확률은

전체 사건 중 앞면과 뒷면이 나올 가능성이 동일하기에 1/2이다. 

 

따라서 이를 일반화하자면 

 

표본공간 S에 속하는 표본점의 개수가 유한하고, 각각의 근원사건이 일어날 가능성이 동일할 때, 사건 A가 일어날 확률 P(A) 는 A에 속하는 표본점의 갯수 / 전체 S에 속하는 표본점의 개수이다.

 

 

또한, 경험적 확률도 존재한다. 

경험적 확률은 통계적 실험을 반복적으로 수행하여 얻은 결과인 극한값을 바탕으로 확률을 정의하는 것이다. 

 

통계적 실험을 n번 반복했을 때 사건 A가 일어나는 도수를 fn 이라고 하면, 사건 A가 일어날 확률 P(A) 는 

이다. 

 

 

이제, 확률의 성질을 알아보자. 

 

 

확률의 성질 

 

1. 공사건의 확률은 0이다.

2. A 가 B의 집합에 속한다면,  P(A) <= P (B)  

3. 사건 A의 여사건이 일어날 확률은 1 - P(A)와 같다. 

4. 임의의 사건 A와 B에 대하여 다음과 같은 식이 성립한다. 

 

이는 정확하게 기억은 안 나지만, 고등학교 과정 확률과 통계를 배웠다면 알고 있다고 생각하여 증명은 넘어가겠다. 

 

 

 

조건부 확률 

 

이름에서부터 알 수 있듯이,

어떠한 조건이 정해져 있는 사건에서 그 조건 하에서 우리가 실제 원하는 사건의 확률을 구하면 된다. 

 

사건 A 가 주어졌을 때, 사건 B 가 일어날 조건부 확률은 다음과 같다.
(단, P(A) > 0이다. ) 

 

 

주사위로 쉽게 설명해 보자면, 

주사위를 굴렸을 때 눈이 2의 배수가 나오는 사건을 A 라 하고, 두 주사위의 눈금의 합이 10인 사건을 B라고 하자.

이러한 상황에서 사건 A가 일어난 경우 중 사건 B가 일어날 확률을 구해보자면 사건 A가 새로운 표본 공간이 된다. 

 

 

 

다음은 조금 어려울 수 있는 베이즈 정리이다. 

처음에 베이즈 정의를 이해하기가 어려울 수 있다. (제가 그랬어요)

우선 통계학개론에서는 어떤 느낌인지만 파악하면 될 것 같다. 

 

베이즈 정리 

 

 

우리는 조건부 확률을 이용하여 베이즈 정리를 정의할 수 있다. 

 

 

우리가 알고 있는, 알 수 있는 확률 (= 어떤 사건 A가 일어났다고 가정할 때 B라는 자료를 얻게 될 확률) 을 이용하여 우리가 구하자고자하는 확률을 계산할 수 있다. 

 

 

 

예제로 알아보자면, 

 

한 과일가게에서 복숭아, 사과, 수박을 판매하고 있다. 각각의 과일의 판매 비율은 50%, 30%, 20% 이고, 상한 과일을 판매해 교환을 요청한 비율은 각각 25%, 20%, 10% 이다. 과일을 판매하고 난 후, 교환을 요청한 과일이 수박일 확률은 얼마인가? 

 

우선, 각각의 과일 복숭아, 사과, 수박을 판매하여 손님이 구매한 사건을 D1, D2, D3 으로 정의하고, 손님이 환불을 요청하는 사건을 X라고 정의한다.  

 

이를 베이즈 정리에 적용하자면, 우리가 구하고자하는 조건부 확률은 

 

이 되는 것이다. 값은 0.02/0.205 = 0.098이다. 

 

 

 

 

/* 틀린것이 있다면, 댓글을 남겨주세요

출처: 제 4판 통계학입문 [이해와 응용] 

*/