summ의 블로그

연속확률분포 - 정규분포 본문

통계학개론

연속확률분포 - 정규분포

summ._ 2023. 8. 8. 17:19

정규분포 normal distribution 

 

 

 

연속확률분포의 간판인 정규분포에 관해 알아보자. 

 

정규분포 

 

앞서 나온 확률분포들에서 볼 수 있듯이 충분한 표본 개수를 갖고 있다면 이들의 근사확률분포는 정규분포 형태를 지닌다. 

 

확률밀도함수는 종모양을 나타내며 중심인 평균을 주위로 하고 있다.  

좌우대칭인 것이 특징이며 중심으로부터 멀리 떨어진 값들이 많이 존재할수록 종 모양도 넓어진다.

 

=> 평균(중심)과 분산(폭)에 영향을 받는다. 

 

μ=10

 

확률밀도함수는 다음과 같고, 기호는 X ~ N(μ,σ^2) 로 나타낸다. 

 

 

정규분포의 성질 

 정규분포를 따르는 확률변수가 존재한다면, 이 확률변수들의 선형 결합도 정규분포를 따른다는 것을 의미한다. 

 

 

표준정규분포 

 

정규분포 중 평균은 0 분산은 1인 정규분포를 표준정규분포라고 칭한다. 

표준정규분포의 확률밀도함수는 ϕ(x) 라고 표시하며, 0을 중심으로 좌우 대칭인 모양이다. 

 

표준정규분포의 누적분포함수는 표준정규분포를 이용하여 계산할 수 있다.

 

표준정규분포 기댓값 0 분산 1

 

하지만, 누적분포함수값을 구하기 어렵기 때문에, 미리 정의된 표준정규분포표를 이용해 문제를 풀 수 있다. 

어느 통계학 책을 사도 맨 뒤쪽 부록에서 쉽게 찾을 수 있으리라 생각한다.  

읽는 법은 세로축과 가로축을 중심으로 보면 된다. 

 

만약 누적분포함수값이 z=1.96 이라면, 세로축에서 1.9와 가로축에서 0.06이 만나는 값을 찾으면 된다. 

따라서 정규분포표를 이용하여 찾은 확률은 0.975 라는 값을 얻을 수 있다. 

 

 

보간법

 

보간법은  양 끝점의 값이 주어졌을 때, 그 사이에 위치한 값을 추정하기 위하여 직선거리에 따라 선형적으로 계산하는 방법이다. 

 

 

예를 들면 

 

그래프에서 1.645의 값 (a) 을 알고 싶을 때 (1.64, 0.9495) 와 (1.65, 0.9505) 를  사용한다. 1.64 1.65에 직선을 그은 뒤 직선의 기울기 값을 구하면 쉽게 구할 수 있다.

 

 

상위분위수  

 

자주 쓰이는 상위분위수가 있다. 

a za P(z<=za)
0.1 1.282 0.9
0.05 1.645 0.95
0.025 1.96 0.975
0.01 2.33 0.99
0.005 2.58 0.995

 

 

 

 

 

/* 틀린 것이 있다면, 댓글을 남겨주세요

출처: 4판 통계학입문 [이해와 응용

*/