summ의 블로그

이산확률분포 - 포아송분포 본문

통계학개론

이산확률분포 - 포아송분포

summ._ 2023. 8. 2. 22:44

포아송분포  Poisson distribution

 

 

포아송분포 

 

포아송분포 (Poisson distribution) 는 단위 시간, 공간에 따른 사건의 횟수에 대한 확률분포로 자주 사용된다. 

 

위키백과에 나온 특징을 참조해 보자. 

 

  1. 어떤 단위구간(예, 1일)동안 이를 더 짧은 작은 단위의 구간(예: 1시간)으로 나눌 수 있고 이러한 더 짧은 단위구간 중에 어떤 사건이 발생할 확률은 전체 척도 중에서 항상 일정해야 한다.
  2. 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다.
  3. 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적이다.
  4. 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례한다.
  5. 푸아송분포 확률 변수의 기댓값 분산은 모두 λ이다.

 

포아송분포의 확률변수 X 는 음이 아닌 모든 정수 값이며, 람다는 포아송분포의 특징을 나타내는 역할로 발생하는 사건의 수를 나타낸다. 

 

 

확률질량함수는 다음과 같고,  기호는 X ~ Possion(λ) 로 나타낸다. 

 

 

포아송 분포는 일정 기간이나 공간에서 발생하는 특정한 사건의 수와 관련되어 있기 때문에

구간의 길이나 면적이 달라지면, 발생하는 특정한 사건의 수도 구간의 길이나 면적에 따라 비례하여 변한다.

 

따라서 단위 시간당 발생하는 사건의 수가 포아송 분포를 따른다면, t시간 동안 발생하는 사건의 확률분포도 포아송 분포를 따르며 이를 Poisson(λt) 로 나타낼 수 있다.  

 

기댓값과 분산

 

기댓값과 분산 모두 모수  λ와 동일하다. 

따라서 λ=모수=기댓값=분산 

 

 

 

이항분포의 포아송 근사 

 

쉽게 말하자면, 이항분포에 관한 문제를 포아송분포 문제로 변환하여 풀 수 있다는 것이다. 

 

이항분포를 따르는 확률변수 X가 존재한다고 가정하자. ==> X ~ B(n, p)  

 

이때, 시행 횟수 n이 충분히 크고, 성공확률 p가 충분히 작으며, np=λ 이 성립한다면 

포아송분포가 성립한다. 

 

포아송 분포의 가정에서, 일정한 사건이 발생하는 구간을 n등분해 보자. 각 구간에서 사건의 발생은 λ/n이 된다.

 

이 때, 자연수 n의 크기를 충분히 크게 한다면, n등분한 짧은 구간에서 사건이 발생할 확률은 평균적으로 λ/n 번이 되는 것이다. 

 

각 사건은 성공 확률이 λ/n 번인 베르누이 시행이며, 

전체 구간에서 보자면 시행 횟수는 n 성공확률이 λ/n 인 이항분포를 띈다. 

 

결론적으로 이항분포의 확률의 극한은 포아송분포의 확률이라는 사실이다. 

 

 

정리 
포아송분포 
모수  λ 기댓값  λ 분산  λ
이항분포의 근사와 연관

 

 

 

 

/* 틀린 것이 있다면, 댓글을 남겨주세요

출처: 제 4판 통계학입문 [이해와 응용] 

*/