summ의 블로그

표본추출과 표본통계량 본문

통계학개론

표본추출과 표본통계량

summ._ 2023. 8. 23. 15:15

표본추출 / 표본통계량 / 표본비율  

 

 

 

표본

 

통계학에서 모수를 전수조사하기에는 막대한 비용과 시간이 필요하기 때문에 표본조사를 실시하는 경우가 있다. 

그렇기에 모집단의 적절한 정보를 얻기 위해 모집단을 가장 잘 대표하는 표본을 얻어야 한다. 

이러한 과정을 표본 추출 sampling 이라 한다. 

 

표본 추출을 실행할 때, 모집단의 구성원이 동등하게 표본으로 뽑힐 확률을 가지고 있어야 한다. 

따라서 표본으로 선택될 확률을 알고 얻어진 표본을 확률표본 random sample 이라고 한다.  

 

임의로 표본을 선택하여 뽑는 방법을 단순확률표본추출 simple random sampling 라고 한다. 

 

 

표본 통계량 

 

우리는 모집단, 표본에서 사건을 비율로 나타낼 수 있다. 

 

모비율 p : 모집단에서 관심 있는 사건이 차지하는 비율

표본비율 p ̂ : 표본으로부터 얻은 비율 

 

 

표본 비율은 표본의 개수 n과 관심 있는 사건 X를 비율로 나타낸다. 

또한, 모비율에 관한 추측값으로 모집단에서 추출된 표본에 따라 값이 변동될 수 있다. 

 

표본으로부터 계산되는 모든 값을 통계량이라고 부르며, 확률변수이자 확률분포를 갖게 된다. 

따라서 통계량의 확률분포는 모집단에서 특정 표본이 추출될 확률과 관련되어 있기에 표본분포 라고 한다.  

 

표본비율의 기댓값과 분산 

 

표본비율의 기댓값과 분산을 알아보기 위해 복숭아 3개와 사과 7개가 있는 바구니가 존재한다고 하자. 

이때 각각의 과일이 선택될 확률은 0.1이며, 총 5개의 과일을 선택한다고 하자. 

 

이때 과일이 선택될 확률은 다음과 같이 나타낼 수 있다. 

 

이를 통해 표본비율의 기댓값과 분산을 구해보면 다음과 같다. 

 

 

표본비율의 기댓값은 모비율의 기댓값과 동일하다. 

 

 

 

 

/* 틀린 것이 있다면, 댓글을 남겨주세요

출처: 4판 통계학입문 [이해와 응용

*/

'통계학개론' 카테고리의 다른 글

모수의 추정  (0) 2023.08.24
표본 평균과 중심극한정리  (0) 2023.08.24
공분산과 상관계수  (0) 2023.08.22
확률변수의 결합분포  (0) 2023.08.18
연속확률분포 - 감마분포  (0) 2023.08.13