일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 이산확률질량함수
- 사조사
- 통계학개론
- 모평균
- 수학적확률
- 범주형자료
- 기댓값과 분산
- 첨가행렬
- 절삭평균
- 균일분포
- 표본평균
- 피어슨상관계수
- 행사다리꼴
- 이항분포
- Anaconda
- 베르누이분포
- 기본행연산
- 누적분포함수
- 수치형자료
- 이변량자료
- 확률밀도함수
- 통계학입문
- 포아송분포
- jupyter notebook
- 이산형
- 연속확률변수
- pmf
- 조건부확률
- 모수
- 표본공간
- Today
- Total
목록전체 글 (97)
summ의 블로그
모분산 | 모비율 앞서 독립 이표본 t검정은 모분산에 따라 검정 통계량 값에 차이가 있다는 것을 확인했다. 따라서 두 모분산 값의 비교를 먼저 알아보자 한다. 모분산의 비교 우선, 두 그룹의 모분산을 비교하기 위해 조사한 표본은 서로 독립이고, 정규분포를 따른다고 가정하자. 이때 표본분산을 이용하여 카이제곱을 따르는 식이 성립한다. 두 모분산의 값이 같다면, 표본분산의 비율은 F분포를 따른다. 따라서 두 모분산의 비교는 F검정을 시행한다. 모평균 비교 구조도 다음과 같은 순서로 모수를 비교하면 된다. 모비율의 비교 마지막으로 두 모집단의 모비율을 비교하려 한다. 모비율을 비교하기 위해 서로 독립인 확률표본을 추출한다. 이때 표본은 이항분포를 따른다. 만약, 표본의 크기가 충분히 크다면 이항분포의 정규근사..
대응 표본 t test | 독립 이표본 t test 모수의 비교 두 모수를 비교할 때 샘플링 방법에 따라 대응표본 t검정, 독립 이표본 t검정으로 나뉜다. 이전 포스팅과 동일하게 모평균, 모비율, 모분산 순으로 알아보려 한다. 대응 표본 t검정 대응표본이란? 동일한 사람에게서 서로 대응되는 변수의 값을 측정, 혹은 실험 전과 후를 비교하기 위해 값을 측정한 표본이다. 연관성이 존재하기 때문에 표본은 하나이며, 독립이 아니다. 쉽게 말해 동일한 사람에게 대응되기에 대응 표본이라 생각하면 이해하기 편하다. 대응표본을 통해 두 모수를 비교하는 방법이 대응비교이다. 관심을 갖는 모수가 2개일 때, 이 모수들의 대소를 비교하는 것이 검정 목적이다. 예를 들어, 신약 개발을 위해 실험 참가자에게 일주일은 가짜약을,..
모평균 | 모비율 | 모분산 이번 포스팅에서는 모평균, 모비율, 모분산의 가설검정에 대해 알아보고자 한다. 모평균에 대한 가설검정 모평균 μ 에 관한 가설검정 형태는 다음과 같다. 위의 두 가설 형태는 단측검정, 마지막 가설 형태는 양측검정이라 한다. 점추정과 마찬가지로, 모평균의 가설검정에서 모분산을 알고 있을 때와 모를 때 검정방법이 다르다. 모분산을 알 때 모평균의 가설검정의 기각역과 유의확률을 나타내면 다음과 같다. 기각역 유의확률 다음으로 모분산을 모를 때 가설검정은 t분포를 사용한다. 기각역 유의확률 모비율에 대한 가설검정 모평균과 비슷하게 모비율의 가설 검정 형태는 다음과 같다. 모비율은 n이 충분히 클 때 이항분포의 정규근사를 이용한다. 모분산에 대한 가설검정 모분산에 대한 가설검정 형태는..
귀무가설 | 대립가설 | 유의확률 앞서 포스팅에서부터 모집단을 추정하기 위해 표본을 추출하고, 모수의 추측값을 정하는 점추정에 대해 알아보았다. 이제부터는 점추정값에 옳고 그름을 판단하는 방법에 관해 알아보려고 한다. 가설검정 모수에 관한 주장인 가설 이 존재하며, 주어진 가설을 표본 자료로부터 얻은 정보를 통해 검정하는 과정을 통계적 가설검정이라고 한다. 가설검정이란 ? 주장에 대한 반례와 모순을 보임으로써 주장을 입증하는 것이다. 만약, 주장에 대한 반례와 모순을 찾으면 그 주장은 잘못된 것이다. 주장에 대한 반례와 모순을 찾을 수 없으면 그 주장이 틀렸다고 말할 수 없다. 귀무가설과 대립가설 가설은 크게 귀무가설과 대립가설로 나뉜다. 귀무가설 H0 : 보편적으로 알고 있는 가설 대립가설 H1 : 자..
첫 번째 책 추천 포스팅 누군가 이름을 부른다면 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 누군가 이름을 부른다면 김보현 장편소설 은행나무 출판 표지가 마음에 들어서 골랐던 책이다. 막상 고르고 읽어보니 주요 내용은 좀비물로, 생각보다 빠르게 읽어나갈 수 있는 재미있는 책이었다. 주인공 원나는 화재로 인해 얼굴에 화상을 입었으며 아빠를 잃었다. 또한, 엄마 '미라'는 교통사고로 식물인간이다. 이후에 좀비 바이러스가 퍼져 원나가 살고 있는 마을까지 확산되었다. 원나는 좀비가 된 마을 사람들을 위해 몸을 닦아주고 빛을 보게 해주는 등의 보살피는 행동을 하며 살아간다. 시내로 나가 백화점에서 또 다른 생존자 영군을 만나서 마을에서 같이 살고, 몇 년 뒤 ..
모비율 | 모분산 | 점추정 | 구간추정 모비율 모비율 p 은 모집단 전체에서 특정 조건을 만족하는 것이 차지하는 비율을 말한다. n개의 표본을 추출하고, x 를 관심있는 갯수로 나타낸다. 모비율의 점추정 값으로 표본비율을 사용한다. 표본비율의 편의와 표준오차를 구하면 다음과 같다. 모비율에서 전체에서 주어진 조건을 만족하는 표본의 갯수 X는 이항분포를 따른다. 이 때, 전체 표본의 갯수 n이 충분히 크다면 이항분포의 정규근사 성질을 이용할 수 있다. 따라서 신뢰구간은 다음과 같이 구할 수 있다. 모분산 모분산의 점 추정값으로 표본분산을 사용한다. 이때, 모평균 μ를 알고 있을 때와 모를 때로 나누어 볼 수 있다. 우선, 모평균을 알고 있는 경우이다. 다음으로 모평균을 모를 때이다. 모분산의 신뢰구간은 ..
모평균의 점추정 | 구간추정 이전 포스팅에서 보았듯이, 모수의 추정은 점추정과 구간추정으로 나눌 수 있다. 모평균의 점추정 모평균에 관한 점추정 값으로 절사평균, 표본평균, 중앙값 등 여러 가지 통계량을 사용할 수 있다. 이 중 모평균의 추정량을 표본평균을 사용할 것이다. 모평균이 μ 모분산이 σ^2 인 모집단에서 n개의 표본을 추출하며, 확률표본이 독립이고 동일한 모집단의 분포를 따른다면 표본평균의 기댓값과 분산은 다음과 같다. 따라서 모평균 μ에 대한 점추정량에 관해 정리해보면 다음과 같다. 구간추정 구간 추정은 모수의 참값이 속할 것이라고 예상되는 구간을 정하는 것이다. 구간의 양 끝점을 각각 (L, U) 라고 정하며, 하한값, 상한 값으로 불린다. 또한, 구간이 모수의 참값을 포함할 확률을 정하며..
모수 모수란? 모집단의 분포의 특징을 나타내는 대푯값이다. 이러한 모수를 추론하기 위한 방법으로 통계학에서는 1) 모수의 추정 2) 모수에 관한 가설검정 구분하고 있다. 먼저 모수의 점추정에 관해 알아보자. 이전에 우리가 원하는 모수를 θ 라고 표기하며, 확률표본을 X1, X2, X3...으로, 실제 얻은 관측값을 x1, x2, x3이라고 하자. 점추정은 모수를 추측하는 데 사용할 통계량을 선택하고, 계산하여 모수에 대한 추측값으로 제시하는 과정이다. 통계량은 θ ̂ 으로 표기하며, 관측값을 이용하여 얻은 관측값은 추정값이라고 부른다. 어떠한 추정량을 사용하더라도 모수의 참값을 100% 추측할 수 없기에, 추정량의 정확도를 측정하여 사용하고 있다. 추정량의 정확도 추정량은 표본에 따라 그 값이 달라지는 ..
이전 포스팅에서 보다시피 모집단을 추정하기 위해 표본집단을 추출하여 표본조사를 실시한다. 표본평균 따라서 모집단에서 n개의 표본을 복원추출하고, i번째 표본을 Xi일 때 n개의 확률변수는 서로 독립이고 independent 동일한 모집단 identically distribution 의 분포를 따른다. 표본평균은 다음과 같이 나타낼 수 있다. 모평균을 μ 모분산을 σ^2 라고 했을 때, 기댓값과 분산의 성질에 의해 표본평균의 평균과 분산을 나타낼 수 있다. 중심극한정리 모집단의 분포를 모르고, 표본 n의 수가 크다면 (보통 30 이상) 모집단의 분포와 상관없이 표본평균의 근사 분포는 정규분포를 따른다. 표본의 수가 많아질수록 점점 더 종모양에 가까운 분포형태를 띠게 된다. /* 틀린 것이 있다면, 댓글을 ..
표본추출 / 표본통계량 / 표본비율 표본 통계학에서 모수를 전수조사하기에는 막대한 비용과 시간이 필요하기 때문에 표본조사를 실시하는 경우가 있다. 그렇기에 모집단의 적절한 정보를 얻기 위해 모집단을 가장 잘 대표하는 표본을 얻어야 한다. 이러한 과정을 표본 추출 sampling 이라 한다. 표본 추출을 실행할 때, 모집단의 구성원이 동등하게 표본으로 뽑힐 확률을 가지고 있어야 한다. 따라서 표본으로 선택될 확률을 알고 얻어진 표본을 확률표본 random sample 이라고 한다. 임의로 표본을 선택하여 뽑는 방법을 단순확률표본추출 simple random sampling 라고 한다. 표본 통계량 우리는 모집단, 표본에서 사건을 비율로 나타낼 수 있다. 모비율 p : 모집단에서 관심 있는 사건이 차지하는 ..