일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 균일분포
- 확률밀도함수
- 연속확률변수
- 이변량자료
- pmf
- 통계학입문
- Anaconda
- 기본행연산
- 수치형자료
- 사조사
- 이산형
- 피어슨상관계수
- 범주형자료
- 모평균
- 기댓값과 분산
- 수학적확률
- 통계학개론
- 포아송분포
- 첨가행렬
- 베르누이분포
- 표본평균
- 이항분포
- 모수
- 절삭평균
- 조건부확률
- 누적분포함수
- 행사다리꼴
- 표본공간
- 이산확률질량함수
- jupyter notebook
- Today
- Total
목록통계학개론 (26)
Syeonny의 블로그

단순선형회귀분석 | 최소제곱법 | 결정계수 회귀분석 회귀분석이란? 둘 이상의 변수의 함수 관계식을 구하여 평가하는 통계적 분석 방법이다. 독립변수와 종속변수 간의 관계를 알아보는 것이다. 이때 독립변수란? 독립적이며, 종속변수의 원인이 되는 변수이다. 설명변수라고도 불린다. 종속변수란? 독립변수에 '종속'되는 변수로 독립변수에 영향을 받아 변하는 변수이다. 반응변수라고도 불린다. 독립변수의 개수에 따라 회귀분석 방법이 다르다. 단순선형회귀분석 단순선형회귀분석은 종속변수의 변동을 하나의 독립변수의 변동으로 설명가능한 회귀분석이다. 단순선형회귀분석의 절차 1. 독립변수와 종속변수의 설정 2. 산점도 그리기 3. 단순선형회귀모형 세우기 4. 단순선형회귀모형 추정: 최소제곱법 5. 회귀모형 진단: 잔차분석 6...

일원배치 분산분석 앞서 모수의 비교 포스팅에서 두 모평균을 비교하는 방법에 관해 알아보았다. 이번 포스팅에서는 세 개 이상의 모평균을 비교하는 검정방법을 알아보고자 한다. 분산분석 ANOVA 하나의 검정통계량으로 세 개 이상의 모평균을 한 번에 비교하기 위해 분산분석을 이용한다. 분산분석은 ANOVA 아노바, analysis of variance 라고 부르고 있다. 나무위키에서는 '분산분석이란 명목척도로 측정된 독립변수와 등간척도 또는 비율척도로 측정된 종속변수 사이의 관계를 연구하는 통계 기법이다.'라고 정의하고 있다. 이때, 분산분석에서 사용하는 용어 정리는 다음과 같다. 인자: 관측값 혹은 평균에 영향을 주는 특정 조건을 나타내는 변수 인자 수준: 인자가 가지는 값 처리: 각 실험 단위에서 특정한 ..

모분산 | 모비율 앞서 독립 이표본 t검정은 모분산에 따라 검정 통계량 값에 차이가 있다는 것을 확인했다. 따라서 두 모분산 값의 비교를 먼저 알아보자 한다. 모분산의 비교 우선, 두 그룹의 모분산을 비교하기 위해 조사한 표본은 서로 독립이고, 정규분포를 따른다고 가정하자. 이때 표본분산을 이용하여 카이제곱을 따르는 식이 성립한다. 두 모분산의 값이 같다면, 표본분산의 비율은 F분포를 따른다. 따라서 두 모분산의 비교는 F검정을 시행한다. 모평균 비교 구조도 다음과 같은 순서로 모수를 비교하면 된다. 모비율의 비교 마지막으로 두 모집단의 모비율을 비교하려 한다. 모비율을 비교하기 위해 서로 독립인 확률표본을 추출한다. 이때 표본은 이항분포를 따른다. 만약, 표본의 크기가 충분히 크다면 이항분포의 정규근사..

대응 표본 t test | 독립 이표본 t test 모수의 비교 두 모수를 비교할 때 샘플링 방법에 따라 대응표본 t검정, 독립 이표본 t검정으로 나뉜다. 이전 포스팅과 동일하게 모평균, 모비율, 모분산 순으로 알아보려 한다. 대응 표본 t검정 대응표본이란? 동일한 사람에게서 서로 대응되는 변수의 값을 측정, 혹은 실험 전과 후를 비교하기 위해 값을 측정한 표본이다. 연관성이 존재하기 때문에 표본은 하나이며, 독립이 아니다. 쉽게 말해 동일한 사람에게 대응되기에 대응 표본이라 생각하면 이해하기 편하다. 대응표본을 통해 두 모수를 비교하는 방법이 대응비교이다. 관심을 갖는 모수가 2개일 때, 이 모수들의 대소를 비교하는 것이 검정 목적이다. 예를 들어, 신약 개발을 위해 실험 참가자에게 일주일은 가짜약을,..

모평균 | 모비율 | 모분산 이번 포스팅에서는 모평균, 모비율, 모분산의 가설검정에 대해 알아보고자 한다. 모평균에 대한 가설검정 모평균 μ 에 관한 가설검정 형태는 다음과 같다. 위의 두 가설 형태는 단측검정, 마지막 가설 형태는 양측검정이라 한다. 점추정과 마찬가지로, 모평균의 가설검정에서 모분산을 알고 있을 때와 모를 때 검정방법이 다르다. 모분산을 알 때 모평균의 가설검정의 기각역과 유의확률을 나타내면 다음과 같다. 기각역 유의확률 다음으로 모분산을 모를 때 가설검정은 t분포를 사용한다. 기각역 유의확률 모비율에 대한 가설검정 모평균과 비슷하게 모비율의 가설 검정 형태는 다음과 같다. 모비율은 n이 충분히 클 때 이항분포의 정규근사를 이용한다. 모분산에 대한 가설검정 모분산에 대한 가설검정 형태는..

귀무가설 | 대립가설 | 유의확률 앞서 포스팅에서부터 모집단을 추정하기 위해 표본을 추출하고, 모수의 추측값을 정하는 점추정에 대해 알아보았다. 이제부터는 점추정값에 옳고 그름을 판단하는 방법에 관해 알아보려고 한다. 가설검정 모수에 관한 주장인 가설 이 존재하며, 주어진 가설을 표본 자료로부터 얻은 정보를 통해 검정하는 과정을 통계적 가설검정이라고 한다. 가설검정이란 ? 주장에 대한 반례와 모순을 보임으로써 주장을 입증하는 것이다. 만약, 주장에 대한 반례와 모순을 찾으면 그 주장은 잘못된 것이다. 주장에 대한 반례와 모순을 찾을 수 없으면 그 주장이 틀렸다고 말할 수 없다. 귀무가설과 대립가설 가설은 크게 귀무가설과 대립가설로 나뉜다. 귀무가설 H0 : 보편적으로 알고 있는 가설 대립가설 H1 : 자..

모비율 | 모분산 | 점추정 | 구간추정 모비율 모비율 p 은 모집단 전체에서 특정 조건을 만족하는 것이 차지하는 비율을 말한다. n개의 표본을 추출하고, x 를 관심있는 갯수로 나타낸다. 모비율의 점추정 값으로 표본비율을 사용한다. 표본비율의 편의와 표준오차를 구하면 다음과 같다. 모비율에서 전체에서 주어진 조건을 만족하는 표본의 갯수 X는 이항분포를 따른다. 이 때, 전체 표본의 갯수 n이 충분히 크다면 이항분포의 정규근사 성질을 이용할 수 있다. 따라서 신뢰구간은 다음과 같이 구할 수 있다. 모분산 모분산의 점 추정값으로 표본분산을 사용한다. 이때, 모평균 μ를 알고 있을 때와 모를 때로 나누어 볼 수 있다. 우선, 모평균을 알고 있는 경우이다. 다음으로 모평균을 모를 때이다. 모분산의 신뢰구간은 ..

모평균의 점추정 | 구간추정 이전 포스팅에서 보았듯이, 모수의 추정은 점추정과 구간추정으로 나눌 수 있다. 모평균의 점추정 모평균에 관한 점추정 값으로 절사평균, 표본평균, 중앙값 등 여러 가지 통계량을 사용할 수 있다. 이 중 모평균의 추정량을 표본평균을 사용할 것이다. 모평균이 μ 모분산이 σ^2 인 모집단에서 n개의 표본을 추출하며, 확률표본이 독립이고 동일한 모집단의 분포를 따른다면 표본평균의 기댓값과 분산은 다음과 같다. 따라서 모평균 μ에 대한 점추정량에 관해 정리해보면 다음과 같다. 구간추정 구간 추정은 모수의 참값이 속할 것이라고 예상되는 구간을 정하는 것이다. 구간의 양 끝점을 각각 (L, U) 라고 정하며, 하한값, 상한 값으로 불린다. 또한, 구간이 모수의 참값을 포함할 확률을 정하며..

모수 모수란? 모집단의 분포의 특징을 나타내는 대푯값이다. 이러한 모수를 추론하기 위한 방법으로 통계학에서는 1) 모수의 추정 2) 모수에 관한 가설검정 구분하고 있다. 먼저 모수의 점추정에 관해 알아보자. 이전에 우리가 원하는 모수를 θ 라고 표기하며, 확률표본을 X1, X2, X3...으로, 실제 얻은 관측값을 x1, x2, x3이라고 하자. 점추정은 모수를 추측하는 데 사용할 통계량을 선택하고, 계산하여 모수에 대한 추측값으로 제시하는 과정이다. 통계량은 θ ̂ 으로 표기하며, 관측값을 이용하여 얻은 관측값은 추정값이라고 부른다. 어떠한 추정량을 사용하더라도 모수의 참값을 100% 추측할 수 없기에, 추정량의 정확도를 측정하여 사용하고 있다. 추정량의 정확도 추정량은 표본에 따라 그 값이 달라지는 ..

이전 포스팅에서 보다시피 모집단을 추정하기 위해 표본집단을 추출하여 표본조사를 실시한다. 표본평균 따라서 모집단에서 n개의 표본을 복원추출하고, i번째 표본을 Xi일 때 n개의 확률변수는 서로 독립이고 independent 동일한 모집단 identically distribution 의 분포를 따른다. 표본평균은 다음과 같이 나타낼 수 있다. 모평균을 μ 모분산을 σ^2 라고 했을 때, 기댓값과 분산의 성질에 의해 표본평균의 평균과 분산을 나타낼 수 있다. 중심극한정리 모집단의 분포를 모르고, 표본 n의 수가 크다면 (보통 30 이상) 모집단의 분포와 상관없이 표본평균의 근사 분포는 정규분포를 따른다. 표본의 수가 많아질수록 점점 더 종모양에 가까운 분포형태를 띠게 된다. /* 틀린 것이 있다면, 댓글을 ..