일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 통계학개론
- 모수
- 이변량자료
- 이산형
- 절삭평균
- 확률밀도함수
- 수학적확률
- 모평균
- 기댓값과 분산
- 연속확률변수
- 범주형자료
- 사조사
- 수치형자료
- 베르누이분포
- 이항분포
- 누적분포함수
- 균일분포
- jupyter notebook
- 피어슨상관계수
- Anaconda
- 조건부확률
- 기본행연산
- 이산확률질량함수
- 행사다리꼴
- 표본평균
- pmf
- 표본공간
- 첨가행렬
- 통계학입문
- 포아송분포
- Today
- Total
목록통계학개론 (26)
summ의 블로그
포아송분포 Poisson distribution 포아송분포 포아송분포 (Poisson distribution) 는 단위 시간, 공간에 따른 사건의 횟수에 대한 확률분포로 자주 사용된다. 위키백과에 나온 특징을 참조해 보자. 어떤 단위구간(예, 1일)동안 이를 더 짧은 작은 단위의 구간(예: 1시간)으로 나눌 수 있고 이러한 더 짧은 단위구간 중에 어떤 사건이 발생할 확률은 전체 척도 중에서 항상 일정해야 한다. 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다. 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적이다. 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례한다. 푸아송분포 확률 변수의 기댓값과 분산은 모두 λ이다. 포아송분포의 확률변수 X 는 음이 아닌 모든 정수 값이..
이항분포 binomial distribution 지난 포스팅 - 베르누이 분포- 에 이어 이항 분포를 알아보자. 이항분포 이항분포 (binomial distribution) 는 각각의 실험이 독립임을 특징으로 하고 있다. 앞서 제시한 동전 던지기 실험을 생각해보자. 동전 던지기 실험에서 처음 던져서 나온 결과는 그 다음 결과에 영향을 미치지 않는다. 따라서 동전 던지기 실험은 이항실험의 간단한 예라고 볼 수 있다. 동전을 던질 때, 뒷면이 나올 확률을 p라고 정의한다면 각각의 확률은 이와 같다. 정수 1과 2는 주어진 표본 공간 4개 중 뒷면이 포함된 결과를 나열하는 경우의 수와 같기 때문에 조합으로도 나타낼 수 있다. 따라서 동전 던지기 실험 확률을 일반화하면 다음과 같다. 이를 통해 이항분포를 일반화..
베르누이 분포 bernoulli distribution 베르누이 시행 이산확률분포 중 하나인 베르누이 분포는 가장 형태가 단순하다. 과학자가 어떠한 실험을 했을 때 그 실험이 성공했느냐, 실패했느냐 두 가지 결과가 나오는 경우만을 따진다고 생각하면 된다. 각각 성공, 실패가 나올 확률은 정확하게 반반인 '0.5' 이다. 이는 많은 과정을 거치지 않아도 바로 생각할 수 있다. 이렇게 통계적 실험이 오직 두 가지의 결과만 가지는 실험을 베르누이 시행이라고 한다. 베르누이 확률변수 베르누이 확률변수를 다음과 같이 정의할 수 있다. 확률변수 X가 성공확률이 p인 베르누이분포를 X~B(1,p) 로 표기한다. 확률질량함수 베르누이분포의 확률질량함수는 다음과 같다. 기댓값과 분산 베르누이분포의 기댓값과 분산 또한 쉽..
이산확률변수 | 이산확률분포 | 이산확률분포표| 확률질량함수 | 기댓값 이산확률변수의 정의 앞면과 뒷면이 존재하는 동전을 연속으로 2번 던지는 실험을 한다고 하자. 이때 동전의 표본공간은 S = { (HH), (HT), (TH), (TT) }이다. 이 실험에서 우리가 뒷면이 나온 수를 변수 X 라고 정의한 뒤, 주어진 상황에서 변수 X가 가질 수 있는 수는 0, 1, 2 인 것을 확인할 수 있다. HH HT TH TT 변수 값 0 1 1 2 이렇게 확률변수가 가질 수 있는 값이 셀 수 있는 무한개, 유한개일 때 이산확률변수라고 한다. 어렵다고 느껴진다면 우리가 >>> 정수
표본공간 / 확률의 정의 / 확률의 성질 / 조건부 확률 / 베이즈 정리 표본공간의 정의 표본공간: 통계적 실험에서 얻을 수 있는 모든 표본점들의 집합. S로 표기한다. 동전을 던지는 실험에서 표본공간은 앞면, 뒷면을 얻을 수 있기 때문에 이때 표기는 다음과 같다. S = {앞면, 뒷면} 확률변수 표본공간 S가 정의역이고, 실수집합이 공역인 함수 X를 확률 변수라고 한다. 실험에서 얻을 수 있는 모든 결과에 실수를 대응시키는 함수이다. 확률의 정의 우리가 흔히 알고 있는 확률은 "수학적 확률"이다. 위에서 본 동전으로 확인해보자면 우리가 동전을 던졌을 때 앞면이 나올 확률은 전체 사건 중 앞면과 뒷면이 나올 가능성이 동일하기에 1/2이다. 따라서 이를 일반화하자면 표본공간 S에 속하는 표본점의 개수가 유..
통계학의 유형 / 자료의 유형 / 대푯값 사회가 점점 발전하면서, 우리가 모든 정보를 정확하게 얻기는 어려워진다. 따라서 한정된 자료를 갖고 추정하는 행동이 필요하다. 이때 통계학이 필요하게 되는 것이다. 통계학이란? 우리가 관심이 있는 집단에 대하여 자료를 수집하고, 정리하고 요약을 토대로 판단을 내리는 학문이다. 이러한 통계학은 크게 기술통계학, 추측통계학으로 구분된다. 기술통계학과 추측통계학 기술통계학: 관측된 자료를 연구목적에 적합하게 정리하고 요약하는 등의 자료 처리, 자료의 기술 영역에 속하는 통계학 추측통계학: 모집단에서 추출된 표본의 정보를 토대로 모수를 추정하고, 합리적인 의사결정을 하는 영역에 속하는 통계학 이때 사용하는 자료의 유형을 살펴보자면, 범주형, 수치형으로 구분된다. 범주형 ..