일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 범주형자료
- 모평균
- 모수
- jupyter notebook
- 베르누이분포
- 기본행연산
- 표본평균
- 조건부확률
- 행사다리꼴
- 통계학입문
- 첨가행렬
- 이산확률질량함수
- 수치형자료
- 균일분포
- 연속확률변수
- Anaconda
- 확률밀도함수
- 이산형
- 표본공간
- 수학적확률
- 피어슨상관계수
- 이변량자료
- 포아송분포
- 사조사
- 기댓값과 분산
- 이항분포
- 통계학개론
- 절삭평균
- 누적분포함수
- pmf
- Today
- Total
목록2024/09/13 (2)
Syeonny의 블로그

240913이변량분석 범주형 변수 - 카이제곱검정: 시그마 (관측 빈도 - 기대빈도)**2 / 기대빈도 - 가설: 두 변수끼리 관계가 없다 / 있다 범주형 변수 교차표 사용하여 빈도 알기pd.crosstab(data.변수1, data.변수2) # normalize='columns' or 'index' 비율로 나타낼 수 있음 빈도이기에 변수 위치 바껴도 상관이 없다. 시각화: 모자이크플롯 사용mosaic(data, ['변수1', '변수2'])plt.axhline(1- data['변수2'].mean(), color = 'r')plt.show() ex. titanic survive 변수를 이용한다면생존하지 않은 승객의 비율을 나타내는 수평선을 그려 이 선이 전체 데이터에서 어느 정도의 비율이 사망했는지 ..

240912용어 정리 표준 오차: 표준편차를 루트 n으로 나눈 것 범위 max - min 사분위범위 IQR = Q3 - Q1중심극한 정리: 표본이 충분히 클수록 근사적으로 정규성을 가짐 --> 정규분포로 문제 풀이 가능 신뢰구간: 전체 신뢰구간의 95%는 모평균을 포함할 것으로 해석해야 함 범주형 변수와 수치형 변수 분석 t test 두 변수의 평균을 비교하고 싶을 때 사용검정 순서:1. 정규성 검사 Shapiro-Wilk test 유의확률 pvalue 0.05 이상이면 정규성 가정2. 분산 동질성 검사 Levene's test 유의확률 pvalue 0.05 이상이면 분산 동질성 가정 3. t test 정규성을 만족하고, 분산이 동일하면 Student’s t-test (equal_var=True)분산..