일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 이항분포
- 사조사
- 첨가행렬
- 기본행연산
- 포아송분포
- 표본평균
- 기댓값과 분산
- 수치형자료
- 누적분포함수
- 범주형자료
- 연속확률변수
- 모수
- 표본공간
- 행사다리꼴
- 베르누이분포
- Anaconda
- 통계학개론
- 피어슨상관계수
- 절삭평균
- pmf
- 이산확률질량함수
- 확률밀도함수
- 통계학입문
- 이변량자료
- jupyter notebook
- 수학적확률
- 이산형
- 모평균
- 균일분포
- 조건부확률
- Today
- Total
Syeonny의 블로그
회귀분석이란? 본문
회귀분석 / 반응변수와 설명변수/ 회귀분석의 분류 / 회귀분석의 절차
회귀분석이란?
관측된 여러 자료로부터 반응변수와 설명변수를 정하고, 이들 사이의 관계식을 추정하고 미지의 값을 예측하는 통계적 분석
반응변수와 설명변수
반응(종속)변수: 흔히 생각하는 y 값으로 우리가 관심 있어 하는 대상이다.
독립변수에 영향을 받음 --> 종속되어 있다!
설명(독립)변수: 흔히 생각하는 x 값으로 관심 있어 하는 대상을 설명해 준다. 설명변수가 하나만 존재하면 단순회귀분석, 여러 개 존재하면 다중회귀분석이다. 입력변수, 예측변수, 회귀변수, 요인으로도 불린다.
결과에 영향을 받지 않음 --> 독립적이다!
회귀분석의 분류
반응변수에 따라 | 일변량 : 하나의 양적 반응변수 (y 값 1개) |
다변량 : 두 개 이상의 양적 반응변수 (y 값 2,3,,,,개) | |
설명변수에 따라 | 단순 : 하나의 설명변수 (x 값 1개) |
다중 : 두 개 이상의 설명변수 (x 값 2,3,,,,개) | |
관계에 따라 | 선형 : 두 변수 간의 관계가 선형적 |
비선형 : 두 변수 간의 관계가 비선형이거나, 일부 모수가 비선형 |
*모수: 우리가 보통 추정하는 값, 모집단의 데이터
*양적: 양의 크기를 나타냄, 수량으로 표시함
*질적: 분류하기 위함, 순서가 존재하지 않음
회귀분석의 절차
1. 문제에 대한 진술: 주어진 문제와 상황을 이해
2. 변수 선택 및 자료 수집: 잠재적으로 적절한 반응변수와 설명변수를 지정한 후에 자료를 수집함 (산점도 등 이용)
3. 모형 설정 및 적합: 잠재적으로 모형을 설정하고, 적합 방법을 선택한 후에 모형을 적합함
4. 회귀진단: 적합한 모형을 평가하고, 검토함. 이 과정에서 회귀 진단 결과가 좋지 않다면, 다른 모형을 적합하여 여러 모형을 비교 검토함
5. 최종 모형 선택 및 예측: 회귀진단에서 얻은 모형이 적합하다면, 이를 선택하여 변수들의 관계를 파악하고 예측함
/* 틀린것이 있다면, 댓글을 남겨주세요
출처: 예제를 통한 회귀분석
*/