일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 표본평균
- jupyter notebook
- 기본행연산
- 조건부확률
- 통계학입문
- 첨가행렬
- pmf
- 이산형
- 범주형자료
- 확률밀도함수
- 기댓값과 분산
- 모수
- 수치형자료
- 이산확률질량함수
- 절삭평균
- 이항분포
- 연속확률변수
- 이변량자료
- 행사다리꼴
- 균일분포
- Anaconda
- 수학적확률
- 포아송분포
- 베르누이분포
- 통계학개론
- 피어슨상관계수
- 누적분포함수
- 모평균
- 사조사
- 표본공간
- Today
- Total
목록회귀분석 (3)
Syeonny의 블로그

최소제곱법 점이 존재하고, 내가 고려하는 함수가 존재할 때 함수와 점의 실제 차이를 구하는 방법에 관해 알아보자. 최소제곱직선과 최소제곱법 최소제곱직선은 y값(점)과 함숫값의 차이의 제곱합을 계산해서 후보 함수 중 최소가 되는 최적의 직선을 선택하는 것이다. 최소 제곱 직선은 최소 제곱법을 이용하여 찾을 수 있다. 최소제곱법 ordinary least squares 은? 어떤 계의 해방정식을 근사적으로 구하는 방법으로, 근사적으로 구하려는 해와 실제 해의 오차의 제곱의 합 이 최소가 되는 해를 구하는 방법으로 줄여서 OLS 라고 불린다. S(a0, a1) 안의 함수가 최소가 되게 해주는 a값들이 argmin이다. 우선 Sxx Syy를 가정하자. 이를 통해 argmin 구하는 과정을 살펴보면 다음과 같다...

이변량 자료 / 산점도 / 이상치 / 모상관계수 / 표본상관계수 / 공분산 / 상관성 검정 용어 정리 이변량 자료 두 개의 수치를 갖는 하나의 자료를 뜻한다. (xi, yi) i번째 개체에 대한 두 변수의 관측값 상관관계 일정한 수치로 계산되어 두 대상이 서로 관련성이 있다고 추측하는 것 산점도 이변량 자료를 2차원 좌표평면에 나타낸 그림이다. 산점도를 이용하여 두 변수 간의 관계를 쉽게 파악할 수 있다. 주어진 산점도에서 (평일과 일요일) 두 변수는 양의 선형관계를 이루고 있다는 사실이 파악 가능하다. 선형 관계는 양의 선형관계, 음의 선형관계, 직선이 아닌 관계, 선형관계가 없을 수 있다. 이상치 (= 극단치) 데이터의 범위에서 크게 동떨어진 값을 의미하며, 특정 그룹에 속하지 않는다. 산점도에서 확..

회귀분석 / 반응변수와 설명변수/ 회귀분석의 분류 / 회귀분석의 절차 회귀분석이란? 관측된 여러 자료로부터 반응변수와 설명변수를 정하고, 이들 사이의 관계식을 추정하고 미지의 값을 예측하는 통계적 분석 반응변수와 설명변수 반응(종속)변수: 흔히 생각하는 y 값으로 우리가 관심 있어 하는 대상이다. 독립변수에 영향을 받음 --> 종속되어 있다! 설명(독립)변수: 흔히 생각하는 x 값으로 관심 있어 하는 대상을 설명해 준다. 설명변수가 하나만 존재하면 단순회귀분석, 여러 개 존재하면 다중회귀분석이다. 입력변수, 예측변수, 회귀변수, 요인으로도 불린다. 결과에 영향을 받지 않음 --> 독립적이다! 회귀분석의 분류 반응변수에 따라 일변량 : 하나의 양적 반응변수 (y 값 1개) 다변량 : 두 개 이상의 양적 반..