일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 조건부확률
- 피어슨상관계수
- 절삭평균
- 수학적확률
- 수치형자료
- jupyter notebook
- 누적분포함수
- 이항분포
- 표본공간
- 포아송분포
- 균일분포
- 기본행연산
- 확률밀도함수
- 연속확률변수
- 모수
- pmf
- 기댓값과 분산
- 이변량자료
- Anaconda
- 범주형자료
- 모평균
- 이산확률질량함수
- 베르누이분포
- 첨가행렬
- 통계학입문
- 사조사
- 통계학개론
- 표본평균
- 이산형
- 행사다리꼴
- Today
- Total
목록시계열분석 (5)
Syeonny의 블로그

분해 decompose 독립적으로 구성된 여러 성분이 합해져 하나의 시계열을 이룸. 체계적 성분 : 관심의 대상이며, 예측이 가능함 추세 성분 trend : 시간의 경과에 따라 증가하거나 감소함계절성분 seasonal : 비교적 주기가 짧고, 규칙적으로 반복함 순환 성분 cyclical : 주기적인 변화, 계절 변화도 없고 주기가 길다 불규칙 성분 : 관심의 대상이 아니며, 예측이 불가능함 우연 성분 irregular : 시간에 관계가 없으며 우연적임위의 이러한 성분들은 결합 방식에 따라 다르게 표현할 수 있다. 결합 방식 * 보통 모형에서 순환 성분은 제외함 가법 모형 additive model 승법 모형 multiplicate model 로그 가법 모형 분해 과정 추세 성분 추정 → 추..

평활 smoothing 불규칙, 계절 성분 등 노이즈를 제거하여 추세를 파악하는 방법 평활 방법 이동 평균 / 국소회귀 lowess / 단순 지수 평활법 - 이동 평균 moving average 단순 평균 x bar 단순 이동 평균 SMAt현재 시점에서 m시점까지의 값을 단순하게 다 더하고 모든 데이터에 동일한 가중치 부여이동평균 기간 m 가정: 국소적으로 고정된 평균 모형n시점에서 l시점 뒤의 값 Xn+l을 예측예측오차 고정된 평균 모형 이동 평균 기간 m이 크면 평활의 효과가 커서 지엽적인 변화에 둔감함 m선택하여 MSE(m)이 최소가 되도록 하는 m 선택 2. 중심화 이동 평균 CMAt를 기준으로 좌우에 있는 데이터를 포함하여 평균을 구함홀수 일 때 짝수 일 때 3. 이중 이동 평균 이동평균의 이동..

시각화 airquality 주기적 변동 + 상승하는 추세 df['Date'] = pd.to_datetime(df['Month'])df = df.drop('Month', axis = 1)df = df.set_index('Date')plt.figure(figsize = (15,5))df['Passengers'].plot(); 용어 정리 확률과정: 확률변수들의 집합 {Xt}t time 평균함수 자기 공분산 함수서로 다른 시점의 공분산 가운데 중심 0을 기준으로 변동이 커진다면 평균이 증가하는 것. 가운데 중심 0을 기준으로 진폭이 일정하면 평균이 일정한 것. 가운데 중심 0을 기준으로 진폭이 커진다면 분산이 증가하는 것. 가운데 중심 0을 기준으로 진폭이 일정하면 분산이 일정한 것. 표본 상관..
시계열 자료 시간의 흐름에 따라 여러 시점에 걸쳐 반복적으로 관측하여 수집한 데이터 ex 주식, 날씨 ... 자료 구분 횡단면 자료 cross-sectional: 한 시점에 관찰된 여러 변수 종단면 자료 - 시계열 자료 time series 종단 자료 - 패널 자료 panel: 여러 개체들을 여러 시간에 걸쳐서 추적 시계열 자료 특징 독립이라고 가정할 수 없음 자료 간 간격이 작으면 관측된 자료 사이의 관련성 증가 연간 / 분기별 / 월별 / 주별 / 일별 / 시간별로 나누어진 데이터 존재 일변량 시계열 가로축: 관측 시점세로축: 관측 값 시계열 데이터 예측 기존의 시계열 데이터를 갖고 그다음 데이터를 예측하는 것임 forecast예측 대상이 되고 있는 변수의 과거 자료 평가사전: 자료..
240909 Python 시계열 분석 기초 날짜 추출 날짜 타입으로 변환df = pd.to_datetime(df, format = '입력되는 날짜 형식') format 형식 '%d/%m/%Y' 이나 '%d-%m-%Y' 상관없음. 내가 원하는 대로 적으면 된다. 연도 df.dt.year월df.dt.month일df.dt.day요일 df.dt.weekday요일 이름 df.dt.day_name() 시간에 따른 흐름 추가 shift 데이터나 인덱스를 원하는 기간만큼 민다. 데이터를 행 기준 하나씩 민다고 생각. df.shift(periods=1, freq=None, axis=0, fill_value=NoDefault.no_default) period 기간 default 1freq=infer 이면 추론..