시계열분석
[시계열분석] 평활
syeonny
2024. 9. 12. 14:30
평활 smoothing
불규칙, 계절 성분 등 노이즈를 제거하여 추세를 파악하는 방법
평활 방법
이동 평균 / 국소회귀 lowess / 단순 지수 평활법
- 이동 평균 moving average
단순 평균 x bar
- 단순 이동 평균 SMAt
- 현재 시점에서 m시점까지의 값을 단순하게 다 더하고 모든 데이터에 동일한 가중치 부여
- 이동평균 기간 m

- 가정: 국소적으로 고정된 평균 모형
- n시점에서 l시점 뒤의 값 Xn+l을 예측

- 예측오차

- 고정된 평균 모형

이동 평균 기간 m이 크면 평활의 효과가 커서 지엽적인 변화에 둔감함
m선택하여 MSE(m)이 최소가 되도록 하는 m 선택
2. 중심화 이동 평균 CMA
- t를 기준으로 좌우에 있는 데이터를 포함하여 평균을 구함
- 홀수 일 때

- 짝수 일 때

3. 이중 이동 평균
- 이동평균의 이동평균: 중심화 이동평균을 다시 중심화 이동평균한 것
- 계절성이 있는 데이터나 장기적인 트렌드를 파악할 때 유용하며, 단순 이동평균보다 노이즈를 더 제거할 수 있음

- 예측: n 시점에서 l시점 뒤의 값 Xn+l예측

- 선형추세 모형에선

- 국소회귀 lowess
Lowess => window 일부 데이터 + WLS
- 가중치를 부여하여 추세를 조정
- 특정 구간에 집중하여 그 구간의 데이터에 높은 가중치를 부여하여 회귀선을 구함
- 국소 가중 회귀
국소회귀 -> 잔차 -> 가중치 재조정(잔차의 절댓값에 따라 조정) -> 재조정된 가중치를 이용하여 국소회귀 다시 수행 반복
- 주어진 가로 축의 범위 내에서만 값을 예측할 수 있으며, 가로축의 범위를 벗어난 미래 시점에 대해서는 예측 불가
- 단순 지수 평활법
- 초기값 ESo 평활상수 w
w가 클수록 최근 데이터에 더 많은 가중치를 두고, 과거 데이터는 거의 반영되지 않음
w가 작을수록 과거 데이터에 더 많은 가중치를 두고, 최근 데이터는 덜 반영함
- 단순 지수 평활값
과거에 따라 작은 가중치를 부여함

- 예측: n 시점에서 l시점 뒤의 값 Xn+l예측
- 예측오차

- 초기값 선택하는 방법
최초의 관측값 / 전체 자료의 표본 평균 / 최초 n개의 표본 평균
r
SMA(df, n=12)
lines(lowess(df, f=0.1), col ="red")
HoltWinters(df,beta=False, gamma=False)