summ의 블로그

[시계열분석] 평활 본문

시계열분석

[시계열분석] 평활

summ._ 2024. 9. 12. 14:30

평활 smoothing 

불규칙, 계절 성분 등 노이즈를 제거하여 추세를 파악하는 방법 
 
평활 방법 
이동 평균 / 국소회귀 lowess / 단순 지수 평활법 

- 이동 평균 moving average 

단순 평균 x bar 
 

  1. 단순 이동 평균 SMAt
  • 현재 시점에서 m시점까지의 값을 단순하게 다 더하고 모든 데이터에 동일한 가중치 부여
  • 이동평균 기간 m 

 
 
 
 

  • 가정: 국소적으로 고정된 평균 모형
  • n시점에서 l시점 뒤의 값 Xn+l을 예측
  • 예측오차 
  • 고정된 평균 모형 

 
이동 평균 기간 m이 크면 평활의 효과가 커서 지엽적인 변화에 둔감함
m선택하여 MSE(m)이 최소가 되도록 하는 m 선택 
 
   2. 중심화 이동 평균 CMA

  • t를 기준으로 좌우에 있는 데이터를 포함하여 평균을 구함
  • 홀수 일 때 
  • 짝수 일 때 

 
 
   3. 이중 이동 평균 

  • 이동평균의 이동평균: 중심화 이동평균을 다시 중심화 이동평균한 것  
  • 계절성이 있는 데이터나 장기적인 트렌드를 파악할 때 유용하며, 단순 이동평균보다 노이즈를 더 제거할 수 있음
  • 예측: n 시점에서 l시점 뒤의 값 Xn+l예측 
  • 선형추세 모형에선 

 
 

- 국소회귀 lowess

Lowess => window 일부 데이터 + WLS

  • 가중치를 부여하여 추세를 조정
  • 특정 구간에 집중하여 그 구간의 데이터에 높은 가중치를 부여하여 회귀선을 구함
  • 국소 가중 회귀

국소회귀 -> 잔차 -> 가중치 재조정(잔차의 절댓값에 따라 조정) -> 재조정된 가중치를 이용하여 국소회귀 다시 수행 반복

  • 주어진 가로 축의 범위 내에서만 값을 예측할 수 있으며, 가로축의 범위를 벗어난 미래 시점에 대해서는 예측 불가

 

- 단순 지수 평활법 

  • 초기값 ESo 평활상수 w

w가 클수록 최근 데이터에 더 많은 가중치를 두고, 과거 데이터는 거의 반영되지 않음
w가 작을수록 과거 데이터에 더 많은 가중치를 두고, 최근 데이터는 덜 반영함
 

  • 단순 지수 평활값 

과거에 따라 작은 가중치를 부여함

 
 

  • 예측: n 시점에서 l시점 뒤의 값 Xn+l예측   
  • 예측오차
  • 초기값 선택하는 방법

최초의 관측값 / 전체 자료의 표본 평균 / 최초 n개의 표본 평균 
 
 

SMA(df, n=12)
lines(lowess(df, f=0.1), col ="red")
HoltWinters(df,beta=False, gamma=False)

 

 

'시계열분석' 카테고리의 다른 글

[시계열분석] eda 1  (0) 2024.09.11
[시계열분석] 0. 시계열 자료  (3) 2024.09.11
[시계열분석] 시계열 분석 기초  (0) 2024.09.10