summ의 블로그

[시계열분석] 시계열 분석 기초 본문

시계열분석

[시계열분석] 시계열 분석 기초

summ._ 2024. 9. 10. 12:10

240909 

 

Python 시계열 분석 기초 

 

날짜 추출

 

  • 날짜 타입으로 변환
df = pd.to_datetime(df, format = '입력되는 날짜 형식')

 

format 형식 '%d/%m/%Y' 이나 '%d-%m-%Y' 상관없음. 내가 원하는 대로 적으면 된다.   

 

  • 연도 
df.dt.year
df.dt.month
df.dt.day
  • 요일 
df.dt.weekday
  • 요일 이름 
df.dt.day_name()

 

 

시간에 따른 흐름 추가

 

  • shift 

데이터나 인덱스를 원하는 기간만큼 민다. 

데이터를 행 기준 하나씩 민다고 생각.  

df.shift(periods=1, freq=None, axis=0, fill_value=NoDefault.no_default)

 

period 기간 default 1freq=infer 이면 추론해서 넣음 'D' 1일 간격axis = 0 행 1 열 fill_value 결측 채워 넣기

 

df.to_period(freq=None, axis=0, copy=True)

 

기간 변경  'Y' 'M' 'W' 'H'

 

  • rolling 

시간의 흐름에 따라 일정 기간 동안 평균을 이동

df.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None, method='single')df.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None, method='single')

 

rolling(1) default 1

현재 열에 대하여 일정 크기의 window를 이용하여 그 window안의 값을 추가 메서드를 통해 계산

min_periods: 계산할 최소 크기

 

  • diff 

특정 시점의 데이터와 이전 시점의 데이터의 차이 구하기 

df.diff(periods=1, axis=0)

 

axis = 0 행 axis = 1 열 

'시계열분석' 카테고리의 다른 글

[시계열분석] 평활  (0) 2024.09.12
[시계열분석] eda 1  (0) 2024.09.11
[시계열분석] 0. 시계열 자료  (3) 2024.09.11