본문 바로가기

시계열 분석 본문

BF 2024/통계

시계열 분석

jaegomhoji 2022. 2. 17. 04:20

************************************************************************************************************

INDEX

** 시계열 분석이란?

** 시계열 데이터의 분류

** 시계열 요소

** 시계열의 종류와 분석 방법

** 단순 시계열 

** 지수 평활법

************************************************************************************************************

 

** 시계열 분석이란? 

> time series analysis : 시계열(시간의 흐름에 따라 기록된 ) 자료를 분석하고 여러 변수들의 인과관계를 분석하는 방법 

 

** 시계열 데이터 

> 시계열 데이터는 시간을 기준으로 관측된 데이터로, 보통 일 -> 주 -> 월 -> 분기 -> 년 또는 hour 시간의 경과에 따라서 관측된 데이터

> GDP, 주가, 거래액, 매출액, 승인금액 등이 시간에 흐름에 따라서 정의한 데이터

> 아래와 같이 분류한다 

 

** 시계열 데이터 분류 

* 연속 시계열

> 자료가 연속적으로 생성

> 대부분의 데이터 형태가 연속형이나 이산형으로 정의( 초 분 시 일 월 주 ~~ 등 시간 단위)하여 분석 

 

* 이산 시계열 

> 일정 시차(간격)을 두고 관측되는 데이터 ( 연속된 시간이 아니라 자료의 시간에 텀이 있다 , 일별 주식 거래량 등  )  

> 대부분 이산형 데이터를 분석

 

** 시계열 데이터 분석의 목적 

> 예측 : 금융시장 예측, 배달 수요 예측 등 미래의 특정 시점에 대한 관심의 대상 ( 반응변수 ) 를 예측 

> 시계열 특성 파악 : 경향 ( trend ), 주기, 계절성, 변동성(패턴) 등 관측치의 시계열 요소(특성) 파악 

 

** 시계열 요소 

* 경향/추세(trend) : 시계열 데이터가 장기적으로 증가(감소)할 때, 추세가 존재한다 

> 트렌드가 있는가? 네 (증가, 감소 )  , 아니오

 

 

* 계절성(seasonality)

> 특정기간(1년 마다..or 주기 ) 때에만 나타나는 패턴

> 계절성을 가지고 어떻게 가중치를 주어야 할지 판단하라! 

> 패션업종(봄,가을) 매출 , 온라인쇼핑몰(월요일 아침), 블랙 프라이데이, 명절 홍삼이나 스팸 매출 등 

 

* 주기성 ( Cycle ) 

> 일정한 주기(진폭)마다 유사한 변동이 반복되는 현상, 보통 경기 순환 ( business cycle )과 관련이 있으며 지속기간은 2년임 

> 계절성과 다른점은, 유사한 변동은 장기적으로는 반복하나 매년 발생하지는 않는다. 

> 현재까지의 비트코인의 떡상 떡락 , 반도체 슈퍼 사이클 

 

* 불규칙 요소 ( irregular movements ) 

> 예측하거나 제어할 수 없는 요소 

> 회귀분석의 오차와 같은 항목들~?

 

* 시계열 구성요소들은 다음과 같은 형태로 확인할 수 있다. 

출처 : https://datacrew.tech/time-series시계열-forecasting-시리즈-1-기본-개념/

 

 

* 전통적인 시계열 분석 방법 

> 이동평균 모형 ( moving average ) : 최근 데이터의 평균을 예측치로 사용하는 방법  MA(n)

> 자기상관 모형 ( Autocorrelation ) : 변수의 과거 값의 선형 조합을 이용하여 예측하는 방법 AR(n) 

> ARIMA(Autoregressive integrated Moving Average ) : 관측값과 오차를 사용해서 모형을 만들어서 미래를 예측하는 방법,

이동평균 + 자기상관 모형 + Integrated~(차분값) 

> 지수평활법 : 일반적으로 많이 씀, 현재에 가까운 시점에 가장 많은 가중치를 주고 멀어질수록 낮은 가중치를 주어서 미래를 예측 

 

** 구분 - 분석 방법과 목적  #다시 다룰 예정 

구분 방법론 데이터 및 예측
단기예측 지수 평활법
시계열 해법
Box-jenkins
수학적 이론에 의존하고 시간에 따라 변동이 많은(빠른) 시계열 자료에 적용
장기예측 회귀분석 방법 장기적으로 예측이 필요한 데이터
직관적 방법 지수평활법
시계열 분해
시간에 따라 변동이 느린 데이터에 활용
다중 시계열 회귀분석(계량경제) 방법
전이함수모형
다변량 ARIMA
시계열데이터와 설명변수가 있는 경우 

 

 

* 단순 이동평균법 

> 과거 데이터의 평균 값 

> 과거 m개 시점의 데이터들의 MA를 계속 구하면서 이동한다. M개의 시점은 적절하게 선택. 

> m이 3개면 과거 3개분의 데이터의 평균이다, 1번째부터 M개의 데이터가 있기 전까지는 NA(자료가 없어서). 

> 수동으로 적절한 웨이트 값을 주어볼 수 있다. 

 

* 지수 평활법

> 모든 관측값을 이용하면서 예측하는 시점에 가까울수록 비중을 두어 최근값 예측시 더 많은 기여를 하도록 만든 방법

 

 

 

'BF 2024 > 통계' 카테고리의 다른 글

분산분석 ( ANOVA )  (0) 2022.02.17
다중 회귀분석  (0) 2022.02.16
단순 회귀분석  (0) 2022.02.15
기본적인 통계분석의 갈래 , when what how  (0) 2022.02.15
범주형 자료 분석  (0) 2022.02.15
Comments