시계열 분석 본문
************************************************************************************************************
INDEX
** 시계열 분석이란?
** 시계열 데이터의 분류
** 시계열 요소
** 시계열의 종류와 분석 방법
** 단순 시계열
** 지수 평활법
************************************************************************************************************
** 시계열 분석이란?
> time series analysis : 시계열(시간의 흐름에 따라 기록된 ) 자료를 분석하고 여러 변수들의 인과관계를 분석하는 방법
** 시계열 데이터
> 시계열 데이터는 시간을 기준으로 관측된 데이터로, 보통 일 -> 주 -> 월 -> 분기 -> 년 또는 hour 시간의 경과에 따라서 관측된 데이터
> GDP, 주가, 거래액, 매출액, 승인금액 등이 시간에 흐름에 따라서 정의한 데이터
> 아래와 같이 분류한다
** 시계열 데이터 분류
* 연속 시계열
> 자료가 연속적으로 생성
> 대부분의 데이터 형태가 연속형이나 이산형으로 정의( 초 분 시 일 월 주 ~~ 등 시간 단위)하여 분석
* 이산 시계열
> 일정 시차(간격)을 두고 관측되는 데이터 ( 연속된 시간이 아니라 자료의 시간에 텀이 있다 , 일별 주식 거래량 등 )
> 대부분 이산형 데이터를 분석
** 시계열 데이터 분석의 목적
> 예측 : 금융시장 예측, 배달 수요 예측 등 미래의 특정 시점에 대한 관심의 대상 ( 반응변수 ) 를 예측
> 시계열 특성 파악 : 경향 ( trend ), 주기, 계절성, 변동성(패턴) 등 관측치의 시계열 요소(특성) 파악
** 시계열 요소
* 경향/추세(trend) : 시계열 데이터가 장기적으로 증가(감소)할 때, 추세가 존재한다
> 트렌드가 있는가? 네 (증가, 감소 ) , 아니오
* 계절성(seasonality)
> 특정기간(1년 마다..or 주기 ) 때에만 나타나는 패턴
> 계절성을 가지고 어떻게 가중치를 주어야 할지 판단하라!
> 패션업종(봄,가을) 매출 , 온라인쇼핑몰(월요일 아침), 블랙 프라이데이, 명절 홍삼이나 스팸 매출 등
* 주기성 ( Cycle )
> 일정한 주기(진폭)마다 유사한 변동이 반복되는 현상, 보통 경기 순환 ( business cycle )과 관련이 있으며 지속기간은 2년임
> 계절성과 다른점은, 유사한 변동은 장기적으로는 반복하나 매년 발생하지는 않는다.
> 현재까지의 비트코인의 떡상 떡락 , 반도체 슈퍼 사이클
* 불규칙 요소 ( irregular movements )
> 예측하거나 제어할 수 없는 요소
> 회귀분석의 오차와 같은 항목들~?
* 시계열 구성요소들은 다음과 같은 형태로 확인할 수 있다.
* 전통적인 시계열 분석 방법
> 이동평균 모형 ( moving average ) : 최근 데이터의 평균을 예측치로 사용하는 방법 MA(n)
> 자기상관 모형 ( Autocorrelation ) : 변수의 과거 값의 선형 조합을 이용하여 예측하는 방법 AR(n)
> ARIMA(Autoregressive integrated Moving Average ) : 관측값과 오차를 사용해서 모형을 만들어서 미래를 예측하는 방법,
이동평균 + 자기상관 모형 + Integrated~(차분값)
> 지수평활법 : 일반적으로 많이 씀, 현재에 가까운 시점에 가장 많은 가중치를 주고 멀어질수록 낮은 가중치를 주어서 미래를 예측
** 구분 - 분석 방법과 목적 #다시 다룰 예정
구분 | 방법론 | 데이터 및 예측 |
단기예측 | 지수 평활법 시계열 해법 Box-jenkins |
수학적 이론에 의존하고 시간에 따라 변동이 많은(빠른) 시계열 자료에 적용 |
장기예측 | 회귀분석 방법 | 장기적으로 예측이 필요한 데이터 |
직관적 방법 | 지수평활법 시계열 분해 |
시간에 따라 변동이 느린 데이터에 활용 |
다중 시계열 | 회귀분석(계량경제) 방법 전이함수모형 다변량 ARIMA |
시계열데이터와 설명변수가 있는 경우 |
* 단순 이동평균법
> 과거 데이터의 평균 값
> 과거 m개 시점의 데이터들의 MA를 계속 구하면서 이동한다. M개의 시점은 적절하게 선택.
> m이 3개면 과거 3개분의 데이터의 평균이다, 1번째부터 M개의 데이터가 있기 전까지는 NA(자료가 없어서).
> 수동으로 적절한 웨이트 값을 주어볼 수 있다.
* 지수 평활법
> 모든 관측값을 이용하면서 예측하는 시점에 가까울수록 비중을 두어 최근값 예측시 더 많은 기여를 하도록 만든 방법
'BF 2024 > 통계' 카테고리의 다른 글
분산분석 ( ANOVA ) (0) | 2022.02.17 |
---|---|
다중 회귀분석 (0) | 2022.02.16 |
단순 회귀분석 (0) | 2022.02.15 |
기본적인 통계분석의 갈래 , when what how (0) | 2022.02.15 |
범주형 자료 분석 (0) | 2022.02.15 |