데이터를 기반으로

패스트캠퍼스 챌린지 47일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 47일차

이노후 2022. 3. 11. 23:10
728x90
반응형

어제의 강의는 ARMA에 대한 이론적인 강의라고 했다면 오늘은 실습을 통해 ARMA의 패턴을 이해하는 시간을 가져보기로 했다.

 

왼쪽 화면은 강의 자료이자 실습 코드이고 오른쪽 화면은 강의화면이다.

 

왼쪽에 해당하는 실습 코드 중 ARMA 모델을 FIT 하는 부분이 있다. 해당 FIT을 한 후 FORECAST를 사용하여 STEP의 옵션을 주어 몇번째까지 예측할 것인지에 대한 추정치를 뽑을 수 있다.

 

예측치를 추출하면 3개자의 ARRAY의 값이 출력된다. 위 부터 FORECAST / STDERR / CONF_INT 라고 한다.

FORECAST는 우리가 가장 유심히 봐야할 점추정값이고 STDERR는 표준편차 그리고 CONF_INT는 구간추정값이다.

 

우리는 점추정과 구간추정 값들을 유심히 봐야한다. 

 

출력값을 자세히 보면 첫번째 출력된 점추정에 있는 1번 값은 세번째 출력된 구간추정의 1번 구간 사이에 있는 값임을 알 수 있다.

 

왼쪽화면은 강의자료이자 실습 코드 화면이고 오른쪽 화면은 강의화면이다.

 

위에 출력값들에 대한 시각화 그래프를 그린 화면이다. 

 

왼쪽 화면을 보면 그래프 중 왼쪽 하단의 그래프가 ACF이고 오른쪽 하단이 PACF 그래프 이다. ACF를 보면 시간이 지날 수록 하락하는 모습이긴 하나 0을 기준으로 음수와 양수를 왔다갔다하고 있다. 

 

그리고 PACF 그래프를 보면 2번째의 0.75 정도의 높은 값이 나온 것을 확인할 수 있다. 

 

ARMA도 그래프 상단에 출력되는 통계량을 담고 있는 표를 출력하는 이유는 결국 T검정 처럼 유의함을 검증하기 위함이다.

 

이후 AR 부분의 차분을 2를 사용하고 보니 위의 기존 모형과 크게 달라지지 않았으나 PACF는 2개의 수치가 확인되었다.

 

여태까지는 AR이나 MA만 따로 그려보았는데 같이 그려보니 MA와 AR 특징을 포함하고 있는 그래프들이 도출되어 쉽게 의사 결정하기 어렵다. 그래서 통계량을 보고 판단한다고 한다.

 

그리고 너무 많은 파라미터를 사용할 경우 과적합이 발생할 수 있다. 그러다보면 자기상관이 많아지게 된다.

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형