데이터를 기반으로

패스트캠퍼스 챌린지 48일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 48일차

이노후 2022. 3. 12. 23:51
728x90
반응형

어제의 강의는 실습을 통해 ARMA 패턴을 이해하고 그래프를 해석하는 방식의 강의가 이어졌다. 

 

오늘은 실제 데이터를 가지고 ARMA를 적용하여 해석하고 분석하는 시간을 가지기로 했다.

 

왼쪽 화면은 강의자료이자 실습 화면이고 오른쪽 화면은 강의 화면이다.

 

AR의 차수는 PACF그래프를 보고 가늠할 수 있고 MA는 ACF그래프롤 보고 차수를 정할 수 있었다. 

 

이론적으로 ARMA(p,q)을 해당 ACF, PACF를 보고 파악하여 적용하는 방식으로 진행된다.

 

왼쪽의 출력그래프를 보면 가장 상단은 해당 데이터에 대한 PLOT 이고 중간에는 ACF이고 마지막은 PACF 그래프이다.

 

자세히 보면 ACF와 PACF 모두 LAG(1)에서 높은 상관관계가 보이고 있다. 

 

즉, 해당 그래프를 보고 ARMA(1,1)로 적용해야겠다 라는 생각을 해야한다. 

 

왼쪽 화면은 강의자료이자 실습 화면이고 오른쪽 화면은 강의 화면이다.

 

왼쪽 그래프를 보면 애매한 LAG(12~13) 사이에 튀어 나와있는 부분때문에 차수를 정하기가 애매한 상황인 데이터들도 존재한다.

 

하여, 실습코드에서는 강사님께서 p와 q를 특정 범위내에서 FOR문으로 조합하면서 잔차 ACF와 PACF 를 보면서 정할 수 있게 코드를 작성해두셨다.

 

각 q와 p의 범위에서 출력될때 잔차와 AIC, BIC 등 통계치들을 확인한 후 하단의 ACF, PACF 그래프를 보면서 종합적으로 판단하는 방식으로 진행했다.

 

그 다음 강의는 ARMAX에 대한 설명으로 이어졌는데 ARMA 이외에 추가적인 독립변수를 반영하고 모델링하는 방법과 ARMAX의 한계를 이해하고 향후 방향을 정리하는 강의였다.

 

독립변수를 추가한다는 부분이 이해가 잘 안갈 수 있지만 쉽게말해 잔차를 백색소음으로 만드는 것으로 이해하면 된다.

 

즉, y= f(Xt + Xt+1 + ...) + f(x) 이런 식으로 나타난다고 생각하면 편하다.

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형