데이터를 기반으로

패스트캠퍼스 챌린지 50일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 50일차

이노후 2022. 3. 14. 23:13
728x90
반응형

어제의 강의는 ARMA 이외에 추가적으로 X 독립변수를 반영하고 모델링을 해보았고 ARMAX의 한계를 이해하고 추후 방향을 정리해보았다.

 

오늘은 ARIMA 알고리즘에 대해 이해하고 패턴을 정리하는 시간을 가졌다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

그림에서 보이듯이 오른쪽 강의화면을 보면 강사님께서 ARIMA에 대한 개념을 설명해주고 있다. ARIMA와 여태까지 배운 ARMA와의 차이가 무엇인가? I 하나가 더 추가된건데 여기서 ARIMA의 세부 단어의 뜻을 알면 더 쉽게 이해가 간다.

 

ARIMA란 , AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE 이다. INTEGRATED 가 추가된 것이다.

 

통합된 이란 뜻으로 AR과 MA를 통합하는 것인데 여기서 추세라는 개념이 더 추가된다. 정확히 말하면 추세차분을 진행한 뒤 AR과 MA의 선형조합을 나타낸 것이 ARIMA인 것이다.

 

비정상인 시계열을 차분을 이용해 정상을 만든 뒤 ARMA 모델링을 하는 과정으로 바라보면 된다.

 

이후 부분은 수식적인 증명이 추가되어 넘어가도록 한다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

비정상 데이터를 정상성 형태로 변환하면서 차분의 횟수를 정하고 ACF, PACF를 보며 q, p를 정하는 식의 과정이 ARIMA 모델링을 진행하는 과정이다.

 

오른쪽 그림을 보면 알겠지만 계수가 음수일 때는 ACF가 위 아래로 왔다갔다 하는 모습을 확인할 수 있다.

 

그 다음은 상수항에 대한 설명인데 보통 수식은 Y = c + F(x) + e 인데 C대신 ARIMA를 사용할 수도 있다.

 

만약 C와 차분 D 가 0이라는 것은 점추정은 0 , 예측의 구간추정은 과거데이터의 표준편차를 말한다. 이미 D가 0이라는 것은 데이터가 이미 정상성이라는 뜻이다.

 

위와 같은 상수항과 D에 해당하는 표는 저러한 케이스들이 존재한다는 것이지 모든 데이터가 저기에 존재하는 케이스에만 국한된다는 것은 아니니 혼동하면 안된다.

 

다음 시간에는 오늘 배운 이론을 토대로 실습 예제를 사용하여 ARIMA 패턴을 더 깊게 이해하는 시간을 가져보도록 하자.

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형