데이터를 기반으로

패스트캠퍼스 챌린지 42일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 42일차

이노후 2022. 3. 6. 13:23
728x90
반응형

오늘의 강의는 어제에 이어 실습을 통해 정상성 테스트를 하는 부분을 이어서 진행했다.

 

왼쪽 화면은 강의 자료이자 실습화면이고 오른쪽 화면은 강의 화면이다.

 

어제에 이어서 실습코드를 실행해보니 ADF는 비정상성을 말하고 KPSS는 정상성을 말하고 ACF그래프를 보니 시간이 지나면서 점차 하강하는 추세가 보여진다.

 

이렇게 각각이 다른 정상성에 대해 말해주고 있기에 한가지 테스트에 의존하여 결정하면 안된다고 한다.

 

일반적으로 OLS로 진행했을 때와 차분을 했을 때 각각의 통계량과 ACF를 비교해보면 모두 다 값이 일치하게 나오진 않는다. 먼저 기본적으로 가공하지 않은 raw data를 보면 ADF, KPSS 각각 비정상성을 의미할 때가 많다.

 

간혹 raw data가 모두 정상성을 가질 수 있지만 확률적으로 매우 드물다. 하여 먼저 OLS를 통해 각각의 통계치를 보며 정상성을 판단하고 그 이후 어제 강의에서 말씀해주신 차분을 이용한다.

 

해당 실습에서는 shift를 사용했지만 diff라는 기능도 좋으니 많이 사용하면 좋을 것 같다. 값은 동일하게 나온다.

 

왼쪽 화면은 강의자료 및 실습 코드 화면이고 오른쪽은 강의 화면이다.

 

오른쪽 화면을 보시면 해당 그래프는 랜덤워크를 OLS를 통해 그려본 그래프이다. 랜덤워크란 예전에 화이트 노이즈를 설명할 때 강사님이 설명해주신 부분이다.

 

다시 돌아와 랜덤워크 부분을 그냥 정상성 테스트를 해보면 ADF, KPSS 는 모두 비정상성으로 나오고 ACF 그래프를 보면 하늘 색부분을 넘어가는 바들이 많이 보이는 것을 확인할 수 있다. 

 

그 다음 실습을 진행해보면 차분을 한번 진행한 후 결과를 보니 ADF, KPSS, ACF 모두 다 정상성을 보여주는 것을 확인할 수 있었다.

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형