데이터를 기반으로

패스트캠퍼스 챌린지 41일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 41일차

이노후 2022. 3. 5. 23:39
728x90
반응형

어제 강의는 차분에서 계절성을 제거하는 부분까지 진행하였다.

 

오늘의 강의는 차분에서 추세를 제거하는 부분부터 강의가 시작되었다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

차분에서 추세를 제거하는 방법은 크게 2가지가 있다. 그 중 첫번째는 추세를 추정하고 해당 추세를 제거하여 정상성을 확보하는 방법이다.

 

해당 방법은 계절성 제거하는 첫 번째 방법과 동일하게 사람의 주관적인 판단이 들어가는 부분이라 얼마나 잘 추세를 반영하여 제거했는지 확인하기 애매하다.

 

하여, 두 번째 방법을 사용하는데  해당 수식을 보면 계절성과 조금 다른 수식인데 d는 차분인데 처음 차분 1로 진행하고 추세가 사라지지 않았다면 d를 2로 두고 한번 더 적용하는 식으로 추세가 사라질 때 까지 해당 방법을 추세가 제거될 때까지 진행하는 방법이다.

 

그리고 마지막인 Box-Cox 변환인데 해당 변환은 많이 사용되지 않은 변환인데 정규분포가 아닌 자료를 정규분포로 변환하기 위해 사용하는 방식이다.

 

람다라는 파라미터를 통해 정규분포가 아닐 경우 해당 공식에 맞춰 정규분포가 될 때까지 람다의 값을 찾아 적용하여 정규분포화 하는 방식이다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

그렇게 변환한 값들의 정상성 테스트를 진행하는데 방법은 2가지가 있다. ADF / KPSS 가 있는데 ADF는 추세 제거를 확인하는 방법이고 KPSS는 계절성이 제거되었는지 확인하는 방법이다.

 

모델링을 하고 추세를 제거하고 확인하는 방법은 잔차를 시각화하여 확인하는 방식으로 진행했다.

 

정상성 테스트의 ADF 테스트의 H0는 비정상 / H1 정상 이라는 가설로 시작하고 KPSS는 H0가 정상 / H1 비정상으로 두고 진행한다.

 

차분은 DIFF 라는 함수로 사용한다. 원래는 LAG로 진행하는 SHIFFT함수를 사용해왔지만 더 손 쉬운 DIFF 함수를 사용하면 된다.

 

 

 

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형