데이터를 기반으로

패스트캠퍼스 챌린지 16일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 16일차

이노후 2022. 2. 8. 21:44
728x90
반응형

오늘의 강의는 어제와 비슷하게 시작되었다.

비시계열 데이터에서 설명했던 잔차분석에 대한 시계열 데이터 관점으로의 설명인 강의였다.

 

그 중 오늘은 기존과 다르게 새롭게 들어보는 내용들이 많아 직접 블로그 글에 메모를 하며 강의를 들었다.

 

왼쪽 화면은 블로그 글을 작성하기 전에 메모장 역할로 메모하는 화면이고 오른쪽 화면은 강의화면이다.

 

시계열 모델링에서 잔차진단을 하기 위해 크게 4가지로 나뉜다.

1. 정상성 / 2. 정규분포 / 3. 자기상관 / 4. 등분산성

 

오늘의 강의에서는 1번 정상성과 2번 정규분포의 부분을 진행하였다.

 

가장 먼저 정상성이란 자기상관도 없고 등분산성을 있는 케이스를 의미한다고 한다.

 

한마디로 '정상성 테스트' 에 대한 설명은 자기상관과 등분산성을 하나로 아우른다 라는 의미라고 한다.

 

정확히 무슨 말인지 이해가 안갔지만 강의자님께서 "시간이 흘러도 일정한 상태를 의미한다." 라는 설명을 덧붙여주어 이해가 되었다.

 

어제 강의에서 보았던 백색잡음 그림을 보면 일정한 범위안에서 움직이는 것이 보이는데 이를 정상성이 있다고 말한다.

 

이러한 정상성의 가설검증 방법은 총 4가지가 있다. 

(ADF 를 비롯한 4가지 존재함 - 강의자료 참고)

 

그 중 대표적인 ADF를 중점적으로 설명이 이어졌다.

 

가설 검증은 기본적인 가설 검증과 동일하게 진행된다. (1. 가설확인 / 2. P-value와 유의수준 비교 / 3. 의사결정)

이때 귀무가설은 비정상 상태 / 대립가설은 정상 상태로 설정해두고 검증을 진행한다고 한다.

 

 

왼쪽은 강의자료화면 오른쪽은 강의화면이다.

 

2번째로 정규분포였다. 정규분포 가설 검증도 동일하다. 정상성과 동일한 가설 검증 단계를 거쳐 검증을 진행하고 귀무가설은 정규분포이다 / 대립가설은 정규분포가 아니다 로 설정한 뒤 검증을 진행한다.

 

예전에 시계열 데이터 강의를 수강했을 때 이 4가지의 검증 자체의 개념적인 부분이 이해가 안갔었는데 오늘 강의를 통해 확실히 잡아나갈 수 있을 것 같다는 생각이 들었다.

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형