데이터를 기반으로

패스트캠퍼스 챌린지 15일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 15일차

이노후 2022. 2. 7. 23:03
728x90
반응형

오늘의 강의는 여태 진행되었던 비시계열에 대한 강의를 한번 쭉 진행 후 다시 시계열 데이터의 관점으로 바라보는 강의로 시작되었다.

 

월요일은 다시 자취방으로 돌아와 듀얼모니터로 실습파일을 보며 강의를 시청했다.

 

오늘은 비시계열 데이터에서 잔차분석에 해당하는 파트를 시계열 데이터 관점으로 바라보며 설명을 해주었다.

 

이전에 시계열 데이터 분석을 진행했을 때 백색소음(White Noise)라는 단어를 들어본 적이 있다.

 

정확한 개념은 몰랐지만 오늘 강의를 듣고 개념이 조금 잡혔다. 우리가 실제 관측되는 데이터(표본데이터)와 예측치 사이의 차이를 잔차라고 한다. 해당 잔차가 정규분포를 띄며 상관성이 없는 것이 해당 모델의 개선의 여지가 없음을 의미한다.

 

먼저 잔차 부분을 보면 잔차의 정규분포인지 아닌지 판별하는 방법은 여러가지가 있었다.그 중 강의에서 제일 기억에 남는 방법은 잔차 그래프를 90도 회전시켜 각각의 축별로 누적치를 쌓아 히스토그램을 그린 뒤 해당 그래프가 정규분포의 모양인지 아닌지 판별하는 방식이었다.

 

왼쪽은 강의자료 오른쪽 화면은 강의화면이다.

 

그리고 나머지 하나인 상관성이 없어야하는 부분인데, 해당 부분은 이전에 공분산과 상관계수 등 이러한 설명을 진행했던 강의를 생각해보면 이해가 더 쉬워진다.

 

왼쪽은 강의자료화면이고 오른쪽은 강의화면이다.

 

우선 가장 자기상관의 원초적인 개념은 X1이라는 변수가 있으면 X1변수 스스로와의 상관관계를 의미한다. 이게 무슨의미이냐면 X1의 변수의 t 시점과 t+1 시점의 상관관계를 말한다. 

 

이러한 개념이기에 자기상관이라고 지칭을 하며 불렀던 것이고 기존에 회귀분석을 진행했을 때 몇 가지 가정들이 있었던 것이 기억이 났다.

 

이러한 가정들이 백색잡음에서도 적용이 되어서 이해가 조금 더 쉬웠다.

 

그리고 자기상관함수는 사진의 강의자료화면을 보면 ACF에 대한 그래프가 나온다. 상단/하단에 파란색 점선으로 표시되어 있는데 해당 라인을 넘어가면 x축(시간)의 값이 자기상관이 있다는 것이다.

 

해당 시점의 자기상관을 없애는 개선이 필요하다고 해석할 수 있는 부분이다.

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형