데이터를 기반으로

패스트캠퍼스 챌린지 18일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 18일차

이노후 2022. 2. 10. 23:09
728x90
반응형

어제 강의까지는 이론 수업이었고 오늘 부터는 실습 코드를 이용한 강의가 진행되었다.

 

실습 코드의 8번 차례인 잔차 시각화에 관련된 실습이었다.

 

일반적인 데이터의 시각화를 진행해 왔지만 잔차에 대한 시각화를 해보는 것은 이번 실습을 기점으로 처음이다.

 

대부분 시각화를 하면서 겪었던 문제점들도 잔차 시각화에서도 동일하게 보여지는 부분이 많았다.

 

가장 먼저 범위 이슈이다. 이상치 하나 때문에 그래프 전체가 한쪽으로 쏠려서 보이는 적이 많다. 그렇기에 해당 이상치를 제거하고 시각화를 다시해보면 치우쳐지지 않은 그래프를 확인할 수 있다.

 

강의자님께서 강조해주신 부분은 잔차를 시각화할 때 가장 먼저 떠오르는 생각이 '이게 화이트 노이즈인가?' 라는 관점으로 그래프를 바라 보라고 하셨다.

 

화이트 노이즈이면 이상적인 잔차이기에 더 이상 손볼 곳이 없다. 하지만 추세를 띄거나 방향성이 보이거나 등 화이트 노이즈가 아니라면 더 수정해야한다.

 

왼쪽 화면은 강의자료 화면이고 오른쪽은 강의화면이다.

 

왼쪽 화면을 보면 잔차를 seaborn 패키지의 lmplot함수를 이용하여 그래프를 그린 것인데 가운데 빨간 선이 추세를 의미한다. 어느정도 기울어진 추세로 인해 화이트 노이즈가 아니라고 판단된다.

 

그 이후 자기상관에 대한 시각화를 진행한다.

 

왼쪽 화면은 강의자료 화면이고 오른쪽은 강의화면이다.

 

왼쪽의 4가지로 나뉘어져 있는 화면의 산점도를 보면 다들 상관관계가 어느 정도있는 것으로 보여진다.

해당 그래프는 t 시점과 t+1 시점의 상관관계가 있는 지 보여주는 그래프이다.

 

해당 그래프 밑에 자기상관은 lag를 기반으로 하나씩 시점이 밀려가면서 t 시점과 t+1 , t+2 ... 의 상관계수를 쭉 보여주는 그래프이다.

 

그림과 같이 가장 처음은 t 시점과 t 시점의 상관계수라 1이나오고 시간이 갈수록 점차 줄어드는 것을 확인할 수 있다.

 

 

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형