데이터를 기반으로

패스트캠퍼스 챌린지 39일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 39일차

이노후 2022. 3. 3. 23:21
728x90
반응형

이전 강의는 알고리즘 용어에 대한 정리를 하는 시간을 가졌었다.

 

이번 강의는 정상성 데이터에 초점을 맞춰서 어떻게 변환하는지와 그에 맞는 효과가 무엇인지 보는 시간을 가졌다.

 

정상성에 대한 이론적 이해와 실습의 관점을 한번에 설명한다고 한다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

우리는 여태 X에 대한 추세, 계절성, 더미, lag 등을 사용하며 정상성을 확인해 왔다. 하지만 Y에 대해 볼것이다 이제는

 

Y에 대한 정상성을 만들고자하는데 Y에서는 X에서 보던 추세, 계절성 등 없는 것이 정상이라고 한다.

 

그래프로 보면 비정상성은 어떠한 추세가 껴있고 정상성에는 추세가 없고 일정한 변동 폭으로 시간이 흘러도 동일하게 보여지면 정상성이라고 한다.

 

이는 추세가 있다고해서 예측을 못하는 것은 아니지만 일정한 규격안에서 왔다갔다하는 것이 예측하기 더 쉽다.

 

이러한 현상에서 이전에 X와 동일하게 비정상성을 정상성으로 변환 후 예측치를 구한 뒤 다시 비정상성으로 변경하는 방식으로 진행한다.

 

이렇게 진행하는 이유는 크게 예측 성능이 올라가는 측면과 모델의 복잡성이 낮아지는 즉, 과적합이 적어지는 효과가 있어 이렇게 진행한다.

 

하지만 무조건 정상성을 만족시키게 변화하는 것만이 정도는 아니다. 이것은 데이터의 특성에 따라 각각 다르기 때문에 모델을 만들 때 기존에 비정상성을 보였던 데이터 그대로 돌린 것 한개와 정상성으로 변형해서 돌린 것 각각을 만들어 비교하는 식으로 접근해야 더 정확한 데이터 분석이 될 수 있다.

 

왼쪽 화면은 강의 내용을 블로그에 정리하는 화면이고 오른쪽 화면은 강의 화면이다.

 

오늘 강의는 여기서 끝났고 다음 강의에서는 어떻게 비정상성을 정상성으로 바꿀지에 대한 방법론에 대해서 강의가 이어질 것이라고 안내받았다.

 

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형