데이터를 기반으로

패스트캠퍼스 챌린지 28일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 28일차

이노후 2022. 2. 20. 23:40
728x90
반응형

오늘의 강의는 약정상성과 강정상성의 강의인 어제 내용과 이어지는 강의였다.

 

어제 정상성에서는 시간이 흘러도 통계적인 특성이 달라지지 않는 것을 의미한다 했지만 실제 데이터가 시간이 흘러도 일정한 평균과 분산과 표준편차 등을 가지기는 힘든일이다. 

 

그래서 약정상성과 강정상성을 나누어 보고자하는 것이다.

 

왼쪽 화면은 강의 자료이고 오른쪽 화면은 강의 화면이다.

 

강정상성의 가장 대표적인 예시는 백색잡음(White Noise)이다. 이상적인 데이터인 백색잡음 데이터는 강정상성의 예시이지만 이러한 데이터를 분석하는 것은 크게 의미가 있지 않다.

 

이유는 이렇게 시간이 흘러도 일정한 데이터를 분석해서 어떤 의미가 있겠는가? 이러한 부분 때문에 해당 데이터의 중점을 덜 두는 이유라고 한다.

 

아무튼, 백색잡음은 정규분포이고 평균과 분산은 일정하게 가져야하고 잔차들이 시간의 흐름에 따라 상관성이 없어야하는 조건이 있다.

 

우리의 목적은 Y(종속변수)가 정상성이 아니라면 정상성으로 만들어 주는 것이 목표이다. 

이러한 Y를 정상의 형태로 만들어주기 위해 변환작업을 해야한다.  

 

왼쪽 화면은 강의 자료이고 오른쪽 화면은 강의 화면이다.

 

오른쪽 강의화면을 보면 빨간색의 그래프들이 정상성을 보이지 않은 데이터들이다. 만약 실제 데이터들이 빨간색 그래프들 처럼 생긴다면 초록색 그래프(정상성을 보이는)로 변환을 하여 미래를 예측한 후 해당 미래 데이터를 롤백 개념으로 다시 기존의 정상성을 보이지 않은 빨간색 그래프 형태로 변환을 해야한다.

 

이러한 프로세스로 이용하기 위해 데이터를 정상성을 만족하게 하는 것이다.

 

 

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형