데이터를 기반으로

패스트캠퍼스 챌린지 10일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 10일차

이노후 2022. 2. 2. 23:17
728x90
반응형

오늘의 강의는 어제에 이어서 실습으로 진행되었다.

 

오늘은 본가에 도착하여 기존에 있던 듀얼 모니터로 강의를 들으며 코딩을 진행하였다.

 

오늘 강의에서는 datetime이라는 패키지의 다양한 기능과 파생변수와 더미변수를 생성하는 로직들을 구현해서 설명해주었다.

 

가장 먼저 datetime 패키지를 사용하여 연도, 월, 일, 요일, 시간 등 다양한 관점의 시간관련 항목들을 추출할 수 있었다.

 

index 기준으로 연도를 뽑아서 컬럼에 추가도 가능하고 1~3월까지는 1분기 / 4~6월은 2분기 등 4분기까지 추출하여 새로운 컬럼을 추가하면서 시점 관련 파생변수를 생성할 수 있었다.

 

왼쪽은 코딩화면 오른쪽은 강의화면이다.

 

왼쪽 화면을 보면 데이터프레임의 각 컬럼별 데이터 타입을 볼 수 있는 .info() 를 통해 데이터 타입을 확인해보니

위에서 말한 연도, 분기 등 해당 값들은 int 형태로 추출되어 컬럼으로 추가된 것을 확인할 수 있었다.

 

왼쪽은 코딩화면 오른쪽은 강의화면이다.

 

이후에는 기존에 설명해주셨던 lag(특정 몇 시점을 미루어서 관찰하고자 할 때 사용 - Ma 구할 때 사용하는 방식)을 코드로 구현해보았다. 

 

shift 함수를 사용하여 특정 몇 시점을 설정할 지 값을 넣어서 새로운 컬럼을 생성하는 식으로 강의는 진행되었다.

 

해당 강의에서 강사님이 comprehension 기능을 사용한 코딩도 보여주셔서 유익하게 배울 수 있었다.

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형