데이터를 기반으로

패스트캠퍼스 챌린지 13일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 13일차

이노후 2022. 2. 5. 17:44
728x90
반응형

오늘의 강의는 어제에 이어서 진행되었다.

 

모델을 구축하고 나서 모델을 평가하는 지표로 여러가지가 사용된다. 이전에 비시계열 데이터의 다양한 모델들이 있었고 각각의 모델들 마다 각자 다른 목적을 위한 평가지표가 있다.

 

우리가 가장 먼저 모델이 얼만큼 예측을 하는지 측정하는 기본적인 지표는 정확도(Accuracy)이다. 정확도란 우리의 모델이 예측 데이터를 추출했을 때 실제 데이터를 얼만큼 예측하는지를 보여주는 지표이다. 

 

정확도는 회귀와 분류 모두에서 사용되는 지표이지만 분류에서 좀 더 정확하게 보여지는 지표이다. 회귀에서는 RMSE, MSE, MAE 등 오차에 좀 더 가중치를 둔 지표들이 많다.

 

해당 예측치가 실제 데이터와 얼만큼 다른지 어느정도의 오차를 측정하는 지표들이다. 단순히 오차를 측정하는 것이 아닌 하나의 스케일링을 걸치는 RMSE가있다.

 

단순한 MSE는 편차들의 평균인데 RSME는 편차들의 평균을 루트를 씌워서 보는 것이다.

 

왼쪽은 강의자료이고 오른쪽은 강의화면이다.

 

분류에서는 민감도, 특이도, 재현율과 같은 지표들이 있다.

 

FN / PN / TP / TF 총 4가지의 경우의 수를 통해 이루어진 지표들이다.

 

0을 0이라 예측하는 경우/ 1을 0이라 예측하는 경우 / 0을 1이라 예측하는 경우 / 1을 1이라 예측하는 경우

 

총 4가지를 조합하여 평가지표들을 만든다.

 

왼쪽은 강의자료 오른쪽은 강의화면이다.

 

왼쪽 화면을 보시다 싶이 평가지표들은 다양한 수식으로 구성되어있다.

 

개인적으로는 분류보다 회귀에서 더욱 통계적인 개념들이 빈번하게 나오는 것 같다.

 

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형