데이터를 기반으로

패스트캠퍼스 챌린지 38일차 본문

스터디/패스트캠퍼스

패스트캠퍼스 챌린지 38일차

이노후 2022. 3. 2. 23:30
728x90
반응형

어제의 강의는 분석 실습을 통해 데이터 마이닝 레퍼런스 알고리즘의 대한 성능을 확인하는 시간을 가져보았다.

 

오늘의 강의는 알고리즘 용어들을 정리하고 시계열 알고리즘 소개 방향에 대해 확립하는 시간을 가졌다.

 

왼쪽 화면은 강의 자료 화면이고 오른쪽 화면은 강의 화면이다.

 

일단 그림을 보시다 싶이 회귀분석은 선형과 비선형으로 가장 크게 나뉜다. 비선형이라 하면 데이터가 선형성을 띄고 있지 않는 것을 의미하는데 자세한 설명은 예전 강의에서 진행된 적이 있다. 

 

보통 비선형은 모델을 구현하기 어려운 문제 중 하나이다. 하여 딥러닝 쪽을 이용하여 해결하는 것이 대부분이다.

 

하여, 보통 선형 회귀를 먼저 접근하게 된다. 

 

선형 회귀에서 Multivariate와 Univariate로 나뉜다. Multivariate은 행렬 형태의 회귀라고 보면된다.

 

Univariate에서 Simple과 Multiple로 나뉘는데 각각 단항, 다항으로 불린다.

 

이는 y=ax (Simple) / y= a1x + b1x2 + ... (Multiple) 이러한 차이점이 있다. 즉, 독립변수들의 개수라고 생각하면 쉽다.

 

그리고 Univariate의 나머지 1개인 Auto Regressor는 자기회귀인데 회귀식에 자기 자신의 이전 시점 및 타 시점의 데이터를 하나의 항으로 받는 것을 의미한다.

 

왼쪽 화면은 강의를 들으면서 블로그 글로 정리하는 화면이고 오른쪽 화면은 강의 화면이다.

 

지금까지는 종속변수와 독립변수의 관계를 중점으로 선형성과 비선형성으로 나뉘며 점점 구체적으로 나뉘는 식이었다.

 

이제는 문제 해결에 따른 분류를 설명해주었다.

 

독립변수의 개수에 따라 다항과 단항이 나뉘고 종속 변수의 개수로 Multivariate와 Univariate로 나뉘었다.

 

추가로 가장 최근에 강의를 진행했던 릿지/라쏘와 PCR/PLS는 다중공선성 문제를 해결하기 위한 관점이다.

 

알고리즘은 어떠한 문제를 해결하기 위해 장단점을 보안하기 위해 이러한 식으로 발전해나가기에 상황에 맞게 알고리즘을 선택하여 구축하는 것이 가장 올바르다고 이야기하고 있다.

 

최근에 발견된 분석 기법이 무조건 좋은게 아닌 상황에 맞는 알고리즘이 가장 중요한 법이다.

 

 

 

 

 

※ 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성었습니다. 

 

※ 관련 링크 : https://bit.ly/37BpXiC

728x90
반응형