일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 머신러닝
- 딥러닝
- 직장인자기계발
- Ai
- airflow
- 빅데이터
- API
- 방콕여행
- Python
- DAGs
- 패캠챌린지
- 자동매매프로그램
- It
- 활성화함수
- 패스트캠퍼스후기
- 데이터분석
- 직장인인강
- 태국여행
- 데이터
- 독서리뷰
- 리뷰
- 파이썬
- 챗지피티
- 패스트캠퍼스
- 분석
- 상관분석
- 클라우드
- nlp
- ChatGPT
- 파이썬을활용한시계열데이터분석A-Z올인원패키지
- Today
- Total
데이터를 기반으로
추론(Inference) 본문
배치 정규화를 공부 중 추론이란 부분이 나왔다.
처음 듣는 단어이고 검색을 해보니 Prediction과는 다른 부분이었다.
우리가 흔히 아는 학습된 모델에 새로운 데이터를 넣고 결과를 보는 것이 보통은 Prediction의 프로세스이다.
하지만, Inference(이하 추론)은 조금은 다른 목적을 가지며 새로운 데이터를 모델에 넣는다.
우선, 추론이 무엇인지 먼저 확인해보자.
https://koreapy.tistory.com/1108
[파이썬] Inference vs Prediction (추론 vs 예측) 차이점
추론 및 예측이라는 용어는 모두 독립 변수와 결과 간의 관계를 설명하는 모델을 찾기 위해 감독 방식으로 데이터에서 학습하는 작업을 설명합니다. 그러나 추론과 예측은 결과 모델의 사용과
koreapy.tistory.com
국내 글 중 추론을 가장 잘 설명해 놓은 블로그 글인 것 같다.
한번에 추론이 무엇을 의미하는지 알 수 있었다.
위 블로그와 중복되는 내용이 존재하지만, 내가 이해한 것을 정리하는 목적으로 글을 작성하는 것이니 정리를 해보고자 한다.
예측은 데이터를 넣어서 결과가 이상하든 좋든 Output이 존재한다.
하지만, 추론은 가능 여부가 존재한다.
해당 모델에 대한 해석 가능성이 추론 가능 여부로 나뉜다.
한마디로 추론이 가능한 모델은 해석이 가능한 모델이라 보면 된다.
해석 가능은 선형 모델, 의사 결정 트리가 있고,
해석 불가능 모델은 신경망, 비선형, svm, 랜덤 포레스트 가 존재한다.
예시) 선형 svm은 개별 기능의 영향을 설명할 수 있도록 모든 기능에 대한 계수를 제공한다.
그러나, SVM은 모델 계수(예 :분산)와 관련된 불확실성을 추정하는 것을 허용하지 않으며 모델 신뢰도의 암시적 측정을 얻는 것이 불가능하다.
반대로, 데이터가 가우스 분포를 따른다고 가정하는 선형회귀를 고려해보면 모델은 계수 추정치의 표준 오차와 출력 신뢰 구간을 결정합니다. 선형 회귀를 사용하면 데이터 생성 프로세스의 확률적 특성을 이해할 수 있으므로 추론에 적합한 방법입니다.
사실 나는 위 설명으로도 조금은 명확한 이해가 가지 않은 상태였다.
하지만, 아래의 글을 보고 완벽히 이해할 수 있었다.
[ 추론 ]
1. 모델링 : 데이터 생성 프로세스에 대한 이유와 데이터 생성 프로세스에 가장 근접한 확률 모델을 선택
2. 모델 검증 : 잔차 분석 또는 적합도 테스트를 사용하여 확률적 모델의 유효성을 평가
3. 추론 : 확률 모델을 사용하여 데이터 생성 프로세를 이해
[ 예측 ]
1. 모델링 : 여러 다른 모델과 다른 매개변수 설정을 고려
2. 모델 선택 : 검증/테스트 세트를 사용하여 예측 성능이 가장 뛰어난 모델을 식별합니다. 테스트 세트에서 가장 높은 성능을 가진 모델을 선택
3. 예측 : 선택한 모델이 보이지 않는 데이터에도 일반화될 것으로 예상하여 선택한 모델을 새 데이터에 적용
'데이터 분석(Python) > 딥러닝(Deep Learning)' 카테고리의 다른 글
배치 정규화(Batch Normalization) (4) | 2022.10.04 |
---|---|
가중치 초기화(Weight initialization) (1) | 2022.10.03 |
Logistic Regression에서 Activation Function으로 Sigmoid를 사용하는 이유 (2) | 2022.09.09 |
활성화 함수(Activation Function) (0) | 2022.09.05 |