일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 빅데이터
- 파이썬을활용한시계열데이터분석A-Z올인원패키지
- 클라우드
- 머신러닝
- 직장인자기계발
- 상관분석
- nlp
- DAGs
- 패스트캠퍼스
- 딥러닝
- 패스트캠퍼스후기
- 데이터
- API
- ChatGPT
- Ai
- 리뷰
- Python
- 독서리뷰
- 파이썬
- 데이터분석
- 분석
- 자동매매프로그램
- 방콕여행
- 태국여행
- 챗지피티
- airflow
- 패캠챌린지
- 직장인인강
- 활성화함수
- It
- Today
- Total
데이터를 기반으로
NLP와 LLM 실전 가이드 본문
도서명 : NLP와 LLM 실전 가이드
출판사 : 한빛미디어
지은이 : 리오르 가지트 , 메이삼 가파리
독서 기간 : 2025-03-10 ~ 2025-03-25
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
요즘 가장 화두되는 내용 중 하나는 LLM인 것 같다. 어딜가도 GPT와 LLM 이 2가지 단어는 항상 들려오는 것 같다.
그래서 이번 도서 후보에도 해당 도서를 넣을 수 밖에 없었다. 사실 NLP에 관련된 모든 도서를 본 것은 아니지만 어느 정도는 봐왔다고 생각하기에 해당 도서가 그런 측면에서 잘 작성되어 있는지 추가로 LLM에 대해 어느 정도의 정보들을 담고 있는지 위주로 분석하며 책을 읽어 내려갔다.
책 소개에 앞서 목차부터 보자.
CHAPTER 1 자연어 처리 개요 살펴보기
CHAPTER 2 머신러닝과 자연어 처리를 위한 선형대수, 확률, 통계 마스터하기
CHAPTER 3 자연어 처리에서 머신러닝 잠재력 발휘하기
CHAPTER 4 자연어 처리 성능을 위한 텍스트 전처리 과정 최적화
CHAPTER 5 텍스트 분류 강화: 전통적인 머신러닝 기법 활용하기
CHAPTER 6 텍스트 분류의 재해석: 딥러닝 언어 모델 깊게 탐구하기
CHAPTER 7 대규모 언어 모델 이해하기
CHAPTER 8 대규모 언어 모델의 잠재력을 끌어내는 RAG 활용 방법
CHAPTER 9 대규모 언어 모델이 주도하는 고급 응용 프로그램 및 혁신의 최전선
CHAPTER 10 대규모 언어 모델과 인공지능이 주도하는 과거, 현재, 미래 트렌드 분석
CHAPTER 11 세계적 전문가들이 바라본 산업의 현재와 미래
목차를 보면 Chapter4 까지는 기본적인 내용들이라 쉽게 쉽게 지나치려했었다. 하지만 4장 성능을 위한 전처리는 관심이 커서 집중하면서 보았다.
그렇게 몇 페이지 넘겨보니 정규식을 직접 코딩으로 알려주는 부분은 신선했다.
그 다음은 NLTK 활용한 전처리와 다양한 패키지들을 활용한 전처리 내용이 나왔다. 순서를 말하면 아래와 같다.
1. 디코딩/인코딩 제거
2. 소문자화
3. 숫자를 단어로 변환
4. 구두점 및 기타 특수 문자 제거
5. 맞춤법 교정
6. 불용어 제거
7. 어간 추출
8. 표제어 추출
3번 부분은 숫자를 단어로 변환하는 부분은 개인적인 경험으로 유의미하지는 않았던 것으로 기억나지만 그래도 도메인이나 해당 프로젝트의 특징을 파악하고 나서 적용 여부를 판단하는 것이 좋을 것 같다.
그 다음 4장은 전통 NLP 분석기법들이 많이 나왔다. 물론 임베딩의 기초가 되는 내용들이 주로 이루었다.
다른 도서들은 스텝 바이 스텝으로 한줄씩 알려주는 부분이 조금은 답답한 부분들이 있었는데 LLM Agent 관련 소개 코드들은 한번에 보여주는 식이라 조금은 편했다.
해당 책에서 가장 인상 깊었던 부분은 바로 LLM을 클라우드 위에서 적용하는 방식에 대한 부분이다.
물론 엄청 상세하고 길게 나와있는 부분은 아니었지만 대부분의 책들은 각 클라우드의 예시는 없고 Langchain 도입 방법이나 많이 나와야 AWS 정도인데 해당 책에서는 Azure, GCP에 해당하는 부분도 나와있다.
각 클라우드 별로 어떤 서비스를 이용해야하는지 간단하게 소개되어있다.
최근 LLM관련 책들을 보면 이제 막 우후죽순 서비스들과 많은 연구들이 나오는 시기라 잘 정돈된 책을 찾기 조금 어려운 부분이 있다.
하지만, 해당 도서는 그 도서들 중 가장 정리가 잘 되어 있고 기본 부터 활용 부분까지 보기 좋은 책이란 생각이 들었다.
그리고 마지막으로 프롬프트에 대해서도 나오는데 프롬프트 압축에 대한 내용도 나와 있다.
프롬프트 길이에 따라 토큰을 사용하는 GPT와 같은 서비스에서 가장 필요한 기술 중 하나라고 생각된다.
LLM 쪽 직무로 전환을 하고자하는 분들에게 추천할만한 도서인 것 같다.
'도서 리뷰 > 빅데이터&IT' 카테고리의 다른 글
그림으로 배우는 도커, 개념부터 환경 구축까지 단계별로 익히는 도커 (3) | 2025.04.23 |
---|---|
GPT API를 활용한 인공지능 앱 개발 (0) | 2025.02.28 |
AGI의 시대 (0) | 2024.12.29 |
시작! AWS 사전처럼 찾아보는 16가지 기본 서비스와 77가지 실무 활용 서비스 (3) | 2024.11.24 |
쿠버네티스 창시자에게 배우는 모범 사례(2판) (6) | 2024.10.27 |