데이터를 기반으로

트랜스포머를 활용한 자연어 처리 본문

도서 리뷰/빅데이터&IT

트랜스포머를 활용한 자연어 처리

이노후 2023. 3. 22. 23:19
728x90
반응형

도서명 : 트랜스포머를 활용한 자연어 처리

출판사 : 한빛미디어

 

지은이 : 루이스 턴스톨, 레안드로 폰 베라, 토마스 울프 지음

 

독서 기간 : 2023-03-10 ~ 2022-03-26

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

이번에는 요즘 실무에서 가장 많이 활용하고 있는 NLP관련된 도서를 택해서 읽어보았다.

 

아직 지식이 부족해 읽는 데 생각보다 어려움을 느낀 책이었다.

 

머릿글에서 설명이 나오는 부분이지만, 해당 도서를 구매하실 분들은 최소한의 Transformer 의 개념과 기본적인 딥러닝, LSTM 등 NLP 자연어 관련 모델링을 한번 정도는 구현을 해본 분들이 읽기에 적합한 도서 같다.

 

[ 목차 ]

 

CHAPTER 1 트랜스포머 소개

CHAPTER 2 텍스트 분류


CHAPTER 3 트랜스포머 파헤치기


CHAPTER 4 다중 언어 개체명 인식


CHAPTER 5 텍스트 생성


CHAPTER 6 요약


CHAPTER 7 질문 답변


CHAPTER 8 효율적인 트랜스포머 구축


CHAPTER 9 레이블 부족 문제 다루기


CHAPTER 10 대규모 데이터셋 수집하기


CHAPTER 11 향후 방향

 

 

 크게 11가지 파트로 구성되어 있으며, Chapter 1에서는 트랜스포머의 소개와 트랜스 포머까지 도달하게 된 사전 개념들의 설명으로 시작되었다. 

 

첫 개념은 인코더 - 디코더 프레임 워크, 어텐션 메커니즘, 전이 학습 부터 시작되었다.

 

인코더 - 디코더 프레임 워크를 이해하기 위해 RNN이나 LSTM 같은 순환 신경망의 시퀀스 구조를 이해해야 한다.

그렇기에, 해당 도서에서도 가장 먼저 이에 대해 설명을 이어 나간다.

 

그렇게 기본적인 개념을 설명하고 난 후, GPT, BERT 등 현재 가장 많이 사용 되는 알고리즘에 대해 설명이 이어졌다.

 

그리고 가장 중요한 허깅페이스 트랜스포머에 대해 설명이 나왔다.

 

최근에 알게된 허깅페이스는 꽤 충격적이었다.

 

기존에 방대한 양의 데이터를 이미 학습한 언어 모델을 분석가나 사이언티스트 들이 커스터마이징 하여 사용하는 방법인데, 이러한 모델들이 허깅페이스에 올라와있다.

 

보통 Pretrained model 이라고 부르며, 정말 좋은 성능들을 보여주는 방법 중 하나이다.

 

자연어 모델을 도입하게 되면 허깅페이스는 필수라고 생각된다.

 

그렇게 분류 장에서는 데이터셋 / 토크나이저 / 트랜스포머 / 데이터셋 순서로 설명을 이어나갔다.

 

실제 데이터를 기반으로 벡터화하며 모델을 생성하는 일련의 과정을 상세히 보여주는 도서였다.

 

현재, 나의 수준으로는 읽기가 어려운 부분이 좀 많은 책이었다.

 

해당 도서를 선택하실 분들은 최소한의 자연어 모델을 구축해보신 분들이 채택했으면 한다.

 

많은 도움이 못되는 후기라 사과의 말씀을 드리며, 추후 공부를 더 한 뒤 해당 도서를 읽어봐야겠다.

728x90
반응형