GPT API를 활용한 인공지능 앱 개발
도서명 : GPT API를 활용한 인공지능 앱 개발
출판사 : 한빛미디어
지은이 : 올리비에 케일린, 마리-알리스 블레트
독서 기간 : 2025-02-10 ~ 2025-02-25
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
2025년에도 다행히 해당 리뷰 서평단으로 지정이 되어 리뷰를 하게되어 다시 한번 한빛미디어 담당자분께 감사의 말씀을 드립니다.
요즘 LLM을 활용한 서비스나 프로덕트들이 우후죽순 생기고 있는 추세이다. 우리 회사만 보더라도 벌써 사내 인사, 총무 문서를 기반으로 한 학습한 챗봇을 운영하고 있는 중이다.
이렇듯 요즘 추세는 LLM을 기반으로 챗봇을 만든다던지 아니면 사내에서만 활용이 가능한 gpt 같은 생성형 AI 를 만드는 것에 초점이 두어지고 있는 것 같다.
그런 의미에서 현재 시점에 해당 도서는 가장 읽기 적합한 도서가 아닌가 싶다. 우선 목차부터 보자.
[ 목차 ]
CHAPTER 1 GPT 모델과 챗GPT
CHAPTER 2 오픈AI API
CHAPTER 3 LLM 기반 애플리케이션 개발
CHAPTER 4 GPT-4o 및 챗GPT 활용 고급 기법
CHAPTER 5 프레임워크로 LLM 기능 높이기
CHAPTER 6 마치며
목차를 보면 초반엣 GPT 모델에 대해서 설명해주는 chapter1이 나온다. 해당 부분에서 gpt의 모델별 특징을 설명해주는데 해당 부분을 표로 간단히 정리해보았다.
모델 | 출시 연도 | 주요 특징 | 매개변수(파라미터) | 성능 및 개선점 |
GPT-1 | 2018 | 최초의 GPT 모델, Transformer 아키텍처 기반, 지도 학습 및 비지도 학습 활용 | 1.17억 (117M) | 기존 RNN/LSTM 기반 모델보다 뛰어난 성능을 보였지만, 실제 활용에는 한계 |
GPT-2 | 2019 | 대규모 모델, 문맥 유지 개선, 다양한 작업에서 강력한 성능 | 15억 (1.5B) | 자연스러운 텍스트 생성 가능, 공개 당시 오용 우려로 부분 공개, 이후 전체 공개 |
GPT-3 | 2020 | 매우 큰 모델, 강력한 few-shot 학습 능력, 다양한 작업 수행 가능 | 1,750억 (175B) | API 제공을 통해 개발자 및 기업이 활용 가능, NLP의 새로운 기준이 됨 |
GPT-3.5 | 2022 | 챗GPT 기반 모델, 향상된 대화 능력 | GPT-3 대비 최적화 | 대화형 응답 품질 향상, 코드 생성 모델(코덱스) 포함 |
GPT-4 | 2023 | 멀티모달 지원(텍스트+이미지), 더 나은 추론 능력, 정밀한 답변 생성 | 비공개(추정: 1조 개 이상의 파라미터) | 챗봇, 교육, 코딩, 창작 등의 다양한 활용 가능, 긴 문맥 유지 및 오류 감소 |
그리고 langchain을 기반으로 학습하는 것에 대해서 전반적인 코드와 함께 설명해주는 부분이 친절하게 나와 좋았다. 그리고 2장을 보면 오픈AI API를 사용하기 전에 알아야 할 기본 개념을 설명해주는데 GPT 베이스 모델, 인스트럭트GPT(레거시), GPT-3.5, GPT-4 등 다양한 모델의 특징과 사용 방법을 소개해준다.
하여 나와 같이 LLM 기반으로 프로덕트나 서비스를 만드는 사람의 입장으로 해당 도서는 굉장히 도움이 많이 되는 부분이었다.
그리고 중간에 chapter5에 나오는 프레임워크로 LLM기능 높이기는 실제 서비스에서 활용하기 좋은 부분이 많이 나온다.
그 중 라마인덱스(LlamaIndex)라고 나오는데 이는 간단한 코드로 RAG(Retrieval-Augmented Generation) 구현을 지원하며, 데이터 인덱싱과 검색을 효율적으로 처리하는 프레임워크이다. 해당 프레임워크를 기반으로 적용하면 좋을 것 같아 한 구절 작성해본다.
그리고 가장 서비스의 최적화하기 좋은 부분은 바로 어시스턴트API이다. 어시스턴트 생성, 대화 관리, 함수 호출 등 GPT 기반 어시스턴트를 구축하고 관리하는 방법을 소개하는 내용이 나오는데 이를 활용하면 좀 더 퀄리티 좋은 프로덕트를 만들 수 있을 것이다.