일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 방콕여행
- 패캠챌린지
- Python
- DAGs
- 빅데이터
- 직장인인강
- 파이썬을활용한시계열데이터분석A-Z올인원패키지
- 독서리뷰
- 파이썬
- 패스트캠퍼스
- 데이터
- 에어플로
- API
- 데이터 분석
- 직장인자기계발
- 분석
- 자동매매프로그램
- 태국여행
- 활성화함수
- 패스트캠퍼스후기
- airflow
- 챗지피티
- 리뷰
- 머신러닝
- 딥러닝
- correlation
- Ai
- 데이터분석
- 상관분석
- EDA
- Today
- Total
데이터를 기반으로
Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝) 본문
Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝)
이노후 2022. 2. 21. 01:46도서명 : Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝)
출판사 : 한빛미디어
지은이 : 하리움 탓샛(Hariom Tatsat) / 사힐 푸리(Sahil Puri) / 브래드 루카보(Brad Lookabaugh)
옮긴이 : 김한상
펴낸이 : 김태헌
독서 기간 : 2022-02-07 ~ 2022-02-22
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
나는 책을 받는 2월 7일(월요일) 퇴근 후 바로 카페로 달려갔다.
도저히 집에서 해당 도서를 접하기 어려워 코로나라는 시국에 위험하지만 마스크를 잘 착용하고 방역수칙을 최대한 지키는 선에서 두근두근 설레는 마음으로 카페로 향했다.
겉 표지부터가 너무나 아름다운 그리고 전형적인 IT 도서 다운(?) 모습이었다. 하지만 그러한 디자인이 더 심플하고 깔끔한 멋으로 다가왔다.
기존에 나는 다양한 IT 도서들을 읽어왔다(리뷰는 쓰지 않았지만 추후 쓸 예정이다...ㅎ).
왜 단순한 머신러닝 학습책이 아닌 금융 전략이라는 키워드가 붙은 머신 러닝 책을 보게 된 것일까?
그 해답은 내 블로그 카테고리에도 나와있다.
최근 자동매매 프로그램을 구축하고자 여러 알고리즘을 백테스팅 중인데 난항을 겪고 있는 요즘에 한 줄기 희망으로 보였던 본 도서를 발견하게 되었다.
그렇게 한빛미디어에 리뷰어가 된 나로써 해당 도서를 선택을 안할 수 없었다.
이 책의 가장 특이했던 부분은 목차가 나오기 전 머신러닝에 대한 전반적인 내용과 프로세스를 앞서 설명해주는 것이다. (그것도 자세히!!)
목차는 크게 4가지의 챕터(프레임 워크 / 지도학습 / 비지도학습 / 강화학습과 자연어 처리)로 나뉘어 졌다.
각각 챕터를 살펴보면
1. 프레임워크(금융 머신러닝 / 머신러닝 모델 개발 / 인공 신경망)
- 금융 머신 러닝
→ 해당 챕터는 금융권에서 머신러닝이 어떻게 쓰이는 지에 대한 실 사례 및 예시들을 보여준다.
이상 거래 탐지, 리스크 관리, 알고리즘 트레이딩 등 다방면으로 쓰이는 방법과 메커니즘에 대한 설명이 적혀있다.
- 머신러닝 모델 개발
→ 앞에서는 머신러닝이 사용되는 곳을 이야기했다면 해당 챕터는 머신러닝의 구축하는 법에 대한 큰 틀에 대한
설명들이 이어졌다. 데이터 로드 부터 모델링 후 예측까지 그리고 평가 지표와 하이퍼파라미터 튜닝까지 모델링
에 대한 전반적인 프로세스와 방법에 대한 설명이 적혀있다.
- 인공 신경망
→ ANN(Artificial Neural Networks)라는 인공신경망에 대해서 다루는 파트였다. 앞 챕터의 머신러닝 모델 개발처럼
딥러닝 개발에 대한 전체 프로세스를 말해주고 있는 파트였다. 해당 필자는 keras 패키지를 이용한 딥러닝을 진행
하며 딥러닝의 주요 단어와 하이퍼파라미터 튜닝 부분까지 언급되는 파트이다.
2. 지도학습(모델 및 개념 / 회귀(시계열모델) / 분류)
- 모델 및 개념
→ 지도 학습에 대한 메커니즘과 구현 방법 그리고 모델 별 장단점을 정리해 놓은 챕터였다. 지도 학습은 크게 분류
와 회귀로 모델이 나뉘며 각각의 모델에서 사용되는 알고리즘들과 각각의 하이퍼 파라미터가 무엇인지 해당
알고리즘의 장단점이 무엇인지 깔끔하게 정리해주는 파트이다.
- 회귀(시계열모델)
→ 해당 챕터부터는 실제 금융권의 사용 사례들 기반의 예시를 통한 방법론과 알고리즘을 설명해준다. 본 챕터에서
는 주가예측 / 파생 상품 가격 책정 / 투자자 위험 감수 및 로보 어드바이저 / 수익률 곡선 예측 까지 총 4가지의
예시를 기반으로 ARIMA 부터 LSTM까지 코드를 기반으로 구현 방법을 설명해준다.
- 분류
→ 사기탐지 / 채무 불이행 확률 / 비트코인 거래 전략 총 3가지의 예시를 기반으로 분류모델을 설명한다. 중간 중간
분류모델에서 실제로 사용되는 더미 변수화, 샘플링 등 실제로 전처리를 어떻게 사용하는지도 보여주는 부분들이
있는 파트이다.
3. 비지도학습(차원 축소 / 군집화)
- 차원 축소
→ 포트폴리오 관리(고유 포트폴리오 찾기) / 수익률 곡선 구축 및 이자율 모델링 / 비트코인 거래(속도와 정확성
향상) 총 3가지의 예시를 기반으로 설명이 되어 있다. 차원 축소 기술 중 PCA / KPCA / t-SNE 를 설명해준다.
- 군집화
→ 쌍 거래를 위한 군집화 / 포트폴리오 관리(투자자 군집화) / 계층적 위험 패리티 총 3가지의 예시를 기반으로
설명이 되어 있다. K-means, 계층적 군집화 등 군집화에 대한 알고리즘을 각각 예시에 맞게 실제 코드와 구현
원리를 설명해주는 부분이 인상적이었다. 추가로 덴드로그램이라는 시각화 부분까지 있어 도움이 많이 되었다.
4. 강화 학습과 자연어 처리(강화학습 / 자연어 처리)
- 강화학습
→ 강화 학습 기반 거래 전략 / 파생상품 헤징 / 포트폴리오 배분 총 3가지의 예시를 기반으로 설명되어 있다.
강화 학습의 이론 부터 동작 원리, 알고리즘, 모델을 위한 하이퍼파라미터 튜닝과 모델 평가까지 강화학습을
어떻게 적용하는지 그리고 구현하는지 알 수 있는 파트였다.
- 자연어 처리
→ NLP 및 감정 분석 기반 거래 전략 / 챗봇 디지털 도우미 / 문서 요약 총 3가지의 예시를 기반으로 설명되어 있다.
어떻게 NLP가 거래 전략으로 쓰일 지 궁금했는데 금융 어휘집 기반 비지도 모델을 예시로 들며 구축 방법까지
설명해주는 파트였다.
이렇게 목차별로 어떤 내용이 설명되어 있는지 간단히 정리해보았지만 실질적으로 더 많은 내용들을 상세하게 담아내고 있어 놀라웠다.
비트코인 관련해서도 2가지 파트로 나뉘어져있다. 분류 모델에서 1차적으로 거래 전략을 다지고 그 이후 속도와 정확성을 차원 축소를 통해 매매 알고리즘이 하나가 구축된 것이다.
전체적으로 다른 책에 비해 가장 큰 차이점이자 장점은 금융 전략에 포커싱을 가지고 구성된 책이라는 것이다.
데이터 예제도 알고리즘들도 모두 다 금융권에서 사용되는 것을 중점적으로 구성되어 있는 것이 너무 좋았다. 금융권을 위해 데이터 분석 공부를 더 이어나가고 있는 저에게는 이런 책 하나가 하나의 금융 관련 데이터 분석의 경험을 쌓을 수 있는 부분이었다.
위 사진은 책에서 제공되는 gitlab 화면이다. 해당 페이지에 접속해 소스코드를 직접 실행해보면서 예제들을 더욱 깊이 이해할 수 있었다.
- 감상 한줄평 -
모든 금융권을 희망하는 데이터 분석가들에게 좋은 경험을 선사해줄 것이라 생각되는 책이다.
'도서 리뷰 > 빅데이터&IT' 카테고리의 다른 글
XGBOOST와 사이킷런을 활용한 그레디언트 부스팅 (0) | 2022.10.30 |
---|---|
SQL로 시작하는 데이터 분석 (1) | 2022.08.21 |
사례 분석으로 배우는 데이터 시각화 (0) | 2022.06.21 |
김상형의 SQL 정복 (0) | 2022.05.24 |
Semantic Modeling for Data(시멘틱 데이터 모형화) (0) | 2022.04.22 |