데이터를 기반으로

Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝) 본문

도서 리뷰/빅데이터&IT

Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝)

이노후 2022. 2. 21. 01:46
728x90
반응형

도서명 : Machine Learning and Data Science Blueprints for Finance(금융 전략을 위한 머신러닝)

출판사 : 한빛미디어

지은이 : 하리움 탓샛(Hariom Tatsat) / 사힐 푸리(Sahil Puri) / 브래드 루카보(Brad Lookabaugh)

옮긴이 : 김한상

펴낸이 : 김태헌

 

독서 기간 : 2022-02-07 ~ 2022-02-22

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

책 표지

나는 책을 받는 2월 7일(월요일) 퇴근 후 바로 카페로 달려갔다.

 

도저히 집에서 해당 도서를 접하기 어려워 코로나라는 시국에 위험하지만 마스크를 잘 착용하고 방역수칙을 최대한 지키는 선에서 두근두근 설레는 마음으로 카페로 향했다.

 

겉 표지부터가 너무나 아름다운 그리고 전형적인 IT 도서 다운(?) 모습이었다. 하지만 그러한 디자인이 더 심플하고 깔끔한 멋으로 다가왔다.

 

기존에 나는 다양한 IT 도서들을 읽어왔다(리뷰는 쓰지 않았지만 추후 쓸 예정이다...ㅎ).

왜 단순한 머신러닝 학습책이 아닌 금융 전략이라는 키워드가 붙은 머신 러닝 책을 보게 된 것일까?

 

그 해답은 내 블로그 카테고리에도 나와있다.

 

최근 자동매매 프로그램을 구축하고자 여러 알고리즘을 백테스팅 중인데 난항을 겪고 있는 요즘에 한 줄기 희망으로 보였던 본 도서를 발견하게 되었다.

 

그렇게 한빛미디어에 리뷰어가 된 나로써 해당 도서를 선택을 안할 수 없었다.

 

책의 목차가 나오기 전 전체적인 흐름에 대한 설명

 

이 책의 가장 특이했던 부분은 목차가 나오기 전 머신러닝에 대한 전반적인 내용과 프로세스를 앞서 설명해주는 것이다. (그것도 자세히!!)

 

목차는 크게 4가지의 챕터(프레임 워크 / 지도학습 / 비지도학습 / 강화학습과 자연어 처리)로 나뉘어 졌다.

 

각각 챕터를 살펴보면 

 

1. 프레임워크(금융 머신러닝 / 머신러닝 모델 개발 / 인공 신경망)

   - 금융 머신 러닝

     → 해당 챕터는 금융권에서 머신러닝이 어떻게 쓰이는 지에 대한 실 사례 및 예시들을 보여준다. 

         이상 거래 탐지, 리스크 관리, 알고리즘 트레이딩 등 다방면으로 쓰이는 방법과 메커니즘에 대한 설명이 적혀있다.

 

   - 머신러닝 모델 개발

     → 앞에서는 머신러닝이 사용되는 곳을 이야기했다면 해당 챕터는 머신러닝의 구축하는 법에 대한 큰 틀에 대한 

         설명들이 이어졌다. 데이터 로드 부터 모델링 후 예측까지 그리고 평가 지표와 하이퍼파라미터 튜닝까지 모델링

         에 대한 전반적인 프로세스와 방법에 대한 설명이 적혀있다.

 

   - 인공 신경망

     → ANN(Artificial Neural Networks)라는 인공신경망에 대해서 다루는 파트였다. 앞 챕터의 머신러닝 모델 개발처럼

        딥러닝 개발에 대한 전체 프로세스를 말해주고 있는 파트였다. 해당 필자는 keras 패키지를 이용한 딥러닝을 진행
        하며 딥러닝의 주요 단어와 하이퍼파라미터 튜닝 부분까지 언급되는 파트이다.

 

2. 지도학습(모델 및 개념 / 회귀(시계열모델) / 분류)

   - 모델 및 개념

     → 지도 학습에 대한 메커니즘과 구현 방법 그리고 모델 별 장단점을 정리해 놓은 챕터였다. 지도 학습은 크게 분류

         와 회귀로 모델이 나뉘며 각각의 모델에서 사용되는 알고리즘들과 각각의 하이퍼 파라미터가 무엇인지 해당

         알고리즘의 장단점이 무엇인지 깔끔하게 정리해주는 파트이다.

 

   - 회귀(시계열모델)

     → 해당 챕터부터는 실제 금융권의 사용 사례들 기반의 예시를 통한 방법론과 알고리즘을 설명해준다. 본 챕터에서

        는 주가예측 / 파생 상품 가격 책정 / 투자자 위험 감수 및 로보 어드바이저 / 수익률 곡선 예측 까지 총 4가지의

        예시를 기반으로 ARIMA 부터 LSTM까지 코드를 기반으로 구현 방법을 설명해준다.

 

   - 분류

     → 사기탐지 / 채무 불이행 확률 / 비트코인 거래 전략 총 3가지의 예시를 기반으로 분류모델을 설명한다. 중간 중간

        분류모델에서 실제로 사용되는 더미 변수화, 샘플링 등 실제로 전처리를 어떻게 사용하는지도 보여주는 부분들이

        있는 파트이다.


3. 비지도학습(차원 축소 / 군집화)

   - 차원 축소

     → 포트폴리오 관리(고유 포트폴리오 찾기) / 수익률 곡선 구축 및 이자율 모델링 / 비트코인 거래(속도와 정확성

         향상) 총 3가지의 예시를 기반으로 설명이 되어 있다. 차원 축소 기술 중 PCA / KPCA / t-SNE 를 설명해준다.

 

   - 군집화

     → 쌍 거래를 위한 군집화 / 포트폴리오 관리(투자자 군집화) / 계층적 위험 패리티 총 3가지의 예시를 기반으로

         설명이 되어 있다. K-means, 계층적 군집화 등 군집화에 대한 알고리즘을 각각 예시에 맞게 실제 코드와 구현 

         원리를 설명해주는 부분이 인상적이었다. 추가로 덴드로그램이라는 시각화 부분까지 있어 도움이 많이 되었다.

 

4. 강화 학습과 자연어 처리(강화학습 / 자연어 처리)

   - 강화학습

     → 강화 학습 기반 거래 전략 / 파생상품 헤징 / 포트폴리오 배분 총 3가지의 예시를 기반으로 설명되어 있다. 

         강화 학습의 이론 부터 동작 원리, 알고리즘, 모델을 위한 하이퍼파라미터 튜닝과 모델 평가까지 강화학습을 

         어떻게 적용하는지 그리고 구현하는지 알 수 있는 파트였다.

 

   - 자연어 처리

     → NLP 및 감정 분석 기반 거래 전략 / 챗봇 디지털 도우미 / 문서 요약 총 3가지의 예시를 기반으로 설명되어 있다.

         어떻게 NLP가 거래 전략으로 쓰일 지 궁금했는데 금융 어휘집 기반 비지도 모델을 예시로 들며 구축 방법까지 

         설명해주는 파트였다.

 

 

이렇게 목차별로 어떤 내용이 설명되어 있는지 간단히 정리해보았지만 실질적으로 더 많은 내용들을 상세하게 담아내고 있어 놀라웠다.

 

비트코인 관련해서도 2가지 파트로 나뉘어져있다. 분류 모델에서 1차적으로 거래 전략을 다지고 그 이후 속도와 정확성을 차원 축소를 통해 매매 알고리즘이 하나가 구축된 것이다.

 

전체적으로 다른 책에 비해 가장 큰 차이점이자 장점은 금융 전략에 포커싱을 가지고 구성된 책이라는 것이다.

데이터 예제도 알고리즘들도 모두 다 금융권에서 사용되는 것을 중점적으로 구성되어 있는 것이 너무 좋았다. 금융권을 위해 데이터 분석 공부를 더 이어나가고 있는 저에게는 이런 책 하나가 하나의 금융 관련 데이터 분석의 경험을 쌓을 수 있는 부분이었다.

 

책에서 제공되는 gitlab 페이지

위 사진은 책에서 제공되는 gitlab 화면이다. 해당 페이지에 접속해 소스코드를 직접 실행해보면서 예제들을 더욱 깊이 이해할 수 있었다.

 

 

- 감상 한줄평 -

모든 금융권을 희망하는 데이터 분석가들에게 좋은 경험을 선사해줄 것이라 생각되는 책이다.

 

 

 

728x90
반응형