금융 데이터에 AI를 접목하려는 방법을 소개한 책으로 특히, 정규분포나 선형성 등 전통적 금융 모델의 한계를 검증해보는 부분과 시장의 비효율성을 활용하려는 시도가 인상적으로 다가왔다.
저자가 본문에 여러번 언급한 바와 같이 금융분야는 유독 AI의 수혜를 제대로 받지 못한 영역 중 하나라는 사실에 동감한다. 독립 시행적 요소가 많은데다 최전선에서 활약하는 퀀트들의 전략은 절대 노출되지 않으며 시장 참여자들은 항상 똑똑하지 않다.
전략이 쉽게 공유될 수 없는 현상 또한 수익률과 직결된 알파 전략을 공개하여 베타로 바꿈으로 인해 발생하는 손실을 책이나 강의 등의 교육 사업의 수익으로 대체하기엔 터무니없이 부족하기에 어찌보면 자연스러운 현상이라 생각한다.
금융분야의 전공 출신도 아닌데다 해당분야의 전문가도 아닌 그저 AI는 조금 아는 수준의 나같은 독자라면 금융 분야는 언제나 호기심을 자극하고 또 성과가 좋으면 평생의 시간적, 경제적 자유를 얻을 수 있는 분야이기에 일말의 기대도 품어보게 하는 분야이지만 사실 참고할 수 있는 레퍼런스가 거의 없다고 봐도 무방하다.
알파고가 등장한 이후 가장 먼저 눈독들였던 분야이기도 한데 관련 레퍼런스가 너무 찾기 어려웠다.
그나마 위안을 준 2권의 책이 있었는데 하나는 마르코스 로페즈 데 프라도가 저술한 “Advances in Financial Machine Learning”이라는 도서였고, 다른 하나는 본 도서의 저자가 집필한 파이썬을 활용한 금융 분석이라는 책이었다.
전자의 책은 내 실력이 부족하여 완벽한 이해가 불가능에 가까웠지만 20여년의 세월동안 실제로 적용해 본 저자의 기법들을 튼튼한 이론적 기반을 토대로 AI를 접목하여 설명해주었기에 전반적인 금융 데이터 분석에 큰 도움을 주었다.
반면 이브 힐피시의 도서는 상대적으로 훨씬 쉬워서 도움이 되었다. 사실 데이터만 금융 관련 데이터일 뿐 거의 Python을 활용하는 책이라 봐도 무방한 것 같다. 금융 관련 데이터들을 Python으로 어떻게 요리하는지 알아가며 금융데이터와 친숙해지고 보다 심도 있는 분석을 위한 좋은 발판을 마련하는 느낌을 받을 수 있었다.
다만 양서임에도 불구하고 전작은 한가지 아쉬운 부분이 있었는데 너무 금융공학 측면에만 초점을 맞춘 나머지 금융 전공자들이 배우는 기본적인 이론이나 정작 AI 관련 기술들을 금융 분야에 어떻게 적용해야 할지 등에 대한 언급이 부족하다는 점 등이 그러한 부분이었다.
이 책은 그런 갈증을 어느정도 해소시켜 준 전작의 업그레이드 버전
이라는 생각이 들었다. 그렇기에 금융 분야에 있어 문외한인 독자라면 이 책을 읽기에 앞서 전작 “파이썬을 활용한 금융 분석”을 먼저 읽기를 권장한다.
금융분야 전공자들이 익히는 이론적 근간들이 상당히 적은 양으로 압축되어 있어 기본적인 데이터 분석지식이나 금융 업무 도메인 없이는 지금 소개하는 책을 쉽게 이해하기 어렵기 때문이다.
이 책의 핵심 부분은 파트 2,3 부분이 될 것이다. 보통 대부분의 유관 도서들이 소개하는 파트4의 알고리즘 트레이딩
부분도 꽤 흥미로운 부분이지만 공학 영역에 치중된 주제이기에 성공적인 수익률을 기대할 만한 전략이 소개되는 것은 아니고 공학적으로 스스로의 가설을 보다 효율적으로 백테스팅하는 방법이 소개되어있다.
사실 내 생각에 저자는 금융 이론보다는 공학 분야의 전문가라는 생각이 든다. 수익률 측면에서 대단한 고수이거나 금융 이론의 박학다식한 학자라기 보다는 Python 등 AI 기술의 전문가이기에 전통적인 금융 이론이 가지는 한계를 기술로 뚫어보고자 다양한 시도와 연구를 진행하는 듯한 인상을 받았다.
그렇기에 기술적인 가치는 파트4 부분이 가장 배울 것이 많고 유익할지도 모르겠다. 그럼에도 개인적으로는 파트2, 3 부분을 강조하는 이유는 다른 책에서 찾아보기 어려운 신선한 시도와 누구나 궁금해할만한 질문이지만 누구도 쉽게 답을 내놓지 않는 영역
에 대한 나름의 소신을 드러낸 부분이기 때문이다.
비록 수익률과 직결된 전략을 소개하는 것은 아니지만 데이터를 근간으로 한 의미있는 가설을 가정하여 전통적인 이론과 다른 방법으로 AI를 금융에 접목해보고자 한 시도는 충분히 의미있는 성과라는 생각이 들었다.
게다가 수익률의 원천이 전략을 공개하는 것은 유관 도서들이 아무리 세월이 흘러도 쉽지 않을 듯 하기에 오히려 전략이 공개된 책은 경계하고 비판적으로 바라볼 필요가 있다.
설사 도서에 소개된 전략을 그대로 따라하여 대단한 수익률을 얻는다 할지라도 거기에 숨은 알파는 곧 베타로 변할 것이고 수익률은 결국 형편없는 전략이 될테니 현 시점 멋진 전략을 공개한다 한들 시간이 지남에 따라 스스로 엉망의 전략으로 만드는 셈이니 저자로써는 얻을 것이 전혀없다.
마치 조엘 그린블라트가 공개했던 마법의 공식이 대표적인 예가 될 것이다. 그럼에도 전략을 공개한다는 책은 정말 이상한 책임에 틀림없다.
어쨌든 각설하고 책의 중요한 파트에 대해 간단히 소개하자면 우선 파트2에서는 “평균-분산 포트폴리오”, “자본자산 가격결정 모형”, “차익거래 가격결정 이론” 등과 같은 전공자들이 배우는 전통적인 금융 모델
에 대해 소개한다.
이런 이론들은 각 주제마다 한 권의 책을 펴내도 설명이 부족할 수 있는 부분이지만 짧게나마 핵심을 정리하고 최단 기간에 이해할 수 있도록 Python 예제들로 구현해보며 이해를 도와주고 있어 괜찮은 시도라는 생각이 들었다. 다만, 극단적인 학습 효율성을 추구한 분야이기에 관련 지식이 전무하다면 거의 이해하기 어렵다고 봐야 할 것이다.
이런 전통 모델들은 수학적이고 논리적인 근거가 있고 구현하기 쉽다는 장점이 있는 반면 경험적 증거도 부족하고, 상호간에 모순되는 측면이 있으며, 실제 금융데이터와 괴리
가 있다는 부분 때문에 현실적으로 큰 도움이 되지 않는 빛 좋은 개살구라는 것이 저자의 주장이다.
특히, 어느 도메인 분야나 AI와 관련하여 비슷한 속성을 갖고 있는 정규분포나 선형성에 대한 가정
이 가능할리가 없기에 실전에서 큰 지지를 받지 못하고 있음을 강조한다.
그렇기에 저자는 말도 안되는 가정이 필요한 기존 모델을 내려놓고 데이터에만 의존한 인공지능을 적용해보는 시도를 시작한다. 시장에 비효율성이 존재하고 있다는 가정을 근간으로 하는데 이는 통계적 비효율성을 경제적으로 활용
하고자 하는 시도라고 소개하고 있다.
이러한 시도는 파트3으로 계속 이어진다. DNN, RNN, Reinforcement Learning 등의 다양한 AI 모델을 활용
하여 다양한 금융 데이터를 학습, 검증해봄으로써 딥러닝과 금융 데이터의 연결고리에 대한 힌트를 얻을 수 있었다.
지금껏 소개한 3개의 파트 외에도 딥러닝이나 머신러닝의 역사 및 발전 개요를 다루는 전반부, 금융 특이점이라는 주제를 중심으로 AI가 금융 분야의 변화에 어떤 영향을 미칠지에 대한 고찰 등이 후반부에 소개되어있다.
전반적으로 전통 모델의 한계가 무엇인지 직접 코딩도 하며 느낄 수 있는 기회를 준다는 점 그리고 시장의 비효율성을 활용하여 금융 데이터를 AI에 접목해보려는 시도 등이 소개되어있다는 점이 이 책이 가지는 차별화된 장점이라 생각한다.
스스로의 가설이 있다면 파트 2,3에 소개된 방식으로 검증도 해보고, 파트4에 소개된 방식으로 구현도 해 본다면 분명 단기간 내 상당히 성장할 수 있을것 같다는 생각이 든다.