자세히 보기
|
# 저자님에 대해 궁금합니다!
저는 원래 박사과정에서 기계공학과에서 신호처리와 자동제어를 공부하였습니다. 이 분야는 시스템의 각종 센서에서 받아들이는 신호라고 하는 데이터를 다루는 학문이라 할 수 있습니다. 그러니까 처음부터 데이터 과학을 공부한 셈입니다. 처음에는 음향 데이터를 주로 다루었고 현재 많은 이어셋에서 사용되고 있는 능동소음제어(Active Noise Canceling) 기술을 연구하였습니다.
학위과정을 마친 뒤에서 전자회사에서 같은 분야를 계속 연구하다가 증권사로 회사를 옮기면서 금융 공학이라는 새로운 분야로 전공분야를 바꾸게 되었습니다. 금융 공학은 금융 데이터를 분석하고 파생 금융 상품 등을 만들어내는 학문입니다. 전공은 바뀌었지만 데이터를 다루고 분석하는 업무를 하는 것은 마찬가지입니다. 현재는 베라노스라고하는 금융투자기술 스타트업에서 기술이사로 재직하고 있습니다.
이 회사에서는 퇴직연금과 같은 장기 금융 투자에 필요한 목적기반 투자(GBI: Goal Based Investment)라는 기술을 개발하고 있습니다. 많은 직장인 분들의 소중한 퇴직금을 안정적으로 관리하면서 목표 수익률을 추구하는 새로운 금융 기술입니다.
|
# 데이터 사이언스 스쿨 수학책을 집필하시게 된 이유가 무엇인가요?
회사에서 데이터를 다루고 분석하는 업무를 하면서 각종 성인교육기관 등에서 데이터 분석에 대한 강의를 하게 되며 수년간 꾸준히 강의를 계속 하고 있습니다. 강의를 하다보니 대부분의 수강생 분들이 데이터 분석을 하는데 필요한 수학적 지식에 대해 너무 궁금해하셨습니다.
수학이라는 학문이 너무 방대하고 어렵다보니 도대체 어디에서 어디까지를 공부해야 하는지 혼자서는 파악하기가 너무 어렵다는 것입니다. 그런데 시중에 나온 책들으르 보니 너무 쉬운 기초 수학만 다루거나 혹은 데이터 분석이 아닌 수학 그 자체를 위한 어려운 내용들을 다룬 책들만 있고 정작 데이터 분석만을 위해 요약 정리된 책이 없었습니다.
그래서 다년간 수강생들의 질문에 대한 대답을 정리하여 데이터 분석에 필요한 모든 분야를 알기 쉽게 한권으로 축약하여 보자는 생각을 했습니다. 데이터 사이언스 스쿨 수학책은 이러한 질문에 대한 답이라고 할 수 있습니다. 선형대수부터 미적분, 최적화, 확률론까지 데이터 분석에 필요한 모든 분야를 다루지만 수학 초보자들도 공부할 수 있도록 가장 쉬운 기초부터 차근차근 내용을 설명하기 위해 노력하였습니다.
|
# 이 책으로 수학 공부할 때 가장 효율적인 방법이 무엇일까요? 저자님은 어떻게 공부하셨나요?
저는 데이터 분석가에게 수학은 목표가 아니라 도구이자 기술이라고 보고 있습니다. 도구나 기술은 익숙해지는 것과 빨리빨리 필요한 시점에 쓸 수 있는 것이 중요합니다. 즉 몸에 익숙해져야 한다는 것이죠. 따라서 수학 공부하는 것을 고시 공부하듯 시험을 목표로 무언가를 외운다고 생각하지 마시고 자전거 타기를 익히거나 수영을 익히는 것처럼 자연스럽게 사용할 수 있도록 노력해야 한다고 생각합니다.
수학 공부도 자전거 타기나 수영과 비슷합니다. 단기간에는 불가능하지만 어느 정도의 노력과 꾸준함만 가지고 있다면 누구나 익힐 수있는 것입니다. 다만 책과 수식으로만 익히는 것은 흥미가 떨어질 수 있기 때문에 파이썬 등의 프로그래밍 언어를 사용하여 수학 문제를 풀어본다든가 하는 방식으로 좀 더 재미있게 수학을 공부하시면 좋겠습니다. 제 책 데이터 사이언스 스쿨 수학편에서는 모든 수학 문제를 파이썬 코드로 풀어서 설명을 하고 있으니 이런 공부방법에 도움이 되리라 믿습니다.
|
# 저자님께서 운영하고 있는 ‘데이터사이언스 스쿨’(datascienceschool.net) 웹사이트에 대해 좀 더 알고 싶습니다.
처음에는 강의를 할 때 파워포인트 등의 강의자료를 만들어 배포하는 방식으로 강의를 하였습니다. 그런데 수강생 분들께서 좀 더 글로 자세히 설명된 자료를 원하시더라구요. 그래서 블로그를 통해 강의자료를 올리겠다고 결정하였습니다.
그런데 시중에 나와 있는 블로그 서비스나 플랫폼에서는 제가 원하는 형태로 강의자료를 올리고 쉽게 독자로부터 피드백을 받을 수 있는 서비스나 플랫폼이 존재하지 않았습니다. 특히 저는 수학과 머신러닝, 딥러닝 이론을 주로 다루는데 여기에 복잡한 수식과 코드가 많이 포함되거든요. 그래서 이러한 분야에 적당한 웹사이트를 스스로 제작하기로 마음먹고 개발을 하였습니다.
주로 파이썬 장고 웹서버를 사용하여 개발하였구요 실제 개발기간은 한 달 정도 걸린 것 같습니다. 제가 강의를 주로 주피터 노트북이라고 하는 문서 형태로 작성하는데 제 웹사이트는 이 주피터 노트북을 그대로 웹사이트 형태로 변환할 수 있는 웹서비스라고 할 수 있습니다. 현재는 데이터 분석에 필요한 수학과 회귀분석, 시계열분석, 머신러닝, 딥러닝 등에 대한 컨텐츠를 주로 올리고 있습니다. 파이썬 프로그래밍과 R 프로그래밍에 대한 기초적인 내용도 있고요.
앞으로는 강화학습이나 실무에서의 경험과 같은 내용도 추가하려고 노력하고 있습니다.
|
# ‘데이터 사이언스 스쿨’(datascienceschool.net) 온라인 강의 외에 오프라인 강의도 들을 수 있는 기회가 있을까요?
현재는 패스트캠퍼스 등의 성인교육기관과 코스콤 등 각종 기업체에서 데이터 분석 관련 강의를 하고 있습니다. 대부분 데이터 분석에 대한 강의이고 데이터 엔지니어링 혹은 기업체 실무에서 사용하는 세부적인 주제에 대해서도 다루고 있습니다.
|
# 이 책 외에, 이후 저자님이 추가로 집필이나 번역을 계획 중인 책이나 주제가 있다면 살짝 귀띔해주실 수 있을까요?
현재 “데이터 사이언스 스쿨 - 파이썬 편”과 “데이터 사이언스 스쿨 - 머신러닝 편”을 집필 준비 중에 있습니다. “데이터 사이언스 스쿨 - 파이썬 편”은 데이터 분석에 필요한 파이썬 프로그래밍 기술을 기초부터 중급까지 설명하는 내용이 될 것입니다. “데이터 사이언스 스쿨 - 머신러닝 편”은 회귀분석과 분류문제, 클러스터링 등 다양한 머신러닝 기법에 대해 이론적인 기초 뿐 아니라 파이썬 코드와 파이썬 패키지 사용법을 설명한 내용이 될 것입니다.
이후도 기회가 된다면 딥러닝, 강화학습 등에 대한 책도 쓰고 싶습니다.
|
# 독자 여러분께 하고 싶은 말씀이 있으신가요? 마지막으로 한 마디 부탁드립니다.
앞에서도 말씀드렸지만 데이터 사이언스를 위한 수학 공부는 도구를 사용하는 기술을 익히는 것입니다.
한 걸음에 무언가를 달성할 수 있다고 기대하기 보다는 수학을 공부하고 익히는 과정 자체를 즐기면서 스스로의 기술이 향상되어 가는 것을 느끼는 즐거움을 알 수 있으면 좋겠습니다.
|