밑바닥부터 시작하는 딥러닝 3

sunmi3***l2020-12-31

딥린이들의 딥러닝 지식 업그레이드 필수 책! 직접 딥러닝 프레임워크를 개발해보는 밑바닥부터 시작하는 딥러닝3

sp***l2020-12-22

딥러닝, 파이썬, 프레임워크를 따라할 수 있는 책

gutss***l2020-12-22

이런 책을 기다려왔습니다

kcsgood***l2020-12-21

직접 만들어보는 딥러닝 프레임워크 가이드, "밑바닥부터 시작하는 딥러닝 3"

아마 인공지능과 관련된 연구나 업무를 하고 있는 사람이라면 누구나 Tensorflow나 PyTorch, MXNet같은 딥러닝 프레임워크를 사용할 것이다. (몇몇 프레임워크는 C++이나 java같은 언어로 포팅이 되어 있겠지만) 대부분 이 프레임워크를 다루기 위해서는 파이썬을 잘 다루고, 뭔가의 수학 공식을 코드로 옮길 줄 알고 있을 것이다. 말이 쉬워보이지만, 이런 프레임워크가 미분도 자동으로 해주고, 사용자가 정의한 텐서를 이용해서 계산도 잘 할 수 있도록 해줬기에, 사용자가 조금 더 쉽게 구현에 집중할 수 있게해줬고, 덕분에 기술의 발전이 빠르게 진행되지 않았나 하는 생각을 해본다. 그런 뭔가 이름만 들으면 복잡해보이는 프레임워크를 우리가 직접 만들어볼 수 있을까?

어쩌면 이 책이 그 답이 될 수 있지 않을까 생각해본다.

2017년에 처음 출간했던 "밑바닥부터 시작하는 딥러닝" 시리즈가 올해 3편으로 출간되었다. 딥러닝에 대한 기초 지식과 이미지 처리와 관련된 내용을 다뤘던 1편과, 언어와 같은 Sequence data를 처리하는 방법을 다뤘던 2편과는 다르게 3편에서는 앞에서 소개했던 그 복잡해보이는 딥러닝 프레임워크를 직접 만드는 내용을 다루고 있다.

사실 어쩌면 처음 보는 사람은 막막하게 느껴질 수 있다. 딥러닝 프레임워크를 구현하려면 파이썬 문법을 알고 있는 것을 넘어서서 프레임워크의 구조도 잘 정의해야 하고(어떻게 보면 소프트웨어 공학적인 내용이 필요하지 않을까 싶다.), 앞에서 언급했던 것처럼 텐서를 다루는 방법이나, 자동 미분 같은 수학 이론도 구현할 수 있어야 한다. 나열하다 보니까 단순히 딥러닝 이론만 알고 있다고 해서 모든 것이 구현될 것 같지는 않아 보인다. 그래서 이 책의 선수 지식도 보면 딥러닝 기초이론이나 객체 지향에 대해서 알고 있는 것을 필요로 한다.

딱 인공지능을 알고 있다고 가정지었을 때, 프레임워크가 필요한 요소는 어떤게 있을까 생각을 해보았다. 일단은 변수를 담을 텐서 정의가 필요할 것이고, 신경망을 구성하는 노드, 계층 들도 유기적으로 연결되게끔 구성되어야 할 것이다. 또한 각 노드별 가중치를 업데이트하기 위한 backpropagation도 있어야 할 것이고... 예측치와 실제값간의 오차를 표현할 loss function, optimizer도 필요할 것이다. 이런 내용은 Tensorflow나 Pytorch에는 API로 쉽게 구현되어 있기 때문에, 일반 사용자들은 구글링이나 공식 문서를 통해서 쉽게 가져다 쓸수야 있다지만, 우리가 구현한다면 이 모든게 가능할까 싶었다.

그런데 이 책에서는 이런 내용을 모두 다루고 있다. 오히려 진짜 실제 딥러닝 프레임워크처럼 멋있는 시각화도 구현되고(물론 Tensorboard 같이 현란한 시각화까지는 아니지만, 내부 구조를 설명할 시각화는 이뤄진다.), 심지어는 GPU와 연동시켜서 성능을 개선하는 내용도 담고 있다. 딥러닝 개발 책인데, 메모리 관리같은 성능 측면을 다루고 있는 부분도 흥미로웠다.

위 사진은 책에 실제로 실려있는 딥러닝 구조를 시각화한 내용이다. 처음에는 책에 파본이 생긴줄 알고 깜짝 놀랐었는데, 이렇게 복잡한 딥러닝 내부 구조도 구현하고 시각해볼 수 있게끔 도와준다.

개인적으로는 딥러닝이라는 것을 모르는 상태에서 1편을 봤었고, 막 관심을 가지기 시작할 때 2편을 본 입장에서, 이 책은 정말 딥러닝에 대한 내용을 잘 모르는 사람이라도 책을 읽었을 때, 직접 구현해보면서 원리를 이해할 수 있다는 책의 컨셉이 참 맘에 들었다. 3편도 역시 총 60단계로 나눠서, 직접 딥러닝 프레임워크를 구현해보는 과정을 설명하고 있고, 기존 책의 의도를 물려받아 되도록 쉽고, 직접 구현해보면서 학습할 수 있는 내용 전개가 이뤄지고 있다. 이론이나 구현에만 치우쳐, 소위 말하면 "재미없는" 딥러닝 책이 아닌, 둘다 겸비하여 구현이라는 경험을 해볼 수 있는 것은 이 책이 다른 책들과 비교했을 때 더 돋보이게 하는 특징이라고 생각한다.

책이 담고 있는 주제의 특성상 분명 이 책은 처음 인공지능을 배우는 사람을 위한 책이 아니다. 더구나 프레임워크 구현과 관련된 내용이기에, 딥러닝 본연의 내용과 더불어 소프트웨어 구조나 하드웨어 의존성과 같은 조금은 외적인 내용에 대해서도 어느정도 숙지가 되어 있어야 한다. 하지만 본인이 어느정도 경험이 있고, 무엇보다 직접 이런 프레임워크를 구현하고 싶다는 생각을 가진 사람한테는 많은 것을 느낄 수 있게 해주는 책이다. 더불어 최종 60단계를 거쳐 딱 만들어진 프레임워크를 보면, 조금은 뿌듯하면서 뭔가 새로운 것도 만들어 보고 싶은 그런 느낌도 주지 않을까 싶다.

PS1: 사실 이 책 이전에도 딥러닝 모델을 직접 구현하는 방법에 대해서 소개한 책이 있다.

파이썬 날코딩으로 알고 짜는 딥러닝

이 책은 딥러닝 알고리즘의 원리를 깊숙이 이해하고 이를 파이썬 코딩만으로 구현하는 데 주안점을 둔다. 이를 위해 가장 간단한 신경망 구조부터 복잡한 응용 구조까지 다양한 딥러닝 신경망

www.hanbit.co.kr

"밑바닥부터 시작하는 딥러닝" 책은 구조적 측면을 강조하면서 직접 프레임워크를 만들지만, 위의 책은 데이터에 딱 맞는 형태로 모델을 직접 구현하는 방식으로 설명되어 있는 책인데, 두 책 다 직접 구현해본다는 점에서 내용 전개가 유사하고 마찬가지로 추천할만한 책이다.

PS2: 이 책이 3권이라, 1권, 2권을 꼭 읽어야 할 책인지에 대해서 궁금할 수 있다. 글에도 설명한 것처럼 1권은 딥러닝 기초 지식과 이미지 처리 모델 관련 설명이 되어 있고, 2권은 순환 신경망에 대한 내용이라 3권과는 크게 관련이 없다. 읽으면 내용 이해에 도움이 될 정도?

책의 repository는 아래를 참고하면 좋을 것 같다.

WegraLee/deep-learning-from-scratch-3

『밑바닥부터 시작하는 딥러닝 ❸』(한빛미디어, 2020). Contribute to WegraLee/deep-learning-from-scratch-3 development by creating an account on GitHub.

github.com

출처: https://talkingaboutme.tistory.com/entry/Book-Deep-learning-from-scratch-3 [자신에 대한 고찰]

kelvi***l2020-12-20

밑바닥부터 시작하는 딥러닝3 - 다음 단계를 향해

딥러닝을 처음 시작할 때, 우리는 ANN부터 시작되는 신경망 개념부터 시작하여 CNN등 진화된 알고리즘 들에 대한 이론을 먼저 배우게 됩니다. 그리고 이를 구현하기 위해 텐서플로나 케라스, 파이토치 등을 배우고 MNIST같은 예시 데이터를 가지고 딥러닝 알고리즘을 이용하여 예측하며 프레임워크에 익숙해지게 됩니다.제가 보았던 대부분의 커리큘럼은 여기까지였습니다. 플러스 알파라고 한다면 캐글과 같은 경진대회에 나가는 정도.

그리고 이런 커리큘럼에서 성장의 한계를 느꼈던 분들에게 드디어 추천할 수 있는 책이 나왔습니다.

이 책은 파이토치와 같은 딥러닝 프레임워크를 만들기 위한 60개의 단계로 구성되어 있습니다. 저자가 DeZero라 불리는 순수한 파이썬 기반의 딥러닝 라이브러리를 만드는 법과 그 내부 구조들에 대해서 자세하게 기술해 놓은 덕분에 우리는 편하게 이해하면서 따라가기만 하면 됩니다.

딥러닝 프레임워크를 바닥부터 만들어 보는 것은 생각보다 중요한 일입니다. 쉽계 예를 들자면 자동차 운전하는 방법은 알지만, 자동차의 구조에 대해서 안다면 운전을 할 때 차량의 기능을 100% 활용할 수 있을 뿐 아니라 차량을 관리 할 때 매우 유용하겠죠? 딥러닝 프레임워크도 마찬가지입니다. 위의 예시에서 운전을 딥러닝 모델링이라고 생각하고 관리를 코드 작성이라고 생각한다면, 파이토치와 같은 딥러닝 프레임워크를 그냥 문서를 보며 사용하는 것 보다 직접 만들어 보면서 내가 사용했던 API가 어떻게 작성되어 있는지를 안다면 그 활용도를 극한으로 끌어낼 수 있을것입니다.

특히 연구자들 사이에서 가장 뜨고있는 파이토치와 비슷한 API를 가지고 있기 때문에 파이토치에 입문하고자 하는 분들에게도 매우 유용할 것이라고 생각됩니다.

본 리뷰는 한빛미디어에서 도서만 제공하였으며 어떠한 가이드나 금전적인 지원을 받지 않았습니다.

young***l2020-12-20

[밑바닥부터 시작하는 딥러닝 3] 리뷰

아.. 드디어 이 책이 3권까지 나왔습니다. 시리즈로 몇권까지 나올려고 이러는지 부담스럽네요.

https://www.hanbit.co.kr/media/books/book_view.html?p_code=B6627606922

표지 2020-12-20 21.49.12.jpg

왜 부담스럽냐구요? 좋은 책이라 꼭 책장에 두어야만 하니까요.

2권에서는 자연어 처리애 대한 내용을 다루었었는데, 이번에는 "밑바닥부터 딥러닝 프레임워크를 개발"하는 내용입니다.

딥러닝도 공부하고 프레임워크를 개발하는 방법도 배울 수 있는 "일석이조" 라고 봐야겠죠.

아래 로드맵을 보면 요렇게 단계별로 진행한다고 하네요. 역시 내용은 좀 어려워 보입니다.

로드맵 2020-12-20 21.49.48.jpg

내용이 쉽지 않은 책이라 부담스러울수 있는데 이런 로드맵이 있으면 왠지 든든한 느낌이 들기도 합니다.

이 책을 펼쳐본 순간 제일 맘에 드는 점은 위 로드맵에도 보이듯이 드디어 컬러판으로 나왔다는겁니다.

어릴 시절 흑백 티비만 보다가 컬러 티비를 봤을때의 그런 눈호강(?) 이 느껴집니다.

딥러닝 관련 코드는 특성상 수식과 배열, 등등이 많이 나오는데 이런 코드를 볼때마다 눈이 너무 금방 피곤해지고

가독성이 떨어졌었는데... 아래 사진을 보세요. 컬러로 되어 있으니 이렇게 달라보입니다.

숫자색 다름 2020-12-20 21.51.34.jpg

텐서플로우 공부할때도 잠깐 그려본적이 있는 정확도 같은 그래프도 아래처럼 나오니까 비교 하기가 쉽드라구요.

주요 코드도 하늘색으로 하이라이트 되어 있습니다.

컬러 정확도 2020-12-20 21.53.21.jpg

아직 책의 내용을 꼼꼼히 다 본건 아니지만 앞서 나온 두권의 책과 같은 저자와 역자니까 믿고 보는 책인건 당연한거겠죠.

앞에서 설명한것처럼 이 책은 단순히 딥러닝을 빨리 배워서 사용해보는 책이 아닙니다.

시간을 두고 공부하면서 직접 프레임워크까지 만들어보고 싶은 분들에게 추천하는 책입니다.

그럼 마지막으로 어디선가 봤던 기억이 있는 챠트가 나오길래 2권을 뒤져보니 ... 찾았습니다.

제가 왜 컬러판에 대해서 침이 마르도록 칭찬(?) 하는지 아래 사진으로 비교해보시죠.

2권 3권 비교.png

bum***l2020-12-20

[리뷰] 밑바닥부터 시작하는 딥러닝3

이번에 리뷰할 책은 "밑바닥부터 시작하는 딥러닝3' 입니다.

딥러닝공부를 하면서 텐서플로나 파이토치등의 예제를 입력하고 실행하면서 뭔가 동작하기는 하는데 어떤 원리로 동작할까 궁금한 사람들에게 "밑바닥부터 시작하는 딥러닝" 시리즈는 기본 원리와 그에 대한 (딥러닝 라이브러리를 사용하지 않는) 파이썬 구현코드로 궁금증을 해소해 주었습니다.

하지만 직접 구현한 코드의 사용형태가 원리를 이해하기는 좋았지만 실무등에서 텐서플로나 파이토치등의 예제를 사용하는 형태와 다른점이 있을 수 밖에 없다. 텐서플로나 파이토치등에서 왜 이런 옵션을 쓰고, 왜 이렇게 쉽게 알고리즘을 바꿔쓸 수 있고, 어떻게 비쥬얼라이즈를 할 수 있을까 ..

이런 의문점을 3판이 해결해줍니다.

텐서플로를 사용해본 사람에게 익숙한 Variable 라는 class의 변수의 아주 단순한 구현을 시작으로 어떤 역할을 하는 Layer, Optimizer클래스나 함수를 하나씩 만들어갑니다.

미분에 대한 내용이 추가되고, 자동미분을 위한 변수 옵션이 Variable에 어떻게 들어가서 어떤식으로 구현되는지

Base class를 만들고 서브클래스로 구현을 분리해서 쉽게 바꿔쓸 수 있도록 구조를 만든다든지

성능을 위해 GPU를 사용하게 한다든지

저장후 불러오기나 분산처리를 하게 한다던지

그래프처리를 위해서 어떤 데이타들을 수집하고, 어떤식으로 출력한다든지등등의 과정을 거치다 보면 어느새 익숙한 기존 딥러닝 프레임워크와 예제와 비슷한 형태의 API로 동작하는 프레임웍을 볼 수 있습니다.

요즘에 사용하는 텐서플로1에서 쓰던 Define-and-Run(정적그래프)방식이 아닌 텐서플로2나 파이토치처럼 Defined-by-Run(동적그래프) 방식으로 진행됩니다.

파이썬 언어에 대한 사전지식은 필요하지만 초급자나 타 언어로 시작해서 파이썬을 배운 사람들에게 딥러닝에 대한 지식도 얻어가면서 리팩토링까지 배울 수 있는 아주 휼륭한책이라 생각합니다.

aul020***l2020-12-20

알록달록 밑딥3

딥러닝과 머신러닝을 처음 접했을 때, 그러니까 중1시절 어느 겨울날, 구글이 언제 무슨짓을 할 지 모르니 라이브러리까지 만들어야겠다! 라는 큰 꿈을 갖고 있었다. 뭐. 아직도 책읽고, 재밌어보이는 예제 몇개 돌려보고, 영어공부도 할겸 아카입에서 논문 왕창 다운받아놓고 몇개만 읽어보고있지만 말이다. 밑딥1은 아마 두 번째 정도로 접한 딥러닝 관련 도서였고, 무서운 물고기 표지를 덮어놓고 당시엔 다소 어렵던 개념과 수식들지금도 그렇지만 을 읽어가며 끝가지 읽지는 못했지만 이 분야에 대해 조금씩 이해시켜주던 책이었다. 어쨌든 3권이 또 나왔고, 이번엔 무서워 보이지 않는 귀여운 나뭇잎 해룡 표지다. 어쨌든 이번 밑딥은 텐서플로, 파이토치 같은 딥러닝 프레임 워크를 만들어나가는 책이라 그런지 목차도 활용을 다룬 다른 딥러닝 책들과는 달리, 한문장으로 쓰던 함수를 어떻게 구현하는가에 대한 내용이다. 예전엔 프로그래밍만 할 줄 알고, 거기에 필요한 몇몇 수학적 지식만 있으면 되는 줄 알았는데 깊이들어갈수록 메모리가 어떻고, cpu가 어떻고 하는 컴퓨터 구조에 관한 지식의 필요성이 느껴진다.. 밑딥 1,2와 다른점이라면 이번엔 드디어 흑백을 탈출해 컬러로 인쇄되어 있는거다! 알록달록해서 좋다. 이책을 통해 파이썬을 위한 도구를 만드는 일은 상당히 어렵다는것을 느꼈다. 많은 책들에서 한 두 번 정도 간단히 언급하고 가는 미분이라던지, 역전파라던지 이런걸 구현해야 하고.. 그리고 이 책을 처음 받고 딱 펼쳤을 때 등장한 페이지. 내 책에 엄청난 인쇄오류가 있나보다.. 했는데 앞페이지를 넘겨보니 8차 미분을 시각화한 그래프의 일부라고 한다. 다른 내용은 이해 못한게 아니라 스포일러하면 안되니 책을통해 직접 읽어보시길. 일단은 궁금해서 책를 읽어보려고 시도했으나 아직 때가 이른 것 같다. 이번 방학때 도서관에서 밑딥1권 빌려서 조금 더 공부한 후에 다시 읽어봐야겠다.

lowgi***l2020-12-20

밑바닥부터 시작하는 딥러닝 3

kko***l2020-12-20

[도서 리뷰] 밑바닥부터 시작하는 딥러닝 3

gble***l2020-12-20

개발자를 위해 추천! 밑바닥부터 시작하는 딥러닝3

Author: 사이토 고키 지음 / 개앞맵시 옮김

출판사: 한빛미디어

Score /5: ⭐️⭐️⭐️⭐️⭐️

최근에 딥러닝 프레임워크는 춘추전국 시대인것 같다.
처음은 텐서플로로 대동단결 할 듯 싶더니 파이토치가 점점 더 올라오고 현재는 비등비등한 듯하다.

그렇다면 왜 요즘 파이토치가 핫 한걸까?
파이썬 문법의 간단함과 강력한 산술라이브러리(Numpy)를 지원하기 때문이라고 생각한다.

나는 개발자로 파이썬은 간단하게 쓸 줄 알지만 요즘 많이들 얘기하는 머신러닝/딥러닝의 세계는 아직도 어지럽고 현기증이 난다.

그런 나에게 밑바닥부터 시작하는 딥러닝3 은 파이썬은 한줄기 빛 아니었을까? (물론 나에게만 빛일수도 있다...)
각설하고 이 책에 대해서 느낀점을 리뷰하자.

딥러닝 프레임워크를 기초부터 만들어 가면서 익힐 수 있습니다.

그동안 나는 개발자로 미리 만들어진 프레임워크를 어떻게 활용할지 API만 호출하는 형태로만 딥러닝을 간략하게 이해해 왔다.
이 책은 How 가 아니라 Why에 더 집중할 수 있게 해주는 책이다.

왜 Why가 중요할까?
물론 How 라는 접근도 중요하지만 어떻게 사용해야 하는지에 대한 절차만 기술되어 있다면 나중에 다른 기술이 나온다면 어떻게 되는 것일까? 새로운 How를 배우기 위해 시간을 사용해야 한다.

이 책은 물론 How도 설명하지만 Why를 통해서 개발자 또는 독자가 적절한 인사이트를 얻게 도와주려는 책이다.
내가 밑바닥에 대한 인사이트 왜 이렇게 해야하는지에 대해서 인사이트를 얻으면 다음에 다른 기술이 나와도 기본은 변하지 않으므로 쉽게 기술을 따라갈 수 있다.
이게 중요하다! 개발자 또는 IT 업계 엔지니어들은 평생 공부해야 하는 직군이라고들 한다. 엄청나게 많은 기술들이 내가 잠자거나 글을 쓰고 있는 이순간에도 쏟아지지만 내가 적절한 기준과 인사이트를 갖고 있다면 해당 기술의 밑바닥(?)은 비슷하거나 같은 경우가 많으므로 대부분의 상황에서는 내가 기술을 Follow하고 따라갈 수 있을 것이다.

그럼 다른 관점에서 책을 한번 보고 싶은데 초보자가 이해하기에는 괜찮을까?
생각보다는... 쉽지는 않다. 하지만 책을 읽으면서 느끼는 것은 필자가 독자에게 이렇게 이렇게 가자 라고 끌고 가려는 의지가 보이고 친절하게 한입 한입 떠 먹여주기 위해서 노력하는 느낌이 많이 든다.
입에 들어와 있는 음식을 삼키는 건? 독자의 몫이다.

그리고 책을 읽으면서 느낀 공통적인 부분은 적절한 예시와 그림이 탁월하다.
아래는 번역판이 기존 원판보다 더 나은 부분인 것 같다. 역자가 필요하다 생각 되는 부분을 추가해 놓았다. (역자님 굿!)

책 두께는 절대 얇지 않다. 그 말은 반대로 말하면 충분히 설명을 하고 있다는 말이 되기도 하고 많은 내용을 담고 있다는 의미이기도 하다.
이 책은 한번 쓰고 버리는 일회용 같은 개념이 아니다. 두고 두고 다시 보면 아 이렇게 할 수 있구나 하는 작은 관점으로 인사이트를 나에게 던져 줄 수 있는 그런 책이라고 본다.

개인적으로 마음속에 담아둔 고사성어(?)가 있는데 '독서백편 의자현' 이라고 한다.

처음 읽었을 때 이해가 안가는 문장이나 내용이라도 여러번 읽으면 그 뜻이 자연스럽게 나타난다 라는 의미다.

나에게 이 책이 그런 책이 아닐까?

다른 분들도 이 책을 통해서 딥러닝의 매력에 빠졌으면 좋겠다.

daeh***l2020-12-20

프레임워크를 직접 만들어보는 딥러닝3

ghcjs***l2020-12-20

밑바닥부터 시작하는 딥러닝 3

항상 감사하는 한빛미디어 ㅎㅎ

책만 받아놓고 서평만하고 제대로 공부는 안하고 있는 1인

그렇다!

밑바닥부터 딥러닝 시리즈 이게 3편까지 나오다니 와우...

도대체 밑바닥이 왜 3편까지 나왔을까? 이 책은 어떤 내용을 담고 싶어서 나왔을까??

이 책을 한줄로 표현하자면 밑바닥부터 딥러닝 프레임워크 제작

그동안 딥러닝에 대한 이야기를 해왔다면 이제는 프레임워크까지 작성하는 내용이다.

프레임워크에 대해서 검색해보면 여러가지 많은 내용들이 있지만

내가 보는 관점에서 프레임워크는 개발효율성 극대화의 목적이 크다고 본다.

프레임워크 공부는 스프링을 하면서 많은 고민을 하게 됬었는데

그건 딴 이야기라 넘어가고 이 책에 내용과 요즘 추세를 보자면

딥러닝 프레임워크가 많이 나왔고 그것 들이 어느덧 공통적인

특성이 생기고 비슷한 방향으로 개발되어가는 정착단계에 들어갔다고

저자는 이야기한다(난 모른다 모든걸 까본적도 없고 다 다뤄보지도 못했다)

실제로 텐서플로우, 케라스, 카페, 파이토치등... 내가 나열한것 보다 훨씬 많다.

이 프레임워크들을 사용하면 정말 간단하게 코드 몇줄만 작성하면 딥러닝을

할 수 있게끔 해준다.

이러한 딥러닝 프레임워크를 구현수준으로 상세하게 작성된 책이 이 책

밑바닥부터 딥러닝3라고 할 수 있다.

여기서 만들어진 프레임워크의 이름이 바로 deZero 이다.

책 제목과 어울리는 듯?

이러한 성격의 책을 딥러닝을 처음 공부하는 사람 보다는 어느정도

잔뼈가 굵은 사람들이 보는게 맞겠다 싶다.~~그러니까 난 이걸 왜 쓰고 있지?~~

딥러닝을 프레임워크 관점에서 밑바닥부터 제대로 구현하고 싶다!

그러한 엄청나신 분들이라면 이 책이 도움이 될 것이라 생각한다.

~~난 밑바닥부터 시작하는 딥러닝1이나 공부열심히 해야겠다~~

밑바닥부터 시작하는 딥러닝. 3

저자: 사이토 고키
출판: 한빛미디어
발매: 2020.11.10.

이 책은 한빛미디어로부터 제공받아 리뷰가 작성되었습니다.

nanhmjj***l2020-12-20

단 한 권의 책으로 딥러닝 프레임워크를 만들 수 있다!

어느덧 “밑바닥부터 시작하는 딥러닝 시리즈”의 세번째 책이 발간되었다. 밑바닥 시리즈는 딥러닝을 연구, 학습하는 이들이 이구동성으로 극찬하는 딥러닝 입문서이다.

개인적으로 알파고 등장 이후 2017년 처음으로 구매한 딥러닝 서적이 “밑바닥부터 시작하는 딥러닝” 인데, 이 책 덕분에 역전파의 늪에서 벗어날 수 있었기에 지금도 깊은 애정을 갖고 있는 책이다. 그때는 시리즈로 계속 나올줄 몰랐는데 결국 3권까지 나왔다.

이번 도서 3권은 어떤 밑바닥을 구현하게 될까? 그것은 바로 DeZero라는 이름을 가진 딥러닝 프레임워크 이다.

텐서플로우나 파이토치 같은 훌륭한 딥러닝 프레임워크가 이미 존재하는데 굳이 프레임워크를 만들 필요가 있을까라는 의문이 생길 수도 있다. 그럼에도 이 책을 반드시 읽어야 할 이유는 무엇일까? 대표적으로 다음 2가지 이유를 들고 싶다.

SOTA 연구 및 개발 협업 연구 리터러시 능력
최신 AI 기술을 활용하여 서비스를 개발하는 회사일수록 SOTA급 논문을 빠르게 이해하고 코드로 구현하는 능력이 매우 중요하다. 연구 결과를 구현체로 만드는 대표적인 사이트로 paperswithcode를 예로 들 수 있는데 최전선에 위치한 기술인 만큼 타인의 연구 결과를 빠르게 해석하여 구현하고자하는 서비스에 빠르게 녹일 수 있는 커뮤니케이션 능력 혹은 리터러시는 매우 중요한 능력이다.

또한 스스로의 연구를 코드로 구현하고 검증하는 과정은 연구의 이해 수준 자체를 높일 수 있음과 동시에 다른이와의 의사소통을 향상시킬 수 있고 객관화 할 수 있다.

연구 리터러시외에도 실제 서비스를 구현할 때의 커뮤니케이션도 중요한 부분이다. 뛰어난 아이디어가 있음에도 팀 내 수준 높은 코드를 이해하지 못해 민폐 코드를 작성한다거나, 미래에 예기치 못한 오류를 양산할 수 있는 가능성을 가진 코드를 주입한다면 향후 서비스 품질과 일정에 막대한 지장을 초래할 수 있다.

본 도서를 통해 딥러닝 프레임워크 내부 구현 매커니즘을 확실히 이해한다면 실 서비스 개발에 있어 수준높은 협업을 통한 서비스 구현은 물론 다른 연구 결과를 빠르고 쉽게 분석하여 좋은 인사이트를 녹일 수 있다는 장점이 있다.
프로젝트 설계-구현 능력 향상
딥러닝 분야 외에도 이 책에는 파이썬을 활용한 대규모 프로젝트 설계 기법을 다루고 있다. 변수와 함수를 굳이 Variable, Function이라는 클래스로 추상화하여 출발하는데서 객체지향에 숨은 철학을 이해할 수 있다.

Define-by-Run(동적 계산 그래프), 고차미분, Computational Graphs를 직접 구현하며 왜 개발자들이 텐서플로우 1.x 버전보다 파이토치에 열광했는지, 텐서플로우 2.x의 출현이 필연적이었는지 깨닫는 것은 신호탄에 불과하다.

텐서플로는 버전 1.x에서 채택한 독자적인 프로그래밍 언어 Domain Specific Language (DSL)을 사용한 정적 계산 그래프 기능을 보며 잘못된 설계가 가져오는 여파를 대규모의 프로젝트에 참여하지 않아도 간접적으로나마 직접 눈으로 확인하고 실감할 수 있게 된다.

이를 통해 동적 Define-by-Run 방식(텐서플로우의 경우 Eager Execution이라 지칭) 매커니즘과 자동 미분의 매커니즘 그리고 이를 지원하기 위한 설계 기법을 배울 수 있는데 이는 다른 서비스를 구현할 때도 활용할 수 있는 메타 설계기법으로 활용할 수 있을 것이다.

자동 미분, 계층 컬렉션, 데이터셋, 옵티마이저 각각의 Layer와 클래스를 분리하는 관점이나 파이썬을 Pythonic하게 활용하는 방법부터 GPU 활용 및 속도, 메모리 성능 개선 측면에서도 배울 것이 많기에 굳이 딥러닝이 아니더라도 어떤 서비스를 설계 및 구현하는데 필요한 프로젝트 능력을 크게 향상 시킬 수 있다.

본 도서를 읽으며 느꼈던 위 2가지 장점 외에도 단 한 권의 책으로 딥러닝 프레임워크를 만들 수 있다는 사실에 적잖이 놀랐다.

단 2개의 클래스 Variable, Function의 추상화에서 출발하여 역전파, Define-by-Run(동적 계산 그래프), 고차미분, Computational Graphs, Layer 및 Optimizer 등의 확장성을 부여하며 60단계 과정을 따라 하다 보면 어느덧 CNN, RNN, LSTM 모델을 지원하는 딥러닝 프레임워크 DeZero를 만들 수 있게된다.

특히 어떤 식도 미분 가능하게 모듈화한 설계가 인상적이었으며, 5개고지 60단계별로 구현한 결과를 시점별로 실행하며 눈으로 확인할 수 있어 보다 쉬운 이해가 가능했다.

스스로 역전파를 완전히 이해하고 있다고 생각했었는데 3고지에서 역전파의 역전파를 구현하면서 구석에 남아있는 무지의 영역을 확실히 깨칠 수 있는 계기를 얻을 수 있어 만족스러웠다.

책의 구성과 전달력 또한 일품이다. 독자 의식의 흐름을 꿰뚫기라도 한 듯 궁금한 질문이 생길때마다 저자의 답변이 등장한다. 독자의 마음을 어떻게 이렇게 잘 들여다 볼 수 있을까? 저자의 뛰어난 예측 공감각력(?)에 감탄하는 일련의 과정이었다. 고수들의 내공을 이보다 쉽고 편하게 배우긴 어려울 것 같다. 전편 명성 그대로 독자 의식을 꿰뚫 듯 궁금증이 생길 때마다 친절한 설명이 등장한다.

설계에 녹아있는 철학은 기술을 넘어 예술의 영역에 가깝다. Layer, Optimizer, DataLoader 등 앞서 설명한 설계 철학 외에도 구체적으로 계산 그래프의 위상이 어떤 형태일지라도 역전파가 가능하도록 설계한 부분은 감탄을 금할 수 없었다.

개인적으로는 DeZero를 만든 후 paperswithcode 사이트를 비롯 연구 결과의 코드 구현체가 전보다 쉽게 읽혀 매우 신기했다. 연구의 철학이나 아이디어를 생생히 느낄 수 있는 또 다른 시야를 얻은 것 같아 특히 만족스러웠다.

Eager Execution, Computational Graphs를 직접 구현하며 TensorFlow2.0 등장 등의 트렌드를 알 수 있었고, 자주 사용하지 않던 프레임워크에 대한 자신감 또한 큰 수확이었다.

텐서플로우 1.x에서 누구나 느꼈던 불편함과 어색함이었던 PlaceHolder, Session분기, Define-and-Run 방식에서 비롯된 계산 그래프 수행의 비효율성 등이 왜 발생했는지 그래서 올바른 설계가 왜 중요한지 나아가 파격적인 문법 변화에 따른 리스크를 감수하면서까지 텐서플로우 2.x이 등장할 수 밖에 없었던 필연을 구체적으로 실감할 수 있었다.

그 외 파이썬을 파이썬답게 활용하는 방법부터 GPU 활용 및 속도, 메모리 성능 개선 측면에서도 배울 것이 많았다.

읽는 내내 머리속에 계속 느낌표가 떠오르는 명작 중의 명작이었다. ML/DL 엔지니어분들은 물론 IT 서비스를 설계, 구현하는 분들께도 강력하게 추천하고 싶은 책이다.

책소개 - 밑바닥부터 시작하는 딥러닝 3

lees***l2020-12-20

[리뷰]밑바닥부터 시작하는 딥러닝3

jangej1***l2020-12-19

[리뷰] 밑바닥부터 시작하는 딥러닝 3

오늘은 밑바닥부터 시작하는 딥러닝 3을 리뷰하려고 한다. 밑바닥 시리즈는 딥러닝을 공부하는 사람이라면 무조건 읽어본다는 시리즈이다. 그만큼 진짜 밑바닥부터 시작하기 때문에 하나하나씩 다 구현해가면서 딥러닝의 원리를 이해할 수 있기 때문이다. 이번에도 좋은 기회에 밑바닥 딥러닝 3판을 얻게 되었다.

1판은 딥러닝 기초, CNN, 2판은 RNN, LSTM이었다면 3판은 "pytorch 비스무리한거 만들기" 라고 볼 수 있다. 직접 딥러닝 프레임워크를 만드는 것을 다룬다.

딥러닝 프레임워크중에 가장 유명한 것은 아무래도 텐서플로우와 파이토치를 들 수 있는데, 텐서플로우 2.0 버전부터는 파이토치스러운 API로 디자인이 변경되었다.

그래서 이 책에서도 파이토치 스러운 디자인으로 직접 딥러닝 프레임워크를 만든다. 이름은 DeZero. 책의 도입부분에 이 책에서 만들 프레임워크에 대해서 소개해준다.

파이토치같은 딥러닝 프레임워크가 주목받았던 큰 원인은 Autograd 있을 것이다. Autograd는 미분을 자동으로 수행해주는 것이다. 미분이 자동이라는 말은, 특정 수식에 대한 미분을 프레임워크 차원에서 미분식을 구해준다는 것이다. 그래서 직접 미분식을 프로그래밍하지 않아도 된다. 딥러닝에서는 기본적으로 미분을 적극 활용하기 때문에 프레임워크단에서 지원하는게 아주 끝내주는거다.

프레임워크를 만들때 변수에 해당하는 값, 함수, 연산자 등등을 직접 만들게 되는데 여기에서 파이썬에서 발생할 수 있는 메모리 관리 같은 부분도 꼼꼼히 챙겨준다. 크으.. 정말 좋은 책이다. 이 책은 총 60단계의 스탭을 통해 프레임워크를 만들어간다. 5개의 고지가 있는데, 한 고지를 넘어갈때마다 정말 도전해볼만하며 재미있는 책인 것 같다. 하지만 이 책을 제대로 따라가려면 밑바닥 딥러닝1권을 따라해봤거나 파이토치를 써본적이 있거나 딥러닝에 대한 지식을 기본적으로 알고 있어야 보기에 힘들지 않다.

아무튼 매우 흥미롭고 재미있는 책이다.

khj0***l2020-12-19

17년부터 시작한 3번째 입문서

한국에서 가장 유명하지 않을까 생각하는 딥러닝 입문서(?)의 신작입니다.

3년 동안 1~2년 걸쳐 출간된 [밑바닥 시리즈] 3번째 책입니다. 세번째 책이지만 밑바닥이라는 이름답게 딥러닝의 기초를 다루기 때문에 1권이 나올 때 딥러닝을 공부하기 시작한 사람에게는 굳이 필요한 책은 아니라고 생각합니다.

그렇다고 세번째 책인만큼 딥러닝이 완전히 처음인 사람을 위한 책은 아닙니다.

그 이유는 이 책은 딥러닝 패키지를 파이썬으로 직접 만드는 것이 주 내용이기 때문입니다.

밑바닥부터 시작하는 딥러닝이라는 책이 어떤 프레임워크(텐서플로,토치,카페) 등에 의존하지 않고 코드를 보여주는 책이었는 데, 이번에는 아예 직접 프레임워크를 구현해보는 것이 목적입니다.

저는 이 책이 처음부터 끝까지가 파이썬 코드를 작성해서 딥러닝의 기능을 구현함으로써, 입문서를 읽었더라도 쉽게 이해하기 힘든 구조인

딥러닝의 주 요소 하나하나를 이해하기 위한 책이라고 느꼈습니다.

이런 이유로 이 책은 어느 정도는 기초 지식이 있을 것을 기대하고 모든 부분 설명하지는 않습니다.

즉 적어도 밑바닥 1권을 읽었다고 가정하고 쓰여진 책이라고 할 수 있습니다.

이 책의 장점은 이론이나 딥러닝 라이브러리를 사용하는 것만으로는 자칫 블랙박스가 되어 버리는 딥러닝 전체 과정을 이해하는데 도움을 준다는 것입니다.

또한 파이썬으로 일일히 코딩을 해서 모듈을 만드는 것이 생각 외의 장점이 있는 것 같습니다.

많은 분들이 파이썬 입문 수업을 받으시면 아마 클래스까지 배우게 되는 데 독학하는 분들은 많이 사용해도 함수 정도로, 거의 그 이상은 다루지 않은 채 잊어버리는 경우가 대다수라고 생각합나다.

해당 책에서 파이썬으로 함수부터 시작해서 모듈을 만들고, 이를 개선해나가는 과정을 통해서 오히려 딥러닝보다 파이썬프로그래밍에 대해서 잘 알 수있는 기회가 될지도 모릅니다.

단점은 처음부터 끝까지 모든 내용이 이어지기 때문에 읽을 때마다 햇깔리는 부분이 많아서 고생했습니다.

책만으로 이 책을 읽기 힘들고, 적어도 자료 코드를 봐야 이해가 될 것이라고 생각합니다.

기초부터 실습까지 인공지능 기본의 모든것을 배울수 있는 시리즈

최근들어 인공지능,딥러닝에 대한 인기가 갈수록 높아지자 그와 관련된 책들이 무척 많이 나오고 있다. 나도 그 인기를 실감하며 많은 책을 보면서 관심을 가지고 있는데, 유독 눈에 띄는 시리즈의 책이 있다. 바로 <밑바닥부터 시작하는 딥러닝 시리즈>이다. 보통 한권안에 모든걸 끝내려는 딥러닝 책들과는 다르게 벌써 3권이나 나오면서 차근차근 가르치고 있는 이 책이 무척이나 신기한데, 시리즈가 계속 나오면서도 주변에 그 인기도 나름 있는 터라 과연 그 인기 비결이 뭔지 궁금해 최신권인 3권을 한번 펼쳐보게 되었다.

책 앞에서 부터 각양각색의 전문가들의 추천사가 이어짐과 동시에 목차가 눈에 들어왔다. 목차는 챕터가 아니라 독특하게 다섯 고지, 60단계라는 이름으로 세부화하여 진행하고 있었다. 엄청나게 세부적으로 나뉜것도 독특한데, 고지, 단계라는 이름을 붙이고 있어 뭔가 게임하는 듯한 느낌이 든게 무척 신선하게 느껴졌다.

책 소개를 보니 DeZero라는 오리지널 프레임 워크를 만들면서 개발을 진행한다고 적혀있었다. 기존의 딥러닝 책들은 다양한 API를 실습하는 형태로 진행하고 있다고 생각했는데, 물론 이 책도 API나 프레임워크를 일부 사용하지만 이 책만의 독자적인 프레임워크를 사용해서 실습환경을 구축한다는 것을 보고서 얼마나 책을 만들기 위해 많은 정성을 쏟아부었는지라는게 실감이 났다.

물론 이런 실습자료에서 공을 들였다고 전부가 아니라 생각해 책의 내용도 차근차근 읽어보았는데, 설명이 무척 잘 되어있다고 느낀 부분이 엄청 많았다. 책 이름 그대로 밑바닥부터 원리 하나하나 사용되는 수학이론 하나하나 설명하면서 그에 대한 실습을 보여주고 있어 이론부터 실습까지 탄탄한 그야말로 정석적인 코스 그대로 밟고 있어 좋았다. 그렇다고 엄청 어렵거나 수준높게 공식이 막 나오고 그런 정신없는 내용이 아니라 정말 단단하게 지식을 다지기에 필요한 내용을 잘 정리한 느낌이라 무척 도움이 되는게 많이 보였다.

아무래도 내용의 수준이 있다보니 초보자가 본다기 보다는 어느정도 파이썬에 익숙한 사람이 보는것이 맞겠단 생각이 든다. 하지만 그렇지 않더라도 딥러닝에 무척 관심이 많아 배워보길 원하는 사람이라면 이 책이 가장 적합하단 생각이 든다. 딥러닝을 공부하는 것을 이제 막 시작하려는 사람, 본격적으로 배우고 싶은 사람들은 이 책의 시리즈를 한번 구해서 정독하며 공부해보기를 권하고 싶다.

icon***l2020-12-11

텐서플로 같은 딥러닝 프레임 워크가 만들어지는 마법같은 책

yong***l2020-12-02

한마디로 최고다! 명불허전!

손꼽아 기다리던 '밑바닥부터 시작하는 딥러닝' 시리즈의 세번째 책...

앞서 출간된 '밑바닥부터 시작하는 딥러닝' 시리즈 1,2는 아마도 국내에서 가장 많이 팔린 딥러닝 책들이라 해도 과언이 아닐 것이다.

소위 요즘 머신러닝/딥러닝 하는 사람 대부분 시작을 이 책들과 하지 않았을까?

그리고 이제 막 입문하는 사람들이 물어보면 가장 먼저 추천해주는 책도 이 책이 아닐까 싶다, 나도 표지가 너덜너덜 하도록 보고 또 보고 했으니...

이 시리즈의 장점은 뭐니뭐니 해도 기본 개념과 원리를 프레임워크 사용을 최소화 하고 직접 구현하며 배울 수 있다는 것이다, 최근 몇년간 출간된 책들중 입문서로 텐서플로나 파이토치, 케라스 같은 것 사용안하고 넘파이 정도만을 사용해서 한땀한땀 만들어가며 배우는 책으로 이만한게 없지 싶다.

그리고 그 세번째 이야기, 딥러닝 프레임워크...

1편의 딥러닝 이론과 구현, 2편의 순환 신경망과 자연어 처리 그리고 이번에는 딥러닝 프레임워크라... 방향을 너무나 잘 잡은 것 같다.

머신러닝/딥러닝을 공부하면서 나도 언젠간 좋은 이론과 모델 그리고 프레임워크를 만들어 이쪽 생태계에 contributor가 되보고 싶다는 생각을 해봤는데 최신 트렌드 따라가기도 버거운게 현실이긴 하지만 나는 그런 꿈을 가지고 있다.

기존에 봤던 책중에는 밑바닥부터 시작하는 딥러닝 만큼이나 입문서로 좋다고 생각하는 '그로킹 딥러닝'이란 책에서 한 챕터정도 딥러닝 프레임워크를 만드는 내용을 소개한 적이 있었던것 같은데, 아직 그럴만한 여력이 없긴 하지만 그 밖에 다른 곳에서는 아직 접해보지 않은 주제이긴 했다.

newprivatemarine.tistory.com/88?category=712862

[서평][IT개발][딥러닝] 그로킹 딥러닝 / 한빛미디어

인공지능 분야가 한때 침체기를 걷다가, 기술적 진보를 통해 긴 부진의 터널을 뚫었고 몇년전 알파고를 기점으로 확실히 붐업이 되었다, 오히려 요즘은 딥러닝이 붙어 있으면 살짝 진부할 정도

newprivatemarine.tistory.com

막연한 기대와 꿈 그리고 어디서부터 시작해야 할지 막막하기만 한데, 이 책은 그런부분에 있어 할 수 있다는 용기와 영감을 주는 책이라 감히 말해본다.

이 책은 자신만의 딥러닝 프레임워크나 딥러닝 모델을 효과적이고 세련되게 구축할 수 있는 기본기를 다지는데 매우 유용한 정보와 스킬을 제공한다.

한편으로 기존 프레임워크를 이해하고 더 잘 활용할 수 있는 계기를 만들어주기도 한다.

책은 잘 만들어진 프레임워크로 가기 위한 5가지 목표를 총 60단계에 걸쳐 하나하나 만들어가는 여정으로 구성되어 있다.

각 단계를 3~4장 정도의 분량으로 부담스럽지 않게 구성해놨다, 각 단계를 연속성을 가지며 딥러닝 프레임워크라는 최종 목표를 향해 필요한 개념 하나하나 그리고 직접 구현하고 개선하는 과정을 통해 프레임워크 내면에서 벌어지는 일들을 이해할 수 있다.

마치 딥러닝 프레임워크라는 토이 프로젝트를 애자일(스크럼) 방식으로 스프린트마다 점진적으로 만들어가는 구성은 무겁지 않으면서도 책장은 술술 넘기게끔 만든다.

편집도 그림과 소스 위주로 깔끔하고, 아무래도 딥러닝이 이미지 처리 관련 내용이나 예제가 많다보니 요즘 딥러닝 책들의 트랜드가 컬러 인쇄가 기본인데 이번 3권도 이러한 추세를 따랐다, 하단 2권까지만 해도 흑백이었는데...

딥러닝 프레임워크를 만들어가는 과정을 통해 딥러닝 기본 개념과 원리를 다시 한번 이해하고 구현해볼 수 있고, 다른 좋은 프레임워크의 사상과 구조를 더 잘 이해할 수 있어 시리즈 방점을 찍는 것 같다.

혹 4권이 나올까? 아님 1, 2권 개정판이 나올까? 저자의 다음 행보가 벌써부터 기다려진다.

※ 본 리뷰는 IT 현업개발자로서 한빛미디어 리뷰어로 출판사로부터 제공받아 읽고 작성한 글입니다.

jehyun***l2020-12-01

[밑바닥부터 시작하는 딥러닝 3](사이토 고키, 2020)

"야, 까먹을 게 따로 있지 어떻게 그걸 까먹냐"
- 일전에 한 선배가 나를 타박하면서 했던 말.
- 선배는 이해할 수 없는 내 망각의 대상은 군번이었다.
- 26개월 현역으로 군대를 다녀온 선배에게 군번은 "자다가도 툭 치면 나와야 되는", 글자 그대로 자신의 정체성(ID = identity)이었겠지만 전문연구요원으로 논산 훈련소에서 4주만 보낸 내게는 대체 입사 지원서에 이걸 왜 써넣어야 하는지 모를 성가신 행정코드일 뿐이다.
내게도 20년 가까운 시간이 지났지만 잊혀지지 않는 것이 있다.
- 지금은 데이터를 다루지만 석사 시절엔 실험을 했다.
- 참 멋진 선배가 만든, 이온 밀링을 포함해 6가지 소재를 스퍼터링하여 박막을 만드는 장비가 있었는데 이 장비를 함께 사용해서 시료를 만들었을 뿐 아니라 나사 하나하나를 풀고 조이며 업그레이드하고, 수리하고, 길게는 이틀씩 베이킹을 하면서 온도를 체크했다.
- 아무도 없는 새벽에 장비를 꼭 안아주면서 우리 힘내보자 한 적도 있지만 아쉽게도 당시에 좋은 성과를 내놓지는 못했다. 표현은 못했지만 선배에게 빚을 지고 갚지 못한 것 같아 아직까지 미안하다.
- 그러나, 성과와는 별개로 나사를 조일 때 짓눌러지는 개스킷의 감각, 장마철엔 습도때문에 실험이 제대로 안돼서 서운해하던 감정은 그대로 남아서 다시 하라면 할 수 있을 것 같다.
반면, 이런 느낌이 없어서 아쉬운 것도 있다.
- 박사 2년차에 시뮬레이션으로 분야를 옮겼다.
- 내 적성이 실험보다는 책상물림쪽인지 성과가 제법 괜찮게 나왔다 - 2008년 당시 박사 디펜스때 1저자 5편, 논문을 낼 수 없는 사기업에 들어간 뒤에도 미리 뿌려놓은 씨를 후배들이 틔워준 것까지 해서 40여편의 논문이 나왔다.
- 실적으로 치면 결코 나쁘지 않지만 다른 사람이 짠 코드를 사용하기만 했지 코드를 건드리지 못했다.
- 이 코드를 만든 분들은 코드를 이리저리 수정하며 자기 아이디어를 반영해 연구를 하고 있는데, 나도 비슷한 아이디어는 많았으나 포트란, C, C++이 복잡하게 얽힌 유한요소해석(FEM: Finite element method) 코드를 손댈 능력이 되지 못해 다른 아이디어만 적용했다.
- 그 때 코드의 밑바닥을 건드려봤다면 - 그렇다고 더 좋은 논문을 썼을 것이라는 보장은 없지만 - 더 뿌듯하게, 더 즐겁게 연구를 하지 않았을까 하는 상상만 한다.
딥러닝이 알파폴드2로 또 한번 깃발을 꽂았다.
- 알파폴드는 딥러닝으로 3차원 단백질 구조를 예측하는, 구글이 만든 프로그램이다.
- 2019년 12월에 열린 단백질 구조 예측 대회(CASP) 템플릿 프리 구조 예측에서 43개 구조 중 25개를 정확히 예측하여 1위를 기록했는데, 2위는 미시간대 연구팀으로 고작 3 문제에서 가장 높은 점수를 받았고 대다수의 연구진들은 0점이었다. 그만큼 어려운 문제이고, 왜 새로운 병은 자꾸 생기는데 신약 개발은 늦는지에 대한 일면의 답이 될 수 있다.
- 그리고 어제, 알파폴드2가 사고를 쳤다.
- 작년보다 훨씬 더 고도화된 성능으로 인간계와의 차이를 더 크게 벌렸으며, 이 분야에 15년간 몸담은 한 전문가의 말에 따르면 "단백질 염기 서열만 알면 X-ray, NMR, Cryo-EM 실험을 할 필요 없이 거의 정확하게 구조를 얻을 수 있다는 것을 의미한다".
- 현재까지 염기 서열이 알려진 10억개의 단백질 중 구조가 알려진 단백질은 10만개가 채 되지 않기 때문에 신약 개발 등에 큰 진전이 있을 것이라는 전언과 함께 "기존의 단백질 구조 예측 연구는 대부분 휴지통으로 들어갈 운명"이라 예측했다.
- 관심이 있으신 분은 이 기사들을 같이 읽어보셔도 좋겠다. [이주용님 글 링크][네이처 기사 링크], [딥마인드 블로그 기사 링크]
"딥러닝을 배울까 말까가 아니라 어디에 쓸지를 고민해야 한다"
- 바둑을 두는 알파고, 단백질 구조를 예측하는 알파폴드, 관심 동영상을 계속 추천하는 유튜브와 넷플릭스.
- 이런 회사들의 성취가 너무 두드러져서 딥러닝이 내 인생과 무슨 상관이 있나 싶을 수도 있지만, 딥러닝을 이용한 앱들이 점점 많이 나오고 있다 - 회의시간에 스마트폰을 켜두기만 하면 화자를 분리해서 회의록을 작성해주는 앱, 밑에 책을 놓으면 읽어주는 스탠드, 읽고 있는 책을 찍으면 울퉁불퉁한 종이를 펴주고 글자를 분리해주는 서비스 등등 셀 수가 없을 정도다. 스마트폰으로 사진을 찍으면 나도 모르는 사이에 딥러닝으로 화질을 보정해준다.
- 이미 연구에도 딥러닝이 깊숙히 들어와 있다.
  - X-ray 판독은 식약처 인증을 받은 제품들이 나오고 있다.
  - 매우 약해서 TEM 이미지를 얻기 힘든 시료를 최대한 살살 촬영한 뒤 영상을 재건한다.
  - 시뮬레이션과의 협력으로 interpolation의 늪을 벗어나 새로운 소재를 스스로 찾으며 탐색한다.
딥러닝은 배우기 쉽다. 그러나
- IT 분야에는 기존 연구분야의 사고방식으로는 이해하기 어려운 공유 문화가 있다.
- 장인이 골방에서 남몰래 몇년을 집중하여 어느날 짠! 하고 멋진 논문을 내놓는 것이 기존의 연구방식이라면,
  IT 분야는 뭐 조그만 것을 만들어 광장에 가져가서 사람들 앞에서 뚝딱거리고 있으면 지나가던 사람이 자기 도구를 써보라고 빌려주기도 하고, 이렇게 하면 잘 되더라고 훈수도 둔다. 그리고 이렇게 쌓인 평판은 부와 명예, 더 큰 기회로 이어진다.
- 당연히 후자의 발전속도가 빠를 수 밖에 없고, 일도 점점 더 쉬워진다.
- 구글이 내놓은 텐서플로, 페이스북이 공개한 파이토치만 해도 사용자 유입에 큰 역할을 했는데, 텐서플로를 쉽게 해주는 케라스, 파이토치를 쉽게 해주는 파이토치 라이트닝과 fast.ai 의 등장은 중학생 딥러닝 개발자를 탄생시키고 있다.
- 하지만 공유 문화에 너무 기댄 나머지 남의 코드를 갖다 쓰기만 하면서 그럴싸하게 포장하는 사람들이 적지 않고, 작동 원리는 전혀 모른 채 성능을 향상시키겠다고 이런저런 파라미터만 바꾸는 사람도 많다.
- 이런 분들은 과거의 내가 그랬듯, 남들에게는 박수를 받아도 본인 스스로는 매우 목이 마를 수 있다.
- 만약 전혀 목이 마르지 않고 박수갈채를 즐긴다면 연구자로서의 자질을 의심해볼 필요가 있다. 전자레인지에 즉석식품을 데워서 배를 채우는 것은 문제가 되지 않지만 이런 음식을 요리라고 내놓는 요리사는 없기 때문이다.
한번쯤은 밑바닥을 찍고 뼈에 새길 필요가 있다.
- 좋은 도구를 놔두고 매번 기초공사부터 하는 것도 어리석은 짓이다.
- 하지만 이 도구가 어떻게 돌아가는지, 어떤 취약점이 있어서 어떨 때 쓰면 안 되는지, 내가 이 문제를 풀기 위해 A, B, C를 선택하지 않고 D를 선택했는지 설명할 수 있으려면 한 번쯤은 바닥부터 긁어볼 필요가 있다.
- 밑바닥 시리즈는 1, 2권도 대호평을 받았지만 3권은 특히 딥러닝 프레임워크 구축을 다루고 있다.
- 작은 함수와 클래스부터 만들어 연속 미분, 유닛 테스트를 거쳐 프레임워크를 만드는 과정은 "내가 이 짓을 해야 하나"라고 느낄 수도 있다. 이에 대해 나는, 강하게 "네. 뼈에 새기진 못해도 흔적은 남겨야죠" 라고 말하고 싶다.
자기 밥줄이라면, 적어도 군번보다는 깊게 새겨야 하지 않을까.

본 리뷰는 본인 블로그에 작성된 것을 옮긴 것입니다: https://jehyunlee.tistory.com/12

밑바닥부터 시작하는 딥러닝 3

딥러닝 프레임워크를 기초부터 만들어 가면서 익힐 수 있습니다.

Step1,2 변수와 함수 만들어 보기

step3,4 함수연결 및 수치미분

이 책을 읽고

자료 다운로드시 유의사항

▶ 부록/자료 관련 FAQ