알파고 제로를 넘어서는 바둑봇을 만들며 AI를 배운다?!

한빛미디어

2020-05-20

by Suhyeoni

13,389

인간의 기보를 학습한 알파고.

알파고는 『생각에 관한 생각』에서 제시한 두 가지 사고방식(직관을 뜻하는 ‘빠르게 생각하기’와 이성을 뜻하는 ‘느리게 생각하기’)과 유사한 형태로 동작한다. 느리게 사고하는 부분은 몬테카를로 트리 탐색 방식을, 빠르게 사고하는 부분은 방대한 트리 탐색(느린 계획) 문제를 해결한 딥러닝 즉, 빠른 패턴 매칭을 사용한다.

2016년 3월 알파고는 이세돌 9단과의 세기의 대결에서 1패한 것을 제외하면 74전 73승이란 대기록을 세웠다.

알파고의 완성이라 할 수 있는 알파고 제로는 강화학습 기법을 이용, 더 이상 바둑기보를 필요치 않는다. 대국상대나 바둑 기보 없이 혼자 바둑을 두며 스스로 깨우친다. 알파고 제로는 알파고 마스터와의 대국에서 100전 89승 11패를 기록했다. ‘자기 자신 말고는 적수가 없다’라는 평가를 받고 있다. 그야말로 ‘신의 경지’에 올랐다 할 수 있다.

이제 알파고는 알파스타란 이름으로 바둑, 그다음으로 스타크래프트에 도전하고 있다. 한정된 바둑판 위에 흑과 백 돌을 놓는 바둑보다 변수가 많은 스타크래프트를 통해 인간과 유사하게 사고하는 AI에 다가가고자 하고 있다.

『딥러닝과 바둑』
막스 펌펄라/케빈 퍼거슨 지음, 권정민 옮김, 한빛미디어, 2020년 6월, 444쪽, 35,000원

우리는 개론으로, 논문으로, 그리고 신경망을 만들어보고 간단한 문제를 푸는 정도로만 AI를 이해하고 배우고 있다. 구글 딥마인드의 도전처럼 이제 단순한 게임에서 복잡한 문제로 AI를 개선하며 나아가는 ‘경험’과 '도전'이 우리에게도 필요하다. 여기 그들의 여정을 따라가는 한 권의 책이 나왔다.

한빛미디어의 신간 <딥러닝과 바둑>은 AI의 궁극의 미래인 범용 인공지능 연구의 토대가 되고 있는 알파고의 개발 여정으로 독자를 초대한다. 기본적인 바둑 규칙에서 시작해 바둑 돌을 놓고 게임을 하는 기본적인 바둑봇에 AI 두뇌를 넣고, 발전시키다가 종국에는 알파고 제로를 능가하는 바둑봇을 실제로 개발한다.

오픈소스 바둑봇 ‘베타고(BetaGo)’ 개발자인 막스 펌펄라, 케빈 퍼거슨가 쓴 이 책은 실제 동작하는 파이썬 코드를 제시한다. AI 프레임워크로는 케라스를, 바둑 게임에는 저마다의 지능을 실험할 수 있는 오픈소스 ‘베타고’를 사용한다. 이밖에도 바둑봇이 동작하는 데 필요한 데이터 포맷, 배포, 클라우드 컴퓨팅과 같은 주제까지 상세히 설명한다.

· · ·

“이 책은 인공지능 분야에서 가장 흥미로운 이정표 중 하나를 소개하고 이를 즐겁게 시작하도록 이끈다. 이 과정을 따라오는 독자는 ‘빠른’ 패턴 매칭과 ‘느린’ 계획의 조합이 필요한 모든 상황에서 가능한 구현 방법을 익힘으로써 현대 AI 시스템을 이해하고 만들 만반의 준비를 갖추게 될 것이다. 이것이 기본 인지 과정에 필요한 빠르고 느린 사고방식이다.”

- 소레이 그리펠 딥마인드 연구과학자, 딥마인드 알파고팀 대표

“우리는 알파고의 기반 원리에 대해서는 일반적인 소프트웨어 엔지니어링 관련 사람들이 실제로 돌려보면서 익힐 수 있다는 것을 믿어 의심치 않는다. 바둑경기를 해보고 이런저런 실험을 해봐야 즐기고 이해할 수 있다. 이는 머신러닝이나 그 외의 다른 분야에서도 마찬가지다.”

- 막스 펌펠라, 케빈 커거슨 저자(베타고 개발자)

· · ·

알파고를 능가하는 바둑봇을 만들며 익히는 딥러닝, 강화학습

『딥러닝과 바둑』

▶한빛미디어 | ▶예스24 | ▶교보문고 | ▶알라딘 | ▶인터파크

· · ·

머신러닝·딥러닝 도서 선택 가이드(http://bit.ly/2HROenV)에서 <딥러닝과 바둑>이 다루는 세부 신경망, 알고리즘, 언어, 라이브러리 등을 다른 책과 비교하며 확인할 수 있습니다.

TAG : 알파고 ,바둑 ,이세돌 ,강화학습 ,딥러닝 ,AI ,케라스 ,넘파이 ,몬테카를로트리탐색 ,

이전 글 : 안드로이드 프로그래밍 입문의 장벽을 넘으려면

다음 글 : [책쓰기 & 글쓰기] 책을 쓰면 얼마나 벌까요? 시원하게 알려드립니다.

최신 콘텐츠

IT/모바일

알파고 제로를 넘어서는 바둑봇을 만들며 AI를 배운다?!