난로 앞 안락의자에서 뜨개질을 하는 노부인 ‘제인 마플(Jane Marple)’. 그녀는 수많은 추리소설 독자를 매료시킨 애거사 크리스티의 추리소설 속 탐정이다. 제이마플 김성필 대표는, 언뜻 평범해 보이지만 편견 없이 진실을 꿰뚫어 보는 통찰력, 그리고 오랜 경험으로 터득한 인간관으로 미궁에 빠진 사건을 해결하는 그녀에게 매료됐다. 그녀처럼 ‘지능(인공지능 AI)으로 문제를 해결하겠다’라는 의미를 담아 회사 이름을 ‘제이마플’이라고 지었다고. 국립재활원을 나와 창업 2년차에 접어든 그에게서 재활보조기기 시장과 AI에 대해 들어봤다.
Q. 한국항공우주연구원에서 국립재활원으로, 지금은 AI 스타트업의 대표다. 크게 관련이 없는 길을 걸어온 것 같다.
A. 박사 과정을 밟고 있을 무렵 취미로 ‘클릭키(Clickey)’라는 가상 키보드 프로그램을 만들었다. 키보드를 쓸 수 없어 대체 마우스 같은 특수기기가 필요한 장애인을 위한 애플리케이션이었다. 당시 마이크로소프트 사의 운영체제(OS)인 윈도 7 이전에는 한글 자모가 표시되는 화상 키보드가 OS에 내장되어 있지 않아 지체 장애인이 글을 입력하기에 불편했다. 장애인 입장에서는 온스크린 키보드에서 자음 하나 찾기도 어려운 일이었기에, 그들에게는 클릭키가 유용했다. 한국한공우주연구원에 연구원으로 있는 내내 클릭키와 관련된 유지보수 요청 메일이 아름아름 왔다. 그러다 2008년쯤 국립재활원 설립을 준비하던 지인이 함께 일해보자고 제안했다. 그렇게 들어간 국립재활원에는 8년을 있었다. 보통 행정직은 발령이 나 지방에 가고 그러는데 연구직은 그런 게 없어 편했다. 하지만 재미는 없더라. 무언가를 연구, 개발해도 기업이 그 기술을 가져가기 전까지는 상용화가 되지 않아서였다. 언제부터였던가 “한번은 내가 만든 제품이나 서비스를 세상에 내놓고 싶다”는 생각이 들었다. 창업을 결심한 것은 그 무렵이었다.
Q. 재활에 특별한 관심이 있었는가? 아니면 클릭키가 동인이 된 것인가?
A. 거창한 포부가 있어 뛰어든 건 아니다. 장애인 복지나 재활 분야에 크게 관심이 없는 평범한 사람이다. 학창시절에는 여느 학생들과 마찬가지로 공부해서 좋은 대학에 가야겠다는 생각뿐이었다. 항공학과를 간 것이 그 연장선상이었다. 항공학과가 무엇을 배우는 과인지도 모르고 덜컥 지원했다. 이과니까 적당히 관련된 것을 배울 거라 지레짐작했는데, 막상 가보니 전혀 달랐다. 그때로 다시 돌아가 전공을 선택한다면 아마 IT 관련 학과에 가지 않을까 싶다(웃음).
클릭키는 우연히 만들게 됐다. 어느 지체 장애인이 이러이러한 게 필요하다고 내게 말했다. 처음 들었을 땐 직접 만들 수 있을 것 같았는데, 막상 개발을 시작하니 생각과 달리 쉽지 않았다. 당시의 윈도는 클릭키 개발에 필요한 API를 제공하지 않아 일반적인 방법으로는 구현할 수 없었다. 이런저런 시도가 이어졌다. 여러 시행착오를 거치던 어느 순간, 우연히도 의도대로 작동하는 게 아닌가. 클릭키와의 인연은 그렇게 시작됐다. 사실 지금도 어떤 원리로 왜 그렇게 작동하는지 정확히는 잘 모른다. 한 가지 확실한 건, 개발에 더 시간이 걸렸으면 포기하고 말았을 텐데 생각보다 빨리 구현이 돼서 클릭키를 지금까지 손에서 놓지 못하고 있다는 사실이다.
Q. AI 재활보조기기 개발 외에 하고 있는 일이 있는지?
A. 드론 일을 하고 있다. 최근 어느 세미나에 발표자로 나섰다. 발표 주제는 드론과 AI였다. 드론 업계 종사자들의 경우 AI에 대한 이해도가 낮은 편이라 나를 찾아왔더라. 거절하기 어려웠다. 스타트업의 생존을 위해서는 좋든 싫든 이런 저런 일을 할 수밖에 없는 게 현실이니까. 최근에 비슷한 이유로 AI 드론 용역을 수주 받았는데, 물론 전혀 관련 없는 분야라고는 생각지 않는다. AI라는 한 우물을 계속 파고 있다.
Q. 재활보조기기 시장에서 어떤 기회를 본 것이기에 뛰어들었는지?
A. 재활보조기기 시장 자체는 없다고 봐도 무방하다. 2016년 미래창조과학부가 국내 재활보조기기 시장의 실태 조사를 한 적이 있다. 의료기기를 제외한 나머지 전체 시장 규모가 약 300억 원대라고 한다. 단일 품목도 아닌 의료기기를 제외한 전체 시장 규모인데 한 중견기업의 매출 규모에 불과한 것이다. 시장이라 할 수 없다고 본다.
Q. 그럼 왜 뛰어든 것인가?
A. 경쟁이 없어서다. 한마디로 다 고만고만하다. 국내뿐 아니라 해외도 마찬가지다. 가장 큰 이유는 AI을 접목한 재활보조기기가 어디에도 없었다는 점이다. 세계 시장에서 한 번쯤 시도해볼 만한 분야라고 생각했다.
AI에는 3대 분야가 있다. 영상, 음성, 자연어 처리다. 이 3대 분야에는 공통점이 있다. 모두 장애와 관련이 있다는 점이다. 영상은 시각, 음성은 청각 및 언어 장애, 자연어 처리는 언어 장애와 지체 장애와 관련이 있다. 예를 들면, AI 장애보조기기는 기존 제품이나 서비스를 완전히 초월하는 파괴력을 지녔다. 재활보조기기도 크게 다르지 않다. 나는 AI가 재활보조기기 시장의 패러다임을 바꿔버릴 거라고 본다. 아직까지는 AI를 준비하는 재활보조기기 업체가 있다는 소리를 듣지 못했다. 시도하기에는 내재화된 역량도 부족하고, 기존 엔지니어가 AI를 연구하기도 어렵기 때문일 것이다.
베이비붐 세대인 현 50~60대가 70세가 되면 청각 장애는 기본이고 고령화로 인해 눈도 침침해지고 행동도 어려워질 것이다. 앞으로는 선천적으로 장애를 가지고 태어난 사람보다 고령화로 인한 장애가 늘어날 것이다. 그렇게 되면 재활보조기기 수요도 덩달아 늘어나지 않을까. 이를 기회라 보고 재활보조기기 시장에 뛰어든 것이다.
Q. 세 명뿐인 회사에서 AI 책을 두 권이나 냈던데.
A. 우연히 기회가 생겼다. 국립재활원 근무 당시 AI에 뛰어들기로 마음먹고 1년간 휴직을 했다. AI를 배우려고 자율형사립연구소인 ‘모두의연구소’에서 진행하는 딥러닝 스터디에 나갔는데, 이 스터디를 다니는 동안 책을 집필했다. 원래는 휴직 후 국립재활원에 복귀해 AI를 활용한 장애보조기기를 연구할 생각이었는데, 제품화가 쉽지 않은 분야라 아예 창업으로 마음을 바꿨다. 창업을 하든 안 하든 책은 쓰려고 했다. AI 전공자도 아닌 내가 AI를 한다고 하면 “니가 뭘 아냐”고 할게 뻔하지 않은가. 그렇게 써내려간 책이 『딥러닝 첫걸음』(한빛미디어, 2016)이다.
Q. 제이마플이란 회사명에 특별한 의미가 있다 들었다.
A. 유명한 추리소설가 애거사 크리스티의 작품에 ‘미스 마플’이라는 인물이 나온다. 노처녀라 미스 마플이라고 불리는데, 그녀의 본명은 ‘제인 마플’이다. 제인 마플은 세인트 메리 미드란 조용한 시골 동네에서 벌어지는 사건을 해결하는 인물인데, 그녀처럼 지능적으로 문제를 해결하겠다는 의미에서 ‘제이마플’이라 지었다. “흥신소냐?”는 지인들의 농담 섞인 반응이 속상할 때도 있다. 하지만 내 마음에는 쏙 드는 이름이라 크게 개의치 않는다.
Q. 어떤 AI 재활보조기기를 연구, 개발하고 있는가?
A. 내년 상용화를 목표로 한 제품 개발이 한창이다. 초인종과 화재경보기, 아기울음 소리 등을 인식해 빛이나 진동으로 알려주는 청각장애인용 기기 등을 개발하고 있다. 청각장애인에게는 일반인과는 다른 피드백이 필요하다. 특히 필요한 것이 음성인식 기술이다. 화자 독립형은 아무 음성이나 말해도 인식할 수 있지만, 아직은 구현하기가 어려워 우선 화자 종속형으로 기기를 개발하고 있다. 쉽게 설명하면, 인식해야 할 사람의 목소리를 미리 녹음하고 그 사람의 이름을 부르면 인식해 알려주는 식이다.
Q. 그러한 아이디어는 어디서 얻나? 장애인을 직접 만나 의견을 듣는다거나?
A. 아이디어의 대부분은 국립재활원에서 평소 습관처럼 남겨 둔 메모에서 온다. 실제로 청각장애인들과 이야기를 나눠 보면 대부분은 너무 이상적이라 구현이 불가능한 제품을 원하고, 현실적으로 구현 가능한 어중간한 제품은 필요 없다고 말한다. 그런 제품 없어도 지금까지 잘 살아왔다는 이유에서다. 스티브 잡스가 ‘아이폰’이란 스마트폰을 내놨을 무렵, 지인에게 스마트폰의 강점을 아무리 설명해도 왜 필요한지 이해하지 못했던 그때와 같지 않은가? 물론 지금 우리가 준비하고 있는 재활보조기기가 스마트폰과 같은 반전을 일으킬지는 두고 볼 일이지만.
Q. 소리 인식에 AI를 활용한 것인가?
A. 소리는 시간의 흐름에 따라 파형이 나오는 ‘시계열 데이터(Time Series Data)’다. 마이크로는 소리를, 다른 센서로는 진동을 기록할 수 있다. 이러한 파형을 다루는 기술은 음성 이외의 다른 데에도 활용할 수 있다. 비명소리를 인식하는 보안/안전 기기가 그중 하나다. 지하주차장마다 비상벨이 있지만, 대부분은 어디에 있는지 모른다. SOS 기능이 있다 한들 위급할 때 그걸 누를 수 있겠는가? 하지만 비상벨이 비명소리를 인식한다면 이야기가 달라진다. 우리가 하려는 것이 바로 그런 일이다.
시계열 데이터는 AI로 패턴을 인식하기에는 최적의 형태다. 재활보조기기뿐 아니라 다른 분야에서도 활용도가 높다. 과거 플로피디스크처럼 ‘드륵 드르륵’ 소리로 불량섹터 유무를 알 수 있었듯이 자동차 엔진 소리만으로 이상 유무를 알 수 있다. 따지고 보면 이런 것은 오랜 경험을 쌓으면 더 인식을 잘할 수 있다. 데이터를 모은다면 분명 의미 있는 패턴을 찾아낼 수 있다고 믿고 있다.
마이크로 입력된 소리는 시간에 따라 흘러가는 데이터지, 이미지는 아니다. FFT를 쓰면 소리를 이미지로 넘길 수 있다. FFT가 시간 데이터를 주파수 영역으로 넘긴다. 여기에는 시간 축과 크기값이 있는데, 크기값 중 높은 것은 빨간색, 낮은 것은 파란색으로 표현해 이미지를 만들고 이걸 컨벌루션 신경망에 넣는다. 이러한 전처리 과정을 거쳐 만들어진 이미지는 일반 이미지와 달라 네트워크 구조를 좀 다르게 쓴다. 음성인식은 보통 MFCC를 쓰지만 비음성 소리는 Mel 스펙트럼을 쓴다. 소리와 음성은 특성이 다르기 때문이다.
비명 소리는 음성과 스펙트럼이 거의 같다. 이 비명 소리를 정확히 알아채는 게 바로 기술력이다. 비명소리는 무의식적으로 내는 소리다. 게다가 사람마다 다 다르다. 누구는 ‘캬악’, 또 다른 이는 ‘엄마’라고 비명을 지른다. 이 문제를 해결하는 게 관건이다.
Q. 임베디드에 AI라면, 혹시 구글 TPU와 같은 칩을 썼나?
A. 아니다. 우리가 개발한 모델은 70%를 처내도 인식 성능에 저하가 크지 않은 반면, 요구되는 하드웨어 성능은 비례해서 줄어들기 때문에 저사양의 임베디드에서 충분히 사용할 수 있다.
그래서 하드웨어로는 현재 라즈베리 파이를, 언어로는 파이썬을 쓰고 있다. 이러한 임베디드 보드를 ‘엣지 디바이스’라고 한다. 차후 보다 더 저성능의 임베디드 보드에 포팅할 계획이다. 또한 연구 목적으로는 리눅스 외의 환경에서 케라스, 파이토치 등도 쓰고 있다. 상용화 시에는 매트랩으로 회로 설계와 코드 작성까지 모두를 자동화해볼 계획이다.
Q. 비명소리, 초인종, 벨소리 등의 데이터셋은 어떻게 확보했는가?
A. 지인에게 초인종 소리를 녹음해 달라고 부탁하기도 하고, 유튜브 영상을 이용하기도 했다. 아이 울음소리는 부모가 올린 영상에서 주로 추출했다. 이런 영상을 찾는 것보다는 데이터를 정제하고 분류하는 게 더 어려웠다. 예를 들어 아기 울음소리를 녹음할 경우 주변의 말소리나 음악소리 같은 생활 소음이 함께 녹음되는 경우가 많은데, 데이터로 활용하려면 이를 다 걸러야 하기 때문이다.
Q. 하드웨어 스타트업은 소프트웨어 외에도 하드웨어 양산까지 해야 해 이중 삼중고를 겪는다고 흔히 말한다.
A. 문제는 인력과 돈이다. 개발 분야가 넓으면 분야별 인력이 필요하다. 그래서 외주로 처리할 건 넘기고 해야 한다. 사실 우리도 지인에게 부탁하는 게 많다. 하드웨어 개발은 거의 다 외주를 주고 있다.
하드웨어는 생산은 한꺼번에 대량 생산을 해야 해서 특히 많은 비용이 든다. 재고를 쌓아두고 1개씩 팔아 투자비를 회수해야 하는데, 그 와중에 현금 흐름이 막히면 꼼짝하지 못한다. 그래서 제품 상용화 전에 이런 리스크를 줄이기 위해 중간적 형태의 제품을 준비하고 있다. 아두이노 보드에 화자 종속 음성인식 칩이 들어간 아두보이스(arduVoice) 1.0 보드가 그것이다. 이 개발보드는 DIY 개발자를 위해서 음성 명령을 내릴 수 있는 보드로, 음성인식 칩에 은닉 마코프 모델(Hidden Markov Model)이란 기존 음성인식에 쓰던 범용 알고리즘을 구현해 두었다. 몇 개 문장을 녹음하면 음성을 인식할 수 있고, 신호마다 ID를 줘서 ID가 오면 주변기기를 제어할 수 있다.
Q. 재활보조기기는 특수 기기인 탓인지 가격이 비싸다. 아무래도 개발 단계부터 원가 절감 고민이 많았을 것 같다.
A. 수요가 적기 때문이라고 생각한다. 지원금 없이는 개인이 사기 어려운 게 현실이다. 그런 문제 때문에 최대한 범용적인 제품을 만들려고 한다. 이왕이면 문화나 언어에 영향이 없는 제품이었으면 한다. 그런 제품을 개발한 후에, 장애인을 위한 또 다른 제품을 내놓으려고 한다.
Q. AI 도서의 저자이자 AI 스타트업의 대표다. AI를 언제 처음 접했고, 어떤 점에 매료됐는가? 또 AI를 어떤 식으로 공부했는지, 다른 개발자에게 도움이 될 만한 조언 부탁한다.
A. 『딥러닝 첫걸음』으로 공부하라(웃음). 공부할 수 있는 방법은 수만 가지다. 직접 공부하며 자신에게 맞는 쉬운 길을 찾으라고 말하고 싶다. ‘학습 방법’은 문제가 아니다. 언어의 학습 방법은 너무나도 다양하다. 그런 건 중요하지 않다. 일단 하면 된다. 처음 시작할 때는 다들 쉬운 길을 찾고 싶어 하지만 그건 불가능하다. 개발도 그렇다. 어떤 기술을 쓰다 보면 생각과 달리 잘 안 돼서 막히기도 한다. 그런 시행착오를 거치고서야 다음에 비슷한 일을 다시 겪었을 때 두 번 실수하지 않는다. 딥러닝 공부도 그런 관점에서 꾸준히 공부하라고 당부하고 싶다.
Q. 앞으로의 AI, 어떻게 보고 있는가
A. 지능화는 향후 수십 년간 이어질 주제다. 지능화라는 흐름이 바뀔 거라고 생각하지 않는다. 서비스나 기기는 앞으로 더더욱 지능화될 것이다. 네트워크화가 PC에서 모바일로, 이제 사물로 확대되고 있지 않은가? 하지만 불과 몇 년 전만해도 많은 이들이 사물에 네트워크가 왜 필요한가에 의문을 품었다. 그럼에도 네트워크화라는 큰 흐름은 기술의 등장이나 사라짐과는 관계 없이 계속 이어져왔다. 지능화도 그럴 거라고 본다. 사물의 지능화라는 흐름에서 AI 칩이 개발되고 그에 필요한 신기술이 앞으로도 끊임없이 나올 것이다. 딥러닝으로 안 된다면 새로운 알고리즘이 나오지 않겠는가.
우리는 그저 이 흐름을 타고 현재 가장 강력한 기술을 선택해 쓰면 된다. 기술이 한계에 부딪힌다면 다른 기술로 교체하면 된다. 각자의 상황과 역량을 따져보고 각 분야가 지능화로 어떻게 바뀌어갈지 고민하고 예측하며 미래를 준비해야 한다.
김성필 저자의 도서 『딥러닝 첫걸음』
* 도서를 클릭하시면 도서정보로 이동합니다.
최신 콘텐츠