AI

AI

Convergenist1001

AI convergence

‘알파고’의 창조주, 데미스 허사비스를 만나다

김혜인 이민경


넥스트저널리즘스쿨 학생들이 이세돌 9단과의 바둑대결에서 파죽지세로 몰아붙이고 있는 인공지능 ‘알파고’를 설계한 데미스 허사비스를 지난 3월10일 서울 포시즌스 호텔에서 만났다. 허사비스는 대국 결과에 만족한 듯 자주 웃음을 지으며 1시간동안 인터뷰에 응했다. 넥스트저널리즘스쿨은 <블로터>·<한겨레21>·구글코리아가 미래 언론인에게 디지털 미디어로 가는 길을 소개하기 위해 지난 1월 연 아카데미다. 이 기사는 제2기 넥스트저널리즘스쿨 수강생인 김혜인·이민경 씨가 작성했다. 기사는 블로터와 한겨레21에 공동 게재했다. <편집자주>
데미스 허사비스(demis_hassabis) 구글 딥마인드 CEO.

데미스 허사비스(demis_hassabis) 구글 딥마인드 CEO.

태초에 인공지능에 대한 시도는 많았으나 연산능력 그 이상을 넘어서지 못하였느니라. 데이터 응용력에 지체 현상이 나타났고 빅데이터를 심히 버거워하니라. 이에 인공지능에 대한 기술이 해박한 허사비스가 등장하니 ‘딥러닝’을 꺼내어 알고리즘계에 큰 빛을 비추니라. 허사비스가 살펴보시기에 ‘학습 알고리즘’을 적용할 게임엔 무엇이 존재하느냐 묻더니 ‘직관적인 알고리즘’을 사용하는 바둑에 눈길이 머무르시니라. 대상을 바둑으로 정하니라. 허사비스가 가라사대 우리의 신경망을 따라 우리의 모양대로 우리가 알파고를 만들고…. 어라? 바둑판을 엎을 위험이 있어 다시. 우리의 신경망을 따라 우리의 지능과 가장 비슷하게 알파고를 만들고 세상에 나타나게 하시니라.

제 1국. 알파고는 기계답게 정직했을 뿐이다

세계 최강의 바둑기사 이세돌 9단을 꺾은 알파고. 그 알파고의 창조주 딥마인드의 최고경영자(CEO) 데미스 허사비스를 3월10일 서울 광화문 포시즌호텔에서 만났다. 전날 끝난 제 1국 승리에 대한 소감을 묻자 그는 웃으며 “꽤 지치는데요”라고 첫마디를 꺼냈다. 자식의 프로 데뷔를 긴장 속에 지켜본 부모의 마음이 느껴졌다. 첫 경기가 치러지기 전 대다수 프로바둑기사들은 이세돌 9단의 우위를 단언했다. 그러나 불과 몇 시간 새, 인터넷 공간에는 알파고의 승리와 더불어 인간들의 탄식이 여기저기서 터져 나왔다.


허사비스는 이런 한국시민들의 반응에 의아함을 드러냈다. 허사비스의 딥마인드 팀은 지난 4~5개월 동안 열심히 알파고를 가르치고 훈련시켰기 때문이다. 알파고는 기계 특유의 정직함을 내세워 1천여년 간의 바둑을 군소리 없이 ‘열공’했다.

알파고가 대국 중 여러 번 둔 변칙적인 수에 프로기사들은 ‘인간이라면 둘 수 없는 수’라며 절반은 당황, 절반은 의심했다. 1국이 알파고의 승리로 막을 내리자 이번엔 그 ‘실수’가 사실 계획된 것이었다는 의견도 소셜네트워크(SNS)상에서 호응을 얻었다.

이런 ‘음모론’에 대해 허사비스는 이렇게 대답했다. “사실 나는 아마추어 레벨의 바둑기사이기 때문에 잘은 모르겠다. 그런데 알파고는 ‘몇 점 차로 이기는 지’에 관해서는 연연하지 않는 아이다. 왜냐면 오직 ‘이길 확률이 높다’, ‘이길 확률이 낮다’의 기준으로만 판단하기 때문이다. 그 애가 판단했을 때 ‘이 자리에 두면 이길 확률이 높겠군’이라고 생각하면 그저 그 곳에 둘 뿐인 거다.” 인간 사이의 경기에서는 상대의 뒤통수를 때리는 전략이 카타르시스를 주는 걸 기대할 수 있다. 그런데 알파고는 너무 정직한 인공지능이었던 셈이다.

시간의 활용 면에서 알파고는 이세돌 9단보다 더 다이내믹하면서도 여유로운 모습을 보여줬다. 제1국에서는 쓸수 있는 시간 가운데 단 5분을 남기고 모두 사용한 알파고와 다르게 이 9단은 시간이 꽤 많이 남았다. 지난 판후이와 경기 때는 알파고가 단조롭게 모든 수에서 같은 시간을 사용해 돌을 두었다. (아직도 알파고가 그런 ‘매력없는’ 인공지능인 줄 아는 사람이 있다!) 허사비스가 이번 대국을 앞두고 알파고에게 학습시킨 것 가운데 가장 눈에 띌 만한 것이 시간관리 능력이다. 알파고는 이제 장고를 둘 줄도 알고, 눈 깜짝할 새에 수를 두기도 한다.

제2국. 알파고는 스타포인트를 좋아해

demis_hassabis_3

데미스 허사비스 구글 딥마인드 CEO.

1국에서 이 9단이 흑돌을 잡았다. 이 9단이 첫 수를 두면 그에 알파고가 반응한다. 여기서 궁금한 것 하나. 알파고는 항상 최적의 수를 찾는다. 그렇다면 흑돌을 선택한 알파고가 두는 첫 수는 언제나 같은 곳이 아닐까? 정답은 ‘그렇다’이다. “알파고는 스타포인트(Star-point)를 좋아한다.”(웃음) 스타포인트란 우리말로 ‘화점’을 뜻한다. 바둑판 위에는 총 9개의 화점이 있다. 항상 첫 수는 이 화점들 중에 있다.(10일 2국에서 흑을 선택한 알파고는 우측 귀퉁이 화점에 첫 수를 두었다)

그러나 첫 수를 제외하고, 비슷한 상황에 직면할 경우 알파고는 항상 다른 선택을 할 가능성이 높다. 왜냐하면 알파고의 의사결정 과정인 ‘몬테카를로 트리 탐색'(Monte Carlo Tree search)에는 무작위성이 알고리즘화돼 있기 때문이다.

두 번째 궁금한 것은 그럼 ‘알파고에게 로봇 팔 하나쯤 만들어주면 어땠을까’이다. 천문학적인 경우의 수를 따져가며 바둑을 두는 알파고에게 스스로 바둑알을 집어 내려놓게 할 수 있는 팔 하나 달아주는 게 그리 어렵게 생각되진 않으니까. 하지만 우리 낙관과 달리 인공지능에게 복잡한 연산은 ‘식은 죽 먹기’인 반면 종이를 접거나 머리를 손질하는 감각운동은 정말 어려운 일이라고 한다. 허사비스는 “로봇 팔이 바둑판을 엉망으로 만들지 않고 아주 얌전하게 바둑알을 내려놓도록 만드는 건 정말 어려운 일이다. 이런 감각운동 능력은 수백만 년 동안 진화를 통해 인류와 동물에게 선사된 것이다. 더욱이 이런 능력이 이미 탑재된 상태에서 인류와 동물이 태어나니 원리를 알기도 힘들다”고 말했다.

세 번째 궁금한 것. 알파고와 이세돌 9단의 경기가 온 뉴스를 차지했다. 뉴스에서 자주 보이는 설명 가운데 “알파고의 딥러닝은 이전의 인공지능에 비해 범용성이 강화됐다”가 있다. 솔직히 무슨 말인지 잘 모르겠다. 설명해 달라는 요청에 “딥러닝이란 것은 신경망이 여러 층으로 존재하는 것을 말한다. 우리가 ‘deep’이라는 단어를 쓰는 이유는 레이어(신경망 층)의 수가 많아지면 많아질수록 더 심층적인(복잡한) 기능을 수행 할 수 있기 때문이다. ‘범용성’이란 것은 어떤 인풋을 넣는가에 따라서, 예컨대 이미지, 음성, 번역 등이 섞여 다양한 결과물을 만들어 낼 수 있는 것처럼 두루 활용성이 높아짐을 의미한다”는 답이 돌아왔다.

이런 범용성을 아직 가까이서 접하지 못했기에 믿지 못하는 분들도 있다. 알파고라는 인공지능이 단지 바둑만을 두기 위해 연구되는 것이 아니다. 허사비스는 “생각보다 많은 분들이 아주 (바둑에) 국한돼 있다고 말하는 것에 놀라고 있다. 알파고에서 가장 강조하고 있는 것이 범용성이기 때문이다. 실제로 우리 팀은 ‘딥강화학습’을 통해서 화면에 있는 픽셀만으로 아타리 게임을 할 수 있다는 것을 학습했다. 이 대국 이후에 차세대 알파고 버전은 여러 게임을 할 수 있는 것들을 보여드릴 수 있을 것 같다”고 말했다.

제3국. 허사비스와 바둑의 운명적 만남

hassabis_4

데미스 허사비스(demis_hassabis) 구글 딥마인드 CEO.

허사비스, 그는 어쩌다 옛 연인인 체스를 버리고 새 연인 바둑에 관심을 두게 됐을까. 체스를 굉장히 좋아해 어린 시절 체스 세계랭킹 2위를 차지했던 그였다. 하지만 20년 전 딥블루를 통해 컴퓨터의 뛰어남이 증명된 체스는 그에게 도전정신을 주지 못했다. “체스는 솔루션을 프로그래밍 할 수 있다. 하지만 우리는 ‘학습 알고리즘’에 관심이 많기 때문에 체스는 그만큼 흥미가 있지 않았다.”

한국, 중국, 일본 즉 동양에서만 두는 바둑과의 설레는 첫 만남은 언제였는지 물었다. “캠브리지대학 시절에 바둑을 배우게 됐다. 동문이자 알파고 게임 책임자인 데이비드 실버에게 바둑을 가르쳐주기도 했다. 당시 우리가 바둑을 컴퓨터로 두게 되면 어떻게 될까 하는 고민을 했다. 당시를 회상하면 20년 만에 알파고를 통해 우리의 꿈을 실현하게 된 것이다.”

블로터 플러스 '지식 아카이브'


컨퍼런스인간의 뇌에 도전하는 데이터과학, 딥러닝


김정희

네이버랩스 수석연구원

바둑은 아름답고 우아하다고 극찬하는 허사비스는 바둑의 어떤 매력에 빠진 것일까. 직관력! 그는 바둑이 인공지능이 도전하기 어려운 영역으로 직관력을 뽑았다. 상대의 마음을 잡는 게 어려울수록 소유욕이 강해진다고 했던가. 컴퓨터가 기존에 가지지 못한 직관력을 알고리즘을 통해 극복해야겠다는 것이 허사비스가 알파고를 만들게 된 이유이다.

허사비스의 손에 의해 탄생한 알파고는 직관력을 포함해 강점을 하나 더 가지고 태어났다. 제1국에서 알파고가 승리한 이유로 꼽히는 ‘흔들리지 않는 감정’이었다. 감정이 드러나는 법도, 지치는 법도 없는 알파고는 시간도 기계적으로 사용했다. 바둑에 중요한 ‘기세 싸움’에서 이세돌 9단이 밀린 이유였다. “알파고의 승리 원인이 알파고가 감정이 없어서라는 의견에 동의한다. 바둑에 있어서 감정을 가미할 생각은 없지만, 다른 애플리케이션에 적용할 의향은 있다.” 간단했다. 굳이 강점을 약점으로 바꿀 필요는 없다.

제4국. 목표는 이미 달성한 알파고

next_journalism_2

지난 3월10일 서울 광화문 포시즌스 호텔에서 데미스 허사비스(demis_hassabis) 구글 딥마인드 CEO와 인터뷰를 진행한 넥스트저널리즘스쿨 수료생 이민경(좌), 김혜인씨.

인공지능에 관해 희망적인 발언을 쏟아내는 허사비스는 이번 대국을 어떻게 평가하고 있을까. 자식을 물가에 내놓는 어미의 마음을 모르는 척 접어두고선 냉정한 평가를 요구했다. 과연 알파고의 성공을 어느 정도로 볼 것인지 말이다. “일단은 1승도 아주 중요하다. 1승을 통해 우리가 알파고의 성능을 체크해 볼 수 있지 않았나 싶다. 목표는 1승이라도 하는 게 본래 목표였다.” 두 번째 대국이 시작되기 약 3시간 전, 그가 진단한 알파고의 목적은 이미 성공한 셈이었다.

두 번째 대국이 열리기 전, 알파고의 남은 대국 승률을 물어봤다. 5대5의 확률이기에 어떻게 될지 모르겠다는 겸손한 말과 함께 “지지는 않을 것이다”라는 자식에 대한 확신에 찬 말이 이어졌다. 허사비스가 대국 마지막 날에도, 그 지으신 알파고를 보시니 심히 보기 좋았더라라고 판단할지는 남은 대국들을 지켜보고 평가하자.

* 데미스 허사비스와 넥스트저널리즘스쿨 Q&A
demis_hassabis_2
데미스 허사비스 구글 딥마인드 CEO.
 
– 1국에 대해서 어떻게 생각하나.
“꽤 지친다(웃음). 흥미진진하면서도 안도감이 든다. 우리 팀과 알파고가 경기한 과정에 대해서 자랑스럽게 생각한다. 너무나 아름다운 대국이 아니었나 생각한다.”
– 한국 사람들은 대부분 어제 대국에서 이세돌이 이길 것이라고 예측했는데, 알파고를 만든 창조주 입장에서 알파고라는 자식이 좋은 경기와 더불어 승리한 것에 대해 어떻게 생각하는가.
“매우 자랑스럽다. 대부분의 프로 바둑기사들이 쉽게 이세돌 기사가 승리할 것이라 예측했는데, 우리도 지난 4~5개월간 알파고를 가르치는 데 매우 열심히 임했다.”
– 방금 알파고를 가르쳤다고 했는데, 이미 나온 기사들을 토대로 공부해보니 알파고는 ‘셀프러닝’(self-learning), ‘딥러닝’(deep-learning) 등 스스로 학습하는 ’강화학습’을 한다고 한다. 그것이 말하는 것은 개발자들이 바둑 기보 등을 알파고에 입력하면 알파고가 체화하는 것을 뜻하는가.
“대부분이 자가로 학습하는 것이 맞다. 그러나 우리가 관리 감독하는 부분도 없진 않다. 예를 들어서 알고리즘을 조금 더 개선한다든지 더 큰 신경망을 차용을 한다든지. 그리고 또 한 가지 새로운 점은 시간 관리를 할 수 있도록 학습시킨 것이다. 알파고가 판후이와 대국할 때는 모든 한 수를 둘 때마다 같은 시간을 사용했다면, 이번에는 역동적으로 조금 더 생각할 시간이 필요하면 좀 더 길게 시간을 썼다.”
– 시간 사용에 관련된 질문을 더하자면, 이번에 1국에서 이세돌 9단은 대국 중에 알파고보다 더 적은 시간을 사용했다. 이에 대해서 어떻게 생각하나.
“사실 꽤 놀랐다. 알파고가 시간을 적절하게 효율적으로 사용했다고 생각한다. 알파고는 5분 남겨두고 끝났는데 (알파고는 가용시간을 거의 다 썼다) 이세돌 9단은 시간이 꽤 남아서 놀랐다.”
– 어제 경기에서 알파고가 대국 중 몇 번의 ‘실수’를 했다고 관전평이 나왔는데, 일부에서는 이 ‘실수’가 계획된 실수라고 한다. 진짜 실수인지 아닌지에 대해서 의견이 분분하다. 무엇인가.
“(웃음) 나는 아마추어 레벨의 바둑기사이기 때문에 정확히는 모르겠다. 하지만 알파고는 몇 점 차로 이기는지는 상관하지 않는다. 오직 이기기만 하면 된다는 주의로 사고한다. 즉 알파고는 ‘내가 이렇게 두면 확실하게 승리할 확률이 높다’고 판단이 나면 그 자리에 포석을 하는 것이다. 이 점이 인간간의 대국과 다른 점이라 볼 수 있다.”
– 알파고는 항상 최적의 수를 둔다고 하는데, 1국에서는 이세돌 9단이 흑을 집어서 첫 수를 두었지만 만약 알파고가 다음 대국들에서 흑돌을 잡을 경우 항상 첫 수를 같은 곳에 둘까.
“좋은 질문이다. 그런데 트리서치(알파고 의사결정체계)에는 무작위성이 알고리즘에 들어가 있기 때문에, 비슷한 상황이 연출된다 할지라도 매번 게임에서 다른 곳에 포석을 할 것이다.”
– 첫 수일지라도?
“첫 수는 보통 항상 같을 것이다. 알파고는 주로 스타포인트(화점)에 둘 것이고, 알파고는 스타포인트를 좋아한다.(웃음)”
– 체스는 전세계적으로 두는 게임이고, 바둑은 동아시아에서 많이 두는 게임인데 왜 바둑을 선택했나.
“나도 어렸을 때 체스기사였다. 물론 체스를 사랑하지만 컴퓨터, 딥블루가 체스 챔피언을 이긴 것이 벌써 한참 전이다. 즉, 체스는 솔루션을 프로그래밍 할 수 있다. 우리는 ‘학습 알고리즘’에 관심을 두고 있는데 체스는 그 관심에 상응하는 흥미를 유발하지 않는다. 또한 나는 성장하면서 체스 외에 다른 게임들도 배웠는데, 그 중 하나가 바둑이었다. 케임브리지에서 공부할 때 데이비드 실버에게 바둑을 가르치다가 얘기가 나온 것이 바둑을 컴퓨터에 가르쳐보면 어떨까 하는 생각이었다. 바둑은 직관적인 게임이기 때문에 흥미로웠다. 컴퓨터는 직관적인 것에 약하기 때문에 직관적인 알고리즘이 필요하지 않을까라는 생각을 한 것이다. 또한 나는 시간이 지나면서 바둑에 점점 더 애정을 가지게 됐고, 바둑은 매우 아름답고 우아한 게임이라고 생각한다. 지금 알파고가 바둑경기를 벌이고 있는 이 상황은 우리에게 있어서 20년 간의 꿈을 이룬 것과 같다. 그리고 체스가 더 글로벌할지라도 서구에서 체스가 누리는 인기와 비교했을 때, 바둑이 동아시아에서 사람들에게 좀 더 많은 지속적인 관심과 사랑을 받는 게임인 것 같다. 특히 지금 한국의 전 국민이 이 경기에 큰 관심을 갖고 지켜본다는 것이 그 증거인 것 같다.”
– 직관이라고 하니, 한 가지 직관과 관련한 질문을 더 드리겠다. 어떻게 보면 알파고는 감정에 흔들릴 염려가 없기에 직관에 더 유리하게 반응하지 않았나 생각이 든다. 앞으로 인공지능에게 감정을 개발할 가능성이 있는지 궁금하다.
“정확한 지적이다. 어제 해설자분들도 알파고가 감정에 흔들리지 않았기 때문에 최선을 다해서 이길 수 있었다고 말했다. 따라서 그게 강점이기 때문에 바둑에 있어서는 감정을 가질 수 있는 인공지능을 연구할 가능성은 거의 없다. 하지만 다른 분야에 있어서는 감성적인 부분이 필요한 부분이 있을테니 그에 따른 연구는 진행하고 있다.”
– 감각운동에 대해서 물어보고 싶다. 모라벡의 역설(Moravec’s paradox)에 따르면, 인공지능은 굉장히 복잡한 고도의 연산은 쉽게 하지만 반면 머리를 손질한다든가 잔디를 깎는 등의 사람이 일상적으로 하는 감각운동은 어렵다. 이번에 알파고는 사람이 대리인으로 나와 돌을 놓았는데, 알파고가 스스로 팔을 갖지 못한 이유가 이런 어려움 때문인가.
“맞다(웃음). 로봇의 팔을 만드는 것이 더 어렵다. 그 로봇 팔이 전체 판을 엉망으로 만들지 않고 아주 얌전하게 돌을 놓게 하는 것은 매우 어려운 과제다. 이 역설이란 사실 진화가 인류와 동물에게 수억년 간의 시간 동안 선사한 감각운동 능력에서 비롯한다. 감각운동이나 이런 것들은 내재적으로 탑재된 상태로 태어나기 때문에 어떻게 일어나는지에 대해서는 누구도 잘 알지 못한다. 그래서 적용이 어렵다. 그리고 사실 인간이 움직일 때 대부분은 무의식으로 일어나고 뇌에서 이것이 얼마나 복잡한 것인지는 모르고 움직이는 것이기에 굳이 ‘역설’이라 불러야 할까란 생각을 하기도 한다.”
– 딥러닝이 그 이전 버전에 비해서 범용성이 더 크다고 들었는데, 구체적으로 어떤 사례들이 있는지 궁금하다.
“딥러닝이란 것은 신경망이 여러 층으로 존재하는 것을 말한다. 우리가 ‘deep’이라는 단어를 쓰는 이유는 레이어(신경망 층)의 수가 많아지면 많아질수록 더 심층적인(복잡한) 기능을 수행 할 수 있기 때문이다. 그래서 범용이라고 나오는 이유는 어떤 인풋을 넣는가에 따라서 이미지, 음성, 번역 등이 섞여 다양한 결과물을 만들어 낼 수 있기 때문에 두루 활용성이 높아진다는 걸 의미한다.”


데미스 허사비스 구글 딥마인드 CEO.(사진 : 구글코리아 제공)
데미스 허사비스 구글 딥마인드 CEO.(사진 : 구글코리아 제공)
– 알고리즘에 대한 이야기를 하겠다. 제가 주목하는 쪽은 강화학습 알고리즘에 대한 문제다. 이번에 이세돌 9단과의 대국을 통해서 저는 오히려 딥마인드의 기술력은 강화학습 면에서 조금 더 빛이 나지 않았나 싶다. 예전에 스티븐 레비와 인터뷰 할 때도 그 강화학습이 딥러닝만큼이나 중요하다고 했는데, AGI(범용인공지능)를 만들어 가실 때 이번에 이세돌 9단과의 대국에서 만들어진 강화학습의 알고리즘 노하우가 AGI를 만들 때 어떤 정도의 기여를 하는 지 궁금하다.
“좋은 질문이다. 지금 말한 것처럼 강화학습이 딥러닝만큼이나 중요한 것이 맞다. 저희가 물론 딥러닝 쪽에 세계 일류의 팀을 만들어 놓고 있지만, 제가 생각하기에는 강화학습이라는 것은 저희만이 가진 특화된 분야라고 생각한다. 저희가 하고 있는 것은 딥러닝과 강화학습을 통합한 것이다. 통합한 것을 ‘딥강화학습’이라 부르고 있다. 저희가 에이전트 기반의 시스템에 관심이 많기 때문에 이 두 가지가 중요하게 되는데, 이 두 가지가 중요한 이유는 패턴을 인식하는 인풋을 프로세싱할 수 있으면서도 강화학습, 그러니까 그 다음 어떤 액션을 취할 것인가를 알 수 있는 강화학습, 이 두 가지가 에이전트에 필요하기 때문이다. 패턴을 인식할 수 있어야 하고 의사결정을 내리는 것, 이 두 가지가 중요하다.”
– 딥러닝을 조금 이해한 이들은 이세돌과의 바둑대결에 대해 그냥 여기서 만들어진 알고리즘은 바둑을 위해서만 쓰일 것이다. 다시 말해 약한 인공지능이라고 사고한다. 하지만 현재 여기서 만들어지는 알고리즘 노하우들이 오히려 다른 분야, 다른 게임, 다른 일상적인 의료 등에 쓰일 수 있는 것인지 궁금하다.
“일단은 많은 분들이 아주 국한돼 있다고 말하는 것에 놀라고 있다. 저희 알파고에서 가장 강조하고 있는 것이 범용성이기 때문이다. 그래서 지금 딥강화학습을 통해서 화면에 있는 픽셀만으로 아타리 게임을 할 수 있다는 것을 학습했다. 이 대국 이후에 차세대 알파고 버전은 여러 게임을 할 수 있는 것들을 보여드릴 수 있지 않을까 싶다.”
– 이 대국을 통해서 어느 정도를 성공이라고 칭할 것인지가 궁금하다. 몇 승, 이 정도가 아니라 어떤 면을 보는지.
“일단은 1승도 아주 중요한 것 같다. 이 1승을 통해서 우리가 알파고의 성능을 체크해볼 수 있지 않았나 싶다. 물론 저희가 끝났을 때 알파고가 승리하지 못하면 저희가 실망하겠지만 저희의 목표는 1승이라도 하는 것이었다.”
– 차세대 버전에 대해 얘기했다. 한국의 젊은이들은 사실 바둑보다 ‘스타크래프트’ 게임에 관심이 더 많다. ‘스타크래프트’ 게이머인 홍진호 씨도 그렇고, 이 게임을 좋아하는 이들은 ‘스타크래프트’에서는 인공지능이 인간을 이기지 못할 것이라고 한다. 차세대 버전에서 도전할 게임은 무엇인가.
“아직 어떤 것을 할지는 계획이 없다. 나도 ‘스타크래프트’를 좋아한다. 개인적으로 흥미를 갖고 있는 온라인 전략게임에 도전해보면 재밌을 것 같다는 하긴 했다. 구체적으로 계획이 있는 단계는 아니다.”


  

  



김혜인

h4543777@naver.com

넥스트저널리즘스쿨 2기 수료생입니다.


이민경

ispiritever@gmail.com

넥스트저널리즘스쿨 2기 수료생입니다.

관련기사

이세돌과 대국으로 '알파고' 설계자가 꿈꾸는 것은?

이세돌-알파고 대국, 20문 20답

[IT열쇳말] 알파고




[IT열쇳말] 알파고

  

기계가 인간을 뛰어넘을 수 있을까. 또 인간은 기계의 도전을 막아낼 수 있을까. 기계와 인간의 역사적인 대결이 예고됐다. 바둑 챔피언 이세돌 9단과 구글 딥마인드의 인공지능 바둑 프로그램 ‘알파고(AlphaGo)’의 대국이 오는 3월 열린다. 경기의 결과 앞에 인류의 역사는 두 개의 갈림길과 만난다. 기계가 인간을 뛰어넘어 새로운 ‘생각하는 존재’로 기록되거나. 인간을 뛰어넘는 기계의 등장이 지금이 아닌 미래로 잠시 유보되거나. 과학자뿐만 아니라 전세계인들의 눈과 귀가 3월 한국의 서울을 주목하고 있다.

▲바둑 챔피언 이세돌 9단과 구글 딥마인드의 인공지능 바둑 프로그램 ‘알파고’의 대국이 오는 3월 한국에서 열린다.(출처 : 네이처 유튜브 동영상)

▲바둑 챔피언 이세돌 9단과 구글 딥마인드의 인공지능 바둑 프로그램 ‘알파고’의 대국이 오는 3월 한국에서 열린다.(출처 : 네이처 유튜브 동영상)

컴퓨터엔 너무 어려웠던 바둑의 세계

이세돌 9단과 알파고의 대결은 알파고의 앞선 승리 덕분에 이뤄지게 됐다. 알파고는 구글이 소유한 인공지능 기술 개발업체 딥마인드가 창조해낸 인공지능 바둑 시스템이다. 딥마인드는 2010년 영국에서 설립됐다. 구글이 딥마인드를 인수한 시점은 2014년 1월이다. 딥마인드가 구글에 인수된 이후인 2015년 10월에는 유럽의 바둑 챔피언 판 후이(Fan Hui) 2단을 상대로 공식 대국에서 승리했다. 5번 진행된 대국 모두 알파고의 승리로 끝났다. 사람이 만든 인공지능 시스템이 프로 바둑 기사를 능가하는 실력을 갖추게 됐음을 현격한 실력 차이로 입증한 셈이다.



지금까지 바둑은 컴퓨터 인공지능이 도전하기엔 너무 어려운 게임이었다. 체스는 이미 지난 1997년 인간이 컴퓨터에 정복당한 영역 중 하나다. IBM이 개발한 슈퍼컴퓨터 ‘딥블루’가 체스 세계 챔피언 가리 카스파로프를 꺾은 것이 기준점이다. 인공지능이 체스로 인간을 정복한 이후 20여년이 지나는 동안에도 바둑은 여전히 컴퓨터에 미지의 영역으로 남아 있었다.

▲바둑의 경우의 수는 체스와 비교할 수 없을 정도로 방대하다.(출처 : 딥마인드 유튜브 동영상)

▲바둑의 경우의 수는 체스와 비교할 수 없을 정도로 방대하다.(출처 : 딥마인드 유튜브 동영상)

체스와 달리 바둑이 인공지능의 도전 과제로 남아있을 수 있었던 까닭은 바로 복잡성이다. 바둑의 규칙은 매우 간단하다. 바둑판 위 흰 돌과 검은 돌을 번갈아 놓으며 상대편의 돌을 들어내거나 공간을 둘러싸 ‘집’을 만드는 것이 목표다. 하지만 컴퓨터가 고려해야 하는 경우의 수는 체스와 비교해 기하급수적으로 늘어난다. 체스는 말을 움직이는 방법이 정해져 있지만, 바둑은 자유롭게 돌을 놓는 방식이기 때문이다. 또, 체스와 비교해 바둑은 게임의 판이 더 크다. 바둑 경기의 경우의 수는 10의 170 제곱에 이른다. 이를 숫자로 풀면 1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000이나 될 정도로 막대한 숫자다. 이는 우주에 있는 원자의 수보다 큰 숫자다. 체스와 비교할 때 경우의 수가 10의 100 제곱 이상 많은 것이기도 하다.


알파고는 프로 바둑기사를 어떻게 이겼을까

딥마인드는 알파고 시스템을 구축하는 과정에서 ‘트리탐색(Tree Search)’ 기술을 이용하는 대신 ‘몬테카를로트리탐색(MCTS)’ 기술과 ‘심층신경망(Deep Neural Network)’ 기술을 결합해 활용하도록 설계했다. 몬테카를로트리서치는 선택지 중 가장 유리한 선택을 하도록 돕는 알고리즘이다. 예를 들어 알파고가 검은 돌로 대국을 벌인다고 가정할 때, 흰 돌이 어디에 위치하느냐에 따라 검은 돌을 두는 알파고의 선택이 달라지도록 한다는 의미다. 이 같은 최적의 선택이 반복될수록 대국은 유리하게 풀린다.

▲몬테카를로트리서치 알고리즘(출처 : Mastering the game of Go with deep neural networks and tree search - Nature, 2016)

▲몬테카를로트리서치 알고리즘(출처 : Mastering the game of Go with deep neural networks and tree search – Nature, 2016)

블로터 플러스 '지식 아카이브'


북한국 에듀테크 스타트업 30

구체적으로 알파고가 바둑돌을 놓을 위치를 정하는 알고리즘은 ‘정책망(policy network)’이라는 이름이 붙여진 신경망과 ‘가치망(value network)’이라고 부르는 또 다른 신경망의 결합에 의해 이루어진다. 정책망은 다음에 돌을 어디에 둘지 선택하는 알고리즘이고, 가치망은 승자를 예측하는 역할을 한다. 말하자면, 알파고의 바둑 대국은 머신러닝으로 훈련된 정책망과 가치망의 결합이 몬테카를로트리리서치 알고리즘을 통해 발현되는 것이다.

알파고의 머신러닝 훈련 첫 단계는 ‘정책망 지도학습(Supervised learning of policy networks)’이다. 바둑기사가 그러하듯 바둑돌의 다음 위치를 예측하도록 훈련하는 과정이다. 딥마인드는 총 13개의 레이어로 구성된 정책망을 디자인하고, KGS 바둑 서버에 등록된 3천만개의 바둑돌 위치 정보를 바탕으로 훈련시켰다. 이 같은 과정을 통해 과거 44% 수준에 머물던 인공지능의 예측 확률을 57%까지 끌어올릴 수 있었다는 게 딥마인드의 설명이다.

▲알파고의 알고리즘은 정책망 강화학습으로 고도화된다.(출처 : Mastering the game of Go with deep neural networks and tree search - Nature, 2016)

▲알파고의 알고리즘은 정책망 강화학습으로 고도화된다.(출처 : Mastering the game of Go with deep neural networks and tree search – Nature, 2016)

알파고 훈련의 두 번째 단계는 ‘정책망 강화학습(Reinforcement learning of policy networks)’이다. 말 그대로 강화학습을 통해 정책망의 성능을 개선하는 단계다. 딥마인드는 현재의 정책망과 무작위로 선택된 정책망 사이의 무수한 반복 대결을 통해 알파고를 학습하도록 했다. 현재의 플레이어 관점에서 시스템이 대국에서 이기면 보상을 받고(+1), 지면 보상을 잃는(-1) 방식으로 정책망 강화학습이 진행됐다. 딥마인드는 이 같은 과정을 통해 강화학습 정책망이 강화학습 이전의 지도학습 정책망과 비교해 80% 더 많은 대국에서 이길 수 있게 됐다고 설명한다.

마지막 단계는 ‘가치망 강화학습(Reinforcement learning of value networks)’이다. 바둑돌의 위치 평가를 바탕으로 결과를 예측하는 것을 강화하는 단계다. 3천만개가 넘는 위치 정보를 바탕으로 ‘셀프 대국’을 벌여 가치망의 분석 능력을 업그레이드했다.

▲알파고와 판 후이 2단, 이밖에 크레이지스톤, 젠, 파치 등 바둑 소프트웨어의 비교(출처 : Mastering the game of Go with deep neural networks and tree search - Nature, 2016)

▲알파고와 판 후이 2단, 이밖에 크레이지스톤, 젠, 파치 등 바둑 소프트웨어의 비교(출처 : Mastering the game of Go with deep neural networks and tree search – Nature, 2016)

알파고 “준비는 끝났다”

딥마인드는 다양한 바둑 소프트웨어와 대국을 벌여 꾸준히 알파고의 실력을 검증했다. 현재 가장 강력하다고 알려진 상업용 바둑 소프트웨어 ‘크레이지 스톤(Crazystone)’과 ‘젠(Zen)’을 포함해 오픈소스 바둑 프로그램 ‘파치(Pachi)’와 ‘푸에고(Fuego)’ 등이 알파고의 연습 대국 토너먼트 상대가 됐다.

결과가 놀랍다. 딥마인드의 알파고는 총 495회 바둑 소프트웨어와 대국을 벌여 딱 한 번을 패배하고 494개 대국에서 승리를 거머쥐었다. 승률로 따지면 99.8% 수준이다. 알파고가 기존의 다른 바둑 소프트웨어와 비교해 몇 단이나 높은 실력을 갖추고 있다는 게 딥마인드의 자체 평가다.

▲판 후이 2단과 알파고의 대결. 알파고는 5판 모두 승리했다.(출처 : 딥마인드 유튜브 동영상)

▲판 후이 2단과 알파고의 대결. 알파고는 5판 모두 승리했다.(출처 : 딥마인드 유튜브 동영상)

셀프 대국을 포함한 알파고의 이 같은 반복 훈련은 2015년 10월5일부터 9일까지 열린 판 후이 2단과의 대국에서 전 대국 승리라는 최초이자 기념비적인 승리를 거머쥐는 데 주효하게 작용했다. 사람이 1년에 1천번 바둑을 둔다고 가정할 때, 1년에 해당하는 횟수의 대국을 지금도 치르는 중이다.

이제 남은 것은 지난 10여년 동안 바둑 최강자 자리를 지켜 온 이세돌 9단과의 승부다. 이세돌 9단과 알파고의 대결 역시 5판으로 이루어진다. 이세돌 9단의 자신감은 대단하다. 이세돌 9단의 말처럼 “3분에서 5분 이하로 고민”했을 정도로 이세돌 9단은 승리를 자신하고 있다. 12억원 상금을 건 이세돌 9단과 알파고의 대국은 인공지능이 인류의 지능에 어느 정도 수준까지 접근했는지를 가늠할 지적 축제이자, 컴퓨터에 대항하는 인간의 자존심을 건 승부가 됐다. 알파고와 이세돌 9단의 대국은 3월9일부터 15일까지 서울에서 열린다.

▲판 후이 2단과 알파고의 바둑 기보(출처 : Mastering the game of Go with deep neural networks and tree search - Nature, 2016)

▲판 후이 2단과 알파고의 바둑 기보(출처 : Mastering the game of Go with deep neural networks and tree search – Nature, 2016)

※ 참고자료

– Mastering the game of Go with deep neural networks and tree search, D Silver, A Huang, CJ Maddison, A Guea, L Sifre… – Nature, 2016 – Nature.com

이 글은 ‘네이버캐스트→테크놀로지월드→용어로 보는 IT’에도 게재됐습니다. ☞‘네이버캐스트’ 보기

글쓴이


오원석

sideway@bloter.net

기술을 이야기하지만, 사람을 생각합니다. [트위터] @Sideway_s, [페이스북] facebook.com/sideways86, [구글+] gplus.to/sideway [e메일] sideway@bloter.net

 

발행일

2016.02.18

태그

구글 딥러닝 딥마인드 바둑 알파고 이세돌 인공지능 판후이

  

관련기사

[IT열쇳말] 클라우드 IDE

이세돌·구글 바둑 대국, 3월9~15일 개최

[IT열쇳말] 디지털 노마드

[IT열쇳말] 딥러닝과 기계번역



[IT열쇳말] 딥러닝과 기계번역


딥러닝과 번역기, 상관관계는?

공간을 가리지 않는 웹이 보편화하면서 번역도 무척 중요해지고 있다. 어느 나라에나 사용자가 있고, 해당 국가의 언어로 작성된 정보가 있다. 좋은 번역 서비스는 언어가 달라서 생기는 제한을 해결한다. 좋은 번역 서비스가 있다면 사용자의 경험도 폭넓게 증대된다. 영어로 된 좋은 자료를 큰 힘 들이지 않고 읽을 수 있고, 중국의 쇼핑몰 사이트에서도 쉽게 물건을 구매할 수 있다.

컴퓨터가 수행하는 번역 작업을 ‘기계번역’이라고 한다. 기계번역은 컴퓨터가 입력된 하나의 언어를 다른 언어로 바꿔서 출력한다는 걸 뜻한다. 초기에는 규칙 기반 기계번역(Rule-based Machine Translation)이나 예제 기반 기계번역(Example-based Machine Translation)이 주를 이뤘지만, 현재는 통계기반 기계번역이 주류다. 최근에는 인공신경망 기계번역도 주목 받고 있다.

통계기반 기계번역과 인공신경망 기계번역은 딥러닝을 활용한다. 사람은 학습 데이터를 수집하고 가공해서 컴퓨터에 던져주고, 컴퓨터는 입력된 학습 데이터를 바탕으로 스스로 공부한다. 학습이 끝나면 번역기가 스스로 공부한 바를 바탕으로 새로운 문장을 보더라도 번역할 수 있는 능력을 키울 수 있다.

학습 데이터란 컴퓨터가 보고 공부할 수 있는 자료를 말한다. 일반적으로 최소 300만 문장은 있어야 제대로 된 학습이 가능하다고 이야기된다. 번역기에 필요한 학습 데이터는 번역 전과 후가 쌍으로 존재하는 데이터다. 학습 데이터는 다양한 방식으로 얻을 수 있다. 우선 전문 번역 업체에 의뢰하는 방법이다. 사전의 예문도 길진 않지만 깔끔한 번역이다. 번역 서비스를 운용하는 사이트의 성격에 따라서 얻을 방법이 몇 가지 더 있을 수 있다. 예컨대 네이버는 ‘지식iN’도 활용한다. 어학·외국어 부분에 사용자들이 올린 번역 관련 질문과 답변을 분석하고 정제해서 학습 데이터로 사용할 수 있는 문장을 추출한다. 지난해부터 시작한 참여번역 서비스도 데이터를 얻는 방법의 하나다.

▲Icon made by Freepik

▲Icon made by Freepik

통계기반 기계번역

통계기반 번역(SMT, Statistical Machine Translation)은 현재 주로 사용하는 방법이다. 대규모 데이터를 기반으로 자동으로 학습된 통계적 모델을 기반으로 번역한다. 기본적으로는 단위마다 번역해서 조합하는 방식이다. 예전에는 단어 단위로 번역했지만, 구(Phrase) 형식 기반 번역으로 발전했다. 구 단위가 단어 단위보다 모호성이 낮기 때문이다. 구를 기반으로 하면 더 나은 번역 품질을 얻을 수 있다. 예컨대 이런 식이다.

eat apple = 사과를 먹다
eat banana = 바나나를 먹다
eat grape = 포도를 먹다

여기서 조금 더 발전한 방식이 ‘계층적 구 기반 방식’이다. 기존의 구 기반 방식에서 ‘eat apple = 사과를 먹다’, ‘eat banana = 바나나를 먹다’, ‘eat grape = 포도를 먹다’처럼 저장되던 것을 ‘eat X = X를 먹다’로 표현해서 훨씬 더 많은 대역관계를 나타낼 수 있게 만든다.

이렇게만 해도 한국어-일본어처럼 어순이 비슷한 언어는 일상생활에 불편함이 없을 정도로 번역할 수 있다. 하지만 한국어-영어처럼 어순이 다른 경우에는 올바른 배열 조합을 찾아야 한다. 구별로 번역은 했는데, 이걸 어떻게 조합해서 멀쩡한 문장을 만들어내는가의 문제가 남는다.

문제를 해결하기 위해서 사전 순서 변경(pre-reordering)을 거친다. 번역하고자 하는 언어의 어순과 유사하게 바꿔서 문제를 해결한다. 예컨대 ‘나는 사과를 먹는다’라는 문장이 있으면 이를 ‘나는 먹는다 사과를’로 변형한 뒤 ‘I eat apple’로 바꾼다.

▲apple, Nik, flickr, CC BY-SA.

▲apple, Nik, flickr, CC BY-SA.

인공신경망 기계번역

더 읽어보세요!


네이버 번역기, 어디까지 왔니?

NMT(Neural Machine Translation)는 인공 신경망 기계번역을 뜻한다. 단순하게 이야기하자면 문장 전체를 넣어서 번역하는 방식이다. 핵심은 단어 표현, 즉 워드 임베딩(word embedding)이다. 단어 표현이란 하나의 단어를 인공 신경망을 이용하여 벡터 공간상에 나타낼 수 있는 변환된 값을 의미한다.

예를 들면 이렇다. 입체의 공간이 있다고 가정하자. 먼저 ‘먹다’라는 단어를 공간에 띄운다. 그리고 그 근처에 ‘먹었다’, ‘먹을 거다’, ‘먹고 싶다’ 등 ‘먹다’라는 단어와 관계가 있는 단어들을 유사한 공간에 둔다. 이 ‘먹다’라는 단어에는 다양한 차원이 있을 수 있다. 이 차원에 따라 또 다른 단어들과 관계를 맺을 수 있다. 예컨대 치킨, 피자, 케이크 등 ‘먹다’와 함께 쓰일 수 있는 단어들이 또 ‘먹다’와 나름의 관계를 맺고 공간상에 위치할 수 있다. 이렇게 단어나 구 등이 공간에서 관계를 맺으며 매핑된다. 이때 가지는 벡터값을 ‘단어 표현’이라고 한다. 번역기에 사용되는 단어는 200차원의 단어 표현값으로 변환된다.

단어 표현의 기본 개념을 가지고 인공신경망 기계번역 방식을 확인하기 위해 다음 그림을 보자.

navertranslator-800x420


‘나는’, ‘사과를’, ‘먹는다’, ‘I’, ‘eat’, ‘apple’은 각각 단어 표현값으로 변환된다. 그리고 이 단어 표현들을 이어가며 번역하려는 문장에서 결과 문장으로 이어주는 최적의 가중치(weight parameter)들을 찾아 행렬 곱으로 이어가며 벡터를 구해가는 방식이다. 여기서 번역하려는 문장과 결과 문장을 컴퓨터에 주고, 결과 문장이 나오게 하는 값을 찾아내는 최적의 가중치(WP)를 반복적인 기계학습을 통해 자동으로 컴퓨터가 학습한다. 번역은 EOS(문장의 끝, end of sentence)값이 가장 높아지면 끝난다. 번역 언어가 달라질 때마다 가중치 값이 바뀐다. 이처럼 인공신경망 기계번역은 입력 문장과 출력 문장을 하나의 쌍으로 두고, 최적의 답을 찾는 중간값을 학습한다.

인공신경망 기계번역 방식은 통계적 기계번역보다 번역 시스템이 단순하다는 장점을 가진다. 입력 문장과 출력 문장만 있으면 알아서 학습하게 하기 때문에 구조 자체가 그렇게 어렵진 않다. 인공신경망 기계번역은 확장하기 쉽고 다양한 구조를 채택할 수 있다는 것도 장점이다. 다만 학습 시간이 다소 오래 걸릴 수는 있다. 이 문제를 해결하기 위해 병렬처리 등의 방식을 사용한다. 인공신경망 기계번역은 아직 초창기이기 때문에 많은 문제점과 가능성이 병존하고 있다.

성능의 핵심은 데이터

▲네이버 번역기 화면 갈무리

▲네이버 번역기 화면 갈무리

번역기의 기본적인 구조는 어떤 언어든 같다. 언어가 다르다고 해서 매번 바닥부터 새롭게 만들어야 하는 건 아니다. 다른 언어로의 번역을 지원하기 위해서는 해당 언어의 학습 데이터로 사용될 번역 데이터만 있으면 된다. 여기에 언어별 특성을 반영하기 위해 추가적인 조작이 들어간다. 번역기 성능의 핵심은 확보한 학습데이터의 양이다. 확보한 학습 데이터를 운용할 수 있는 설비, 추후 유지보수도 물론 중요한 요소다.

데이터나 어순, 구조의 영향이 있으므로 언어에 따라 번역 수준이 다르다. 다만 어순이 유사한 한일-일한 번역은 꽤 높은 품질을 보여준다. 많은 한국어 데이터를 확보하고 있는 네이버의 한영 번역도 꽤 괜찮은 수준이다. 영한 번역은 아직 아쉬운 수준이다.

※ 참고자료

– 네이버 번역기, 어디까지 왔니?, 채반석, <블로터>

– 심층학습을 이용한 기계번역 연구동향, 이건일·이종혁, 정보과학회지, 2015.10

– Neural Machine Translation 기반의 영어-일본어 자동번역, 이창기 외 3명, 정보과학회지, 2015.10

이 글은 ‘네이버캐스트→테크놀로지월드→용어로 보는 IT’에도 게재됐습니다. ☞‘네이버캐스트’ 보기

글쓴이


채반석

chaibs@bloter.net

뉴스, 콘텐츠, 미디어, 플랫폼 chaibs@bloter.net / https://www.facebook.com/chaibschaibs

발행일

2016.01.28

IT 열쇳말

태그

IT열쇳말 기계번역 딥러닝 번역 열쇳말


블로터레터



관련기사

[IT열쇳말] 오큘러스 리프트

[IT열쇳말] 아마존웹서비스(AWS)

네이버 번역기, 어디까지 왔니?

구글, 실시간 음성 번역 서비스 준비 중


Report Page