oro 세계 인터넷바둑의 허브
  • 겜임&채널
Home > 뉴스
박영훈 "기보 보기라면 한가닥하는데, 구글 인공지능 보니..."
박영훈 "기보 보기라면 한가닥하는데, 구글 인공지능 보니..."
[이세돌 VS 알파고] 김수광  2016-01-31 오후 05:14   [프린트스크랩]
  • 트위터
  • 이메일
  • 카카오스토리+
  • 구글+
  • 페이스북


평창으로 가는 버스 안, 박영훈 9단 옆 자리에서 대화할 기회가 생겼다.

하루 뒤 2월1일의 LG배 조선일보 기왕전 결승대국을 앞 둔 그가 피곤해할 수 있겠다 싶어 말 걸기를 좀 자제해야겠다고 생각하고 있는데 웬걸, 박영훈 9단이 구글의 인공지능 바둑 알파고 얘길 한다.

“기보 3천만개를 봤다니 그게 가능하기나 한가?”
라고 그는 이야기했다.

그게 무슨 맥락에서 말하는가 파악하기에 앞서 우선 잘 됐다 생각했다. 계산에 밝은 박영훈 9단의 견해가 무척 궁금하긴 하던 차다. 그가 편안하게 얘기하기에 컨디션에 문제가 되지 않을 만큼 대화를 나눴다.

역사상 처음으로 프로기사를 호선에 이긴 인공지능 바둑, 구글 딥마인드의 알파고 이야기는 박영훈에게도 신선했다고 한다. 구글 딥마인드의 발표를 듣다가 박영훈의 귀에 꽂힌 부분은 ‘기보 3천만개’다. 기보를 바둑판에 놓아보기 일인자를 꼽으라면 아마도 박영훈일 것이다. 상상을 초월할 정도로 박영훈은 기보를 좋아한다.

박영훈이 꿈나무이던 시절, 스승 최규병 9단은 놀기를 지나치게 좋아하는 박영훈을 바둑판 앞에 묶어두려고 숙제를 줬다. 서가를 가리키며 기보 약 1,500국을 판에 늘어놓아보라고 시켰다. 기한도 정해주지 않았다. 몇 달간은 꼼짝없이 바둑판 앞에 있겠지 하고 최규병 9단은 생각했다.

한데, 박영훈이 한동안 열심히 숙제를 하는 듯하더니 한달도 안 되어 다시 노는 모습을 스승이 발견했다. 최규병 9단은 박영훈 어린이를 불렀다.
“왜, 숙제를 다 끝내지 않고 놀고 있느뇨?”

“다 끝냈습니다.”
박영훈 어린이는 씩씩하게 대답했다.

프로기사일지라도 기보 한장을 바둑판 위에 놓아보는 시간은 10분은 잡아야 한다. 조금 빨라질 수는 있지만 손이 나가는 속도를 감안할 때 훨씬 빠르게 보기는 어렵다. 어릴 때부터 박영훈은 기보 머신이었던 것이다.

“숙제 같은 게 있으면 마음이 편치 않다.”며 지금의 박영훈은 당시를 회상한다. 박영훈이 알파고가 공부했다는 기보의 수에 놀란 까닭은 두가지였다. 하나는 그 방대함이고 하나는 이 세상에 기보가 3천만개나 존재하나?라는 의문이었다.

“내가 입단 전부터 지금까지 본 기보가 줄잡아 15만국 정도 된다. 이 세상의 기보는 웬만하면 다 봤다고 생각했다.” 구글이 말하는 기보는 고수들의 기보를 말하는 것일 텐데 그렇게 수가 많지 않다는 것이다.

“현재 고수들의 기보는 한해 5,000판 정도 생산될 것이다. 그렇다고 보면 구글의 발표와 맞아들어가지 않는다.” 그래서 박영훈은 아마도 구글이 밝힌 것은 아마도 완성된 기보 뿐아니라 온갖 종류의 기록된 바둑 자료를 말하는 것이라고 추정했다.(구글 딥마인드는 '전문가가 플레이하는 게임으로부터 3천만개의 움직임'이라고 표현했다.) 그러면서도 알파고의 그 공부량에 혀를 내둘렀다.

구글 딥마인드가 밝힌 바에 따르면, 알파고는 3천만개의 움직임을 한꺼번에(비순차적으로) 흡수한 다음, 고수들의 다음 수를 분석하고 예측한다. 그러고는 자신이 이해한 바를 적용해 자기 자신과 대국을 해본다. 4주간 치른 대국이 100만판이다. 프로기사가 1년에 1,000판을 둔다고 가정한다면(그냥 가정이다) 알파고는 한달 동안 인간 세상 1000년치의 경험을 쌓은 셈이다.

여담이지만 기계가 기보를 가지고서 고수가 됐다. 오늘날 프로지망생들이 훈련하고 있는 바둑도장들에선 기보 보기 훈련의 비중이 낮다. 아뭏든 그냥 그렇단 얘기다.

한편 박영훈은 알파고의 바둑 스타일에 대해서도 언급했다. “판후이 2단과의 다섯 판을 봤는데 첫판은 서로 부드럽게 두었지만 두번째 판부터 판후이 2단이 싸움을 걸어오자 알파고도 사납게 맞섰다. 그리고 알파고가 우세했다. 이걸로 보아 상대의 태도에 따라 전략을 달리하는 것으로 보인다.”며 “커제 9단이 밝혔듯이 알파고의 실력은 훌륭하다. 예전에 뛰어나다고 하던 어떤 프로그램들과도 다르다. 차원이 다르다. 균형감각도 좋고 판단력도 좋다. 그러나 이런 걸 모두 감안하더라도 정상급 프로기사를 상대로는 2점 아래의 실력이다. 당시 기보로는 그렇다.”고 했다.


  • 페이스북
  • 구글+
  • 카카오스토리+
  • 이메일
  • 트위터
┃꼬릿글 쓰기 동감순 | 최신순    
파라디아 |  2016-02-21 오전 11:18:00  [동감0]    
세돌이가 한판도 못이길것입니다.
강릉P |  2016-02-03 오후 3:55:00  [동감0]    
기보 매년 5천개가 생성된다는게 맞다..인터넷에서 가장 많은 기보를 열람
하는 사이트가 전세계 왠만한 기보는 다 저장하는데 10만개 정도 된다..
대체적으로 중요한 기보는 1만개도 안될것이다..
김동은 |  2016-02-03 오전 9:02:00  [동감0]    
기보의 학습을 통해서 수읽기를 한다면 알파고는 실수를 하지는 않겠지만, 기상천외한 묘수를 두지도 못할 것이다. 그런 것은 학습한다고 배울 수 있는 것이 아니다. 굳이 말하자면 이창호의 10대 시절처럼 정수로서 상대를 압사시키는 스타일이라고 할 수 있다. 이창호가 10대 시절에 이 스타일로 전세계를 석권했으니 알파고도 프로기사를 이기지 못하리라는 법은 없다. 다만 이세돌 정도라면 알파고의 수를 예측하고 그를 타개할 방책을 충분히 찾아낼 수 있을 것이라 믿는다. 나는 이세돌에 건다.
순대의행복 |  2016-02-02 오후 4:07:00  [동감0]    
알파고 판매도 하나요?..
먼산보기 그 많은 시간과 노력을 재미삼아서 투자하고 있는게 아니겠죠 언젠가는 돈으로 환산해서 본전이상 뽑으려 하겠지요  
BWV1004 |  2016-02-01 오후 9:44:00  [동감0]    
기보 3천만개를 본 게 아닙니다.
KGS서버에 있는 6~9단 대국 16만판에 나타난, 부분전투(수읽기패턴) 2천9백4십만개를 습득 후,
스스로 갈고 닦은 것입니다.

논문 25쪽 3~5행에 명시되어 있습니다.
...
Policy Network: Classification We trained the policy network pσ to classify positions according to
expert moves played in the KGS data set. This data set contains 29.4 million positions from 160,
000 games played by KGS 6 to 9 dan human players.
...

아래는 Google deepmind의 AlphaGo 알고리즘 논문 원본 링크입니다.
https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf
현묘구현 그럼 아마고수들의 수법을 봤다는건데 아마고수 100명이 상담기를 해도 프로기사를 이길수 없듯이 의미없는 기록.  
현묘구현 |  2016-02-01 오후 7:56:00  [동감0]    
다르게 얘기하면 3천만 운운하는건 이미 프로그램으로서 어느 정도 완성도가 갖춰졌다는 뜻.
그러므로 2점치수정도까지 접근한건 대단하지만 여기서부터의 발전은 어려울거란 말도 가능
하고 그게 맞을듯.
먼산보기 |  2016-02-01 오후 7:17:00  [동감0]    
여기서 한가지 궁금한점이 있는데, 알파고가 그동안 인터넷 대국은 하지 않았을까 하는 의문이 생긴다.
그러면, 인터넷 상으로 절대강자가 한두명 있었음직 한데..........
황소들소 |  2016-02-01 오후 6:40:00  [동감0]    
알파고 기보볼려면 어덯게 하나요?
최강한의사 |  2016-02-01 오후 3:20:00  [동감1]    
얼마 지나면 알파고랑 몇 점 두냐로 기력을 물어볼 날이 올까요...
킬러의수담 |  2016-02-01 오후 12:43:00  [동감0]    
알파고가 공부할 만한 기보는 이미 다 공부했을테고
새로 생성되는 기보는 그간의 학습량과 비교해 많지않다.
이제부터는 혼자 시물레이션 대국을 통해
절대수를 찾아내는 작업을 할듯...
web1012 |  2016-02-01 오전 12:33:00  [동감2]    
박영훈 9단이 기보 15만국 본 게 더 신기하다
백발도사 |  2016-01-31 오후 11:07:00  [동감1]    
3천만(30,000,000) move라는 말은 3천만 대국이 아니고 3천만 수를 의미한다. 바둑 한 판에 평균 200수가 필요하다면 200으로 나눈 15만 대국이 되고, 대국 뿐 아니라 사활 문제, 정석, 등등을 다 합해서 알파고에 입력되어 있는 바둑의 모든 착수의 합을 말하는 것으로 보인다.
금옥저 |  2016-01-31 오후 9:36:00  [동감2]    
박영훈 9단도 프로2점 치수 바둑이라고 했다...두어진 기보로만 볼때란 단서가 붙었다..
초등학교 1학년 문제를 푸는데 함수 미적분이 필요할까?
판후이를 이기는데 프로2점 치수면 충분했다.
금옥저 |  2016-01-31 오후 9:33:00  [동감3]    
첫판을 판후이가 부드럽게 두자 알파고도 부드럽게 두었다..상대에 따라 맞춰둔단얘기다.
5판 중에 한판이라도 판후이가 이겼다면 프로에 2점 치수가 맞다. 하지만 다 이겼기 때문에
알파고 실력은 현재로서는 알수가 없다.
초등학교 1학년 수학문제를 5번 다 백점 맞은 사람이 있다.
이사람의 수학실력은 중학생일까 ? 고등학생일까 ? 서울대 수학과 교수일까?
알 수가 없는 것이다.
공룡꽥 바로 그점이 문제죠!! 저도 알파고 기보를 여러번 봤는데, 제가 느낀점을 박영훈 9단이 인터뷰 했네요,,저 알파고는 이전 프로그램들하고 차원이 다릅니다,상대가 평온하게 나오면 같이 평온하게,,거칠게 나오면 더 거칠게 받아치더군요,,2국부터는 전투바둑 이었는데 싸움을 걸어온 판2단이 너덜너덜,,만방 깨졌습니다. 수가 나지 않는 귀에서 응수 타진하는건 일종의 심리전인데 저 알파고가 그것도 하더만요,,확률과 통계적방식으로 다음수를 산출하는 알고리즘이라면 응수타진은 정말 쓸데 없는 낭비거든요? 님의 생각대로 알파고는 레벨 조정이 가능한것 같습니다,,3월이 되야 확실히 알 수 있겠지만 구글팀에 의해서 판도라의 상자가 조금은 열린게 아닌가,, 그렇게 생각합니다,,  
高句麗 |  2016-01-31 오후 8:39:00  [동감1]    
알파고는 체력에 한계가 없다 한번 본것은 잊어먹지 않고 반드시 기억한다
계산력과 수읽기는 무한대와 가깝다 감정기복도 없다 컨디션기복도 없다
스스로 학습한다고 하니 그동안 컴퓨터도 업그레이드 했을테고
학습량 또한 도저히 인간이 따라잡을수 없을 정도일 것이다
그렇다면 이는 기계와 인간의 대결은 20대와 80대시니어의 대결보다 더 차이가 난다고 본다 시니어가 젊은이들에게 추월당하는 이유가 학습능력 차이에서 오는것이기 때문이다
해서 판후이와 두던 실력을 그때의 알파고 실력과 이세돌9단때 두던 알파고의 실력과 같다고 보면 안된다
사황지존 |  2016-01-31 오후 7:28:00  [동감1]    
이렇게 생각하면 어떨까? 판후이와의 기보 내용으로 2점아래 실력이라고 대대수프로가 단정하는데 그게아니라 상대에 따라 기력을 맞춰서 두는 거라면 예를 들어 18급이랑두면 같이 18급으로 둬주고 아마7단이랑두면 7단으로 셋팅되도록 프로그램되있고 둬주는거라면 알파고의 맥시멈 한계를 단정할수없는거 아닌가? 솔직히 프로기사들이 그렇게 단정하듯이 알파고가 2점아래 치수라면 승패가 뻔한데 정선이나 역덤을 받는 대국방식으로 뭔가 기력이 맞게 팽팽한승부가 되게 도전해왔겠지 호선으로 이세돌9단에게 도전하고 그렇게 자신있어할까? 하여튼 무지 찝찝하네
不勝少女 |  2016-01-31 오후 6:45:00  [동감2]    
문제는 작년 10월 기준으로 2점 아래의 실력이란 얘기다. 판후이와의 5판은 진짜 실력을 충분히 보여주지 않았을 것이고, 남은 6개월간 몇천년간의 학습분량을 더 공부하고 이세돌기보를 완벽히 분석하여 특화된 전략을 짜고 나온다면 2점이란 차이는 극복이 가능하다는 가능성이 무서운 점이다...결과가 어찌되었든 지금까지만으로도 올해의 큰 사건임에는 틀림없는것 같다.
foxair 몇 개월 전까지만 해도 알파고 A.I.는 약한 기력이였다고 하는데.. 불과 몇 개월만에 판후이 프로에게 5판 싹쓸이 했다는 것 만으로도 머신러닝 알고리즘의 기력 성장속도는 광속에 가깝지 않을까 합니다. 알파고가 학습하는 기보는 지구상에 존재하는 초일류 프로기보 전체를 서로 조합하면서 응용한 자가 모의대국일 겁니다. 거기서 최선의 응수를 분석하고 루트를 찾아가는 것이죠.  
807969 |  2016-01-31 오후 6:07:00  [동감0]    
김수광기자님...화젯거리 알파고 기사 재미나네요 특히 계산하면..박영훈9단인데...옆자리 동행하며 한건^^ 하셨어요~~~
807969 끝내기 부문에서 컴과 박9단이 겨루는것도 재미나겠네^^  
FirstPage PrevBlock   1   NextBlock LastPage












* 띄어쓰기 포함 200자까지 쓰실 수 있습니다. (000 / 400바이트)
대국실입장하기
다운로드 이용안내 고객센터
정회원가입
오로볼구매
가장 많이 본 기사
스폰서소식