상단영역

본문영역

알파고 제로 현실로…바둑기보 한장 없이 무한진화하는 '알파고 끝판왕'

  • Editor. 조승연 기자
  • 입력 2017.10.19 11:59
  • 댓글 0
이 기사를 공유합니다

[업다운뉴스 조승연 기자] ‘제로 베이스’에서 시작한다. 인간의 지력에 의존하지 않는 인공지능의 무한 진화가 알파고에 구현됐다.

소문만 무성했던 ‘기보 없이’ 스스로 학습해 기력을 키우는 인공지능(AI) 바둑프로그램 ‘알파고 제로’가 베일을 벗어 세계 바둑계에 또 한 번 충격을 던지고 있다.

바둑을 통해 AI의 무한 진화 가능성을 타진해온 구글 딥마인드의 데미스 허사비스 최고경영자(CEO)는 지난 1월 독일 뮌헨에서 열린 2017 디지털·라이프·디자인(DLD) 컨퍼런스에서 “알파고가 새로운 한계에 도전하고 있다”며 “두 번째 단계로 알파고에 기보를 입력하지 않은 상태에서 자체 강화학습만으로 기력을 키우는 시험을 진행하고 있다”고 밝혔다.

이같은 주장이 과연 현실화될 수 있느냐는 바둑계에 이슈가 됐다. 지난 5월 세계 최강 커제 9단이 ‘알파고 마스터’에 완패하면서 구글이 더 이상 지구상에서 알파고의 반상 대결을 없다며 ‘알파고의 은퇴’ 선언한 터라 이같은 자기 강화학습으로 돌아가는 ‘퍼펙트 알파고의 재림’에 이목이 쏠렸던 것이다.

구글은 알파고의 진화를 과학 전문 국제학술지를 통해 알렸다. 19일(한국시간) 세계적으로 권위 있는 ‘네이처’에 ‘인간의 지식 없이 바둑 마스터하기’라는 타이틀로 실린 구글 논문에 따르면 ‘알파고 제로’로 이름 붙여진 새 버전의 알파고는 전혀 기보를 입력하지 않은 상태에서 처음부터 스스로 훈련하는 강화학습만으로 자기 완성도를 향상시켜 나간다.

종전의 알파고는 사람이 돌을 놓은, 수집 가능한 최대한의 기보를 입력한 뒤에 딥러닝을 통해 바둑 프로그램의 기력을 키워 나간다. 사람과 같이 반복적인 훈련 과정을 통해 기력을 키워가니 기발한 착수 속에 ‘사람 냄새’가 난다는 평도 들어왔다. 이세돌 9단이 지난해 3월 구글딥마인드 챌린지 매치에서 한 번 꺾어봤을 뿐 공식 대결에서 지구촌의 내로라하는 기사들에겐 ‘넘사벽’으로 자리매감한 알파고의 착수는 매번 인간의 창의력을 시험에 들게하면서도 상상 이상의 직관적인 수는 사람을 닮기도 했다는 점에서 ‘알파고식 사고’를 낳게 했다. 알파고의 엉뚱하고도 낯선 발상이 바둑계에 '엉뚱하게 생각하기' 열풍을 가져온 것도 이 때문이다.

그러나 ‘제로(0)’에서 출발한다고 해서 명명된 ‘알파고 제로’는 인류의 편견과 선입관을 처음부터 배제한다. 논문에 따르면 알파고 제로의 강화훈련은 무작위 착점으로 시작된다. 8000만여 건의 강화학습을 통해 스스로 답을 찾아왔다.

40일 동안 혼자 2900만 판의 바둑을 둔 뒤 자기 이외에는 절대 지지 않는 존재로 올라섰다. 알파고가 스스로 자기 스승이 된 것이다. 인류의 창의에 영향받지 않은, 인공지능의 자체 진화를 구현하는 알파고의 ‘끝판왕’인 셈이다.

그렇다면 알파고 제로의 기력은 어느 수준일까.

기존 알파고를 모두 추월했다. 알파고 제로는 알파고 시리즈 중 가장 강력한 ‘알파고 마스터’와 100번 대결에서 89승11패로 무려 90%의 승률을 기록했다. 상대는 지난 5월 중국 커제 9단에 3전 전승을 거뒀던 버전이다.

더욱이 알파고 제로가 현재의 경지에 오르는 데 걸린 기간은 40일에 불과했다. 논문에 따르면 알파고 제로가 지난해 3월 이세돌 9단과 대결했을 당시의 알파고를 뛰어넘는 데는 자체 강화학습에 돌입한 뒤 36시간밖에 걸리지 않았다. 72시간이 경과한 시점에는 이세돌 9단에 4승1패를 거뒀던 알파고 버전에 100전 100승을 거뒀다.

바둑 실력을 정량화한 국제바둑랭킹인 ‘ELO 레이팅’으로 환산한 알파고 제로의 점수는  5185점이다. 커제 9단을 울렸던 알파고 마스터 버전은 4858점, 이세돌 9단을 눌렀던 알파고 버전은 3739점, 2015년 10월 판후이 2단을 제압했던 알파고 버전은 3144점으로 모두 알파고 제로와 현격한 격차를 보였다.

이번 연구를 발표한 허사비스 CEO는 "인공지능 연구가 추구하는 목표는 인간이 데이터를 입력하지도 않아도 되는 알고리즘을 만드는 것인데 알파고 제로를 통해 이를 이루기 위한 중요한 성과를 거뒀다고 생각한다"고 강조했다. 이번 알파고 제로 연구 결과가 신소재 설계, 에너지 감축 등에 활용될 수 있기를 기대한다는 입장도 밝혔다.

3000년이 넘는 인류 바둑사를 뛰어넘어 단 한 장의 기보도 보지 않고 ‘바둑의 신’ 경지에 올라선 알파고 제로. 진화학자 스티븐 핑거가 막 태어난 아이와 같다고 한 ‘백지 상태’에서 창의의 한계를 매번 뛰어넘으며 무한 승리의 방정식을 스스로 터득하는 알파고 제로의 등장은 인류에게 새롭게 다가간다. 인간의 고정관념이 영향을 미칠 수도 있는 '디폴트 옵션'을 완전히 배제한 알파고 제로식 인공지능의 진화는 4차 산업혁명의 길을 얼마만큼 열어줄까. 

저작권자 © 업다운뉴스 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

하단영역

© 2024 업다운뉴스. All rights reserved. ND소프트