Ли Седоль (слева), один из сильнейших в мире профессиональных игроков в го, проиграл матч искусственному интеллекту со счетом 1:4. Фото Reuters
«Матч века» – матч между человеком и компьютерной программой в настольной игре го, продолжает волновать не только поклонников этой древней игры, но и ученых. Дело в том, что го - последняя игра, не поддававшаяся натиску все просчитывающих наперед машин. В игре, которая долгое время оставалась самым главным вызовом для разработчиков искусственного интеллекта (ИИ). Ведь в го интуиция игрока влияет на результат матча не меньше его способности просчитывать ходы.
Игра математиков
Почему же именно в эту игру часто играют математики и ученые. Го – настольная игра с глубоким стратегическим содержанием, предположительно возникшая в Древнем Китае. Ее правила существуют практически в неизменном виде уже более 3 тыс. лет. К тому же эта игра – одна из самых распространенных: в го играет около 60 млн человек во всем мире.
Правила игры настолько просты, что четырехлетние дети с легкостью осваивают ее меньше чем за час. Но в то же время большое число возможных комбинаций – в шахматах после четвертого хода возникает около 100 тыс. возможных позиций, в го – более 16 млрд! – делает игру очень сложной для компьютерных программ.
Всего же число возможных позиций на доске составляет: в шашках – 1020, в шахматах – 1060, а в го – 10100, что превышает число атомов во Вселенной! Конечно, ни один человек не смог бы просчитать такое количество возможных позиций, поэтому, как говорят сами игроки, значительное влияние на результат партии оказывает интуиция самого игрока: иногда игрок не может объяснить, почему он сделал именно такой ход, но он знает, что только такой ход верен, то есть с большей вероятностью приведет его к победе.
Более того, считается, что шахматы в основном развивают левое, «алгебраическое», «логическое» полушарие мозга, в то время как при игре в го активно работают оба полушария – и правое, «геометрическое», «образное». Именно по этим причинам древнекитайская игра оставалась тем самым вызовом для всех разработчиков ИИ. Ведь, чтобы одержать победу над профессиональным игроком, программа должна не только уметь просчитывать наперед позиции, но и обладать определенной человечностью – делать ходы, иногда кажущиеся нелогичными, но в конце концов приводящие к победе.
ИИ го-го!
Неудивительно, что совсем недавно было широко распространено мнение, что игра го останется не под силу компьютерам на протяжении еще нескольких десятилетий. Даже успех в 2015 году корейских разработчиков го-программы Dol Baram, обыгравшей корейского профессионала Чо Чикуна (9-й профессиональный дан), был достигнут на четырех камнях форы.
История нынешней, полноценной победы компьютера над человеком в го началась в конце 2015 года. Тогда лаборатория DeepMind представила результаты матча своей программы AlphaGo против чемпиона Европы по го, игрока 2-го профессионального дана Фаня Хуэя. Тогда эксперты, посмотрев записи матча, сошлись во мнении, что AlphaGo сильнее всех предшествующих программ, но все же не идеальна, да и Фань Хуэй – не сильнейший игрок мира.
Следующим сразиться с программой решил один из сильнейших игроков мира Ли Седоль (9-й профессиональный дан), занимающий четвертое место в общемировом рейтинге спортсменов го.
Как же работает AlphaGo и в чем ее принципиальное отличие от своих предшественниц? Дело в том, что большинство игровых алгоритмов было построено на методе иерархического поиска Монте-Карло – то есть программа проводит симуляцию игры на каждой конкретной позиции и с этой точки зрения оценивает ее выгодность. На этом методе основано и большинство го-программ. Но разработчики AlphaGo создали гибридную систему, сочетающую традиционный метод Монте-Карло и работу нейросети.
Главной задачей нейросети было предсказать наиболее вероятный ход в игре человека против человека на основе всех партий, сыгранных за всю историю. Программа «изучила» все эти партии и на их основе стала играть сама с собой, совершенствуя свое мастерство. Таким образом, работники лаборатории DeepMind создали уникальную систему, способную, во-первых, оценивать выгодность каждой конкретной позиции на доске, то есть поступать как компьютерная программа, а во-вторых, «предсказывать» наиболее вероятный ход, что придает человечный характер принимаемому программой решению.
После победы AlphaGo над чемпионом Европы практически все го-сообщество, включая самого Ли Седоля, выигравшего, кстати, более 800 турниров, и разработчики го-программ сошлись во мнении: Ли с легкостью обыграет программу, которой далеко до его уровня игры. И вот 15 марта 2016 года закончилась эта историческая серия из пяти партий. Результат матча – 4:1 в пользу программы AlphaGo.
Как же так получилось?
Один из сильнейших российских игроков в го, трехкратный чемпион Европы Илья Шикшин (1-й профессиональный дан) считает, что у обеих сторон были равные шансы в первой партии. По его мнению, очень большую роль в этой партии сыграла психология: Ли Седолю было сложно настроить себя на борьбу с компьютером, потому что раньше профессионалы его уровня побеждали программы, да еще и на нескольких камнях форы. Более того, игрок был недостаточно внимателен и, возможно, даже не верил в то, что программа может находить наилучшие ходы.
«Все это привело к тому, что игроком были допущены ошибки, которые и привели к поражению в первых трех партиях», – подчеркивает Илья.
По мнению президента Российской федерации го Максима Волкова, психологическое давление существенно сказалось на игре Ли Седоля: «Ли Седоль представляет элиту го-сообщества, он проверенный и опытный боец. Его проигрыш лично для меня был очень болезненным. Что уж говорить о внутренних переживаниях спортсмена, на которого смотрит многомиллионная аудитория, от которого все го-сообщество ждет единственного результата. Мне показалось, что ближе к концу первой партии у него задрожали руки, но, может, мне это только показалось. В целом напряжение было невероятно высоким, а игра протекала с переменным успехом».
На пресс-конференции после завершения первой партии Ли Седоль признал, что уровень игры программы гораздо выше того, который он видел в партиях AlphaGo с Фанем Хуэем, и у них равные шансы на победу в этой серии.
«К четвертой партии Ли Седоль пришел более подготовленным, возможно, он разобрал уже сыгранные партии, – добавляет Илья Шикшин. – Отсюда и результат: профессионал играл практически без ошибок и партия закончилась в его пользу».
В середине четвертой партии Ли Седолю удалось обыграть программу, совершив неожиданный ход (№ 78). По словам разработчиков из лаборатории DeepMind, AlphaGo оценивала вероятность появления такого хода на доске как менее 1 к 10 000. По мнению семикратного чемпиона Европы Александра Динерштейна (3-й профессиональный дан), этот ход Ли Седоля войдет в историю и учебники по го.
Более того, по замечанию Шикшина, в середине четвертой партии, когда уже стало понятно, что программа уступает, AlphaGo стала делать довольно странные ходы. Возможно, это был сбой, может, компьютер «понял», что проигрывает, оценив позицию, но скорее всего именно эти ходы и привели к окончательной победе человека, потому что он уже не допускал ошибок.
Эпоха в истории го
Четвертая партия стала своеобразным знаком надежды для всех поклонников игры – известно, что программе бросили вызов два игрока 9-го профессионального дана из Китая – Ке Цзе и Гу Ли. Оба они играют не слабее Ли Седоля, но в несколько ином стиле. В случае, если данные матчи состоятся, они вызовут огромный, возможно, еще больший интерес, сомнений нет. Ведь мы знаем теперь уровень игры программы и ее способность делать достаточно человечные ходы. Но пока непонятно, насколько она человечна в своих ошибках.
Илья Шикшин считает, что результат возможного матча между китайским профессионалом и AlphaGo во многом будет зависеть от того, когда он состоится: «Чем больше времени проходит, тем сильнее становится программа. Если матч состоится в самое ближайшее время, думаю, у Ке Цзе есть все шансы одолеть AlphaGo. Пока непонятно, есть ли какие-то лимиты совершенствования программы и повышения уровня ее игры, но вполне возможно, что еще через несколько месяцев она станет совершенно непобедимой для человека».
В общей оценке результата матча для всего мира эксперты сходятся: серьезный прорыв в области разработок искусственного интеллекта привлек внимание широкой общественности к игре го. Заслуженный тренер России по го, профессор, доктор технических наук Владимир Алексеевич Кузнецов добавляет: «Значимость результата, полученного разработчиками программы, значительно больше. С одной стороны, это значит, что го – самая удивительная игра, секрет которой почти разгадан человеком, поскольку совсем необученный компьютер выбирает вполне человеческие ходы. А с другой стороны, победа компьютера означает торжество современных средств искусственного интеллекта. Потрясающе, что это произошло именно с игрой го, в этом фантастическая уникальность го, сравнимая с большой теоремой Ферма: она практически бесполезна, но в результате ее 250-летнего доказательства математика получила огромное развитие. Случилось так, что на ней сомкнулись два полюса: физиология мышления человека и новое представление о возможностях компьютера».
«Матч века» несомненно станет началом новой эпохи в истории го. Так же, как победа компьютерной программы Deep Blue над Гарри Каспаровым в 1997 году задала новый этап развития шахмат. Возможно даже, что компьютерная го-программа познает игру глубже человека.