Русская Википедия:Матч AlphaGo — Ли Седоль

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Кратное изображение Матч AlphaGo — Ли Седоль (или Google DeepMind Challenge Match) — матч по игре го, проходивший c 9 по 15 марта 2016 года между компьютерной программой AlphaGo, разработанной британской компанией Google DeepMind, и корейским профессионалом 9 дана Ли Седолем. Всего было сыграно 5 партий. Игра велась по китайским правилам, величина коми составляла 7,5 очков. Контроль времени классический — каждому игроку на партию даётся по два часа и 3 бёёми по 60 секунд. Для работы AlphaGo использовались 1920 процессоров и 280 графических процессоров, работающих в распределённой сети[1]. Игры транслировались в прямом эфире на YouTube[2]. Матч завершился победой AlphaGo со счётом 4:1[3][4]. Событие сравнивают с историческим шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 года, в некоторой степени предопределившим судьбу шахмат[5][6][7].

Победителю матча предназначалась награда в 1 миллион долларов; поскольку победителем стала AlphaGo, представители Google DeepMind заявили, что призовые деньги будут отданы на благотворительные цели, в том числе фонду ЮНИСЕФ и го-организациям[8]. Ли Седоль получил 170 тысяч долларов (150 тысяч за участие и дополнительные 20 тысяч за победу в одной из партий)[9].

После победы в матче Корейская ассоциация падук присвоила AlphaGo наивысший ранг го — «почётный 9 дан» за «искренние усилия» программы в овладении мастерством игры[10].

Перед матчем

Развитие компьютерных программ, играющих в го

Шаблон:Основная статья Го — сложная настольная игра, требующая помимо логики применение интуиции, творческого и стратегического мышления[11][12]. В течение длительного времени обучить компьютерные программы играть в го на уровне сильного любителя было крайне сложно[13]. По сравнению с шахматами, в го перед искусственным интеллектом ставится больше задач, решение которых требует имитацию мыслительного процесса человека[14]. Ещё в 1965 году математик Ирвинг Джон Гуд писал:

Шаблон:Quote

До 2015 года[15] лучшие программы, играющие в го, могли достичь лишь уровня любительского дана[16]. Компьютер достиг бо́льших успехов на доске размером 9×9, где некоторые программы смогли выиграть у профессиональных игроков. До появления AlphaGo некоторые разработчики заявляли, что компьютеры никогда не смогут победить лучших игроков среди людей[17]. Илон Маск, один из первых инвесторов компании Deepmind, в 2016 году заявил, что по мнению экспертов, искусственный интеллект находится в 10 годах от победы над лучшим из профессиональных игроков[18].

Матч AlphaGo против Ли Седоля можно сравнить с шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 года, где победа программы, созданной IBM, над действовавшим чемпионом стала символической точкой отсчёта новой эпохи, когда компьютеры превзошли людей в шахматах[19].

AlphaGo имеет значительные отличия от программ-предшественников. Она задействует нейронные сети, где эвристические оценки не основываются на конкретных значениях переменных, закодированных людьми, а в значительной степени, извлекаются самой программой, путём десятков миллионов просмотров сыгранных партий и собственных партий с самой собой[15][20][21]. Даже сама команда разработчиков AlphaGo не в состоянии указать, каким образом AlphaGo оценивает позицию в партии и выбирает свой следующий ход[22]. Метод Монте-Карло также стал одним из основных способов повышения эффективности программы в выборе ходов. При создании программы использовались данные из теории распознавания образов и машинного обучения[15].

Матч против Фань Хуэя

Файл:FHvAG5.jpg
Фань Хуэй — AlphaGo — Партия #5 (90 в 15, 127 в 37, 151 в 141, 154 в 148, 157 в 141, 160 в 148, 163 в 141)
Файл:FAN Hui vs BAO Yun.jpg
Фань Хуэй

В начале 2016 года были опубликованы материалы о том, что в октябре 2015 года AlphaGo победила трёхкратного чемпиона Европы по го Фань Хуэя (2 профессиональный дан) со счётом 5-0; таким образом, искусственный интеллект впервые одержал победу над профессиональным игроком на доске размером 19x19 без форы[23][24]. Часть экспертов указывала на сильный разрыв в уровне игры между Фань Хуэем и Ли Седолем, обладателем наивысшего ранга — 9 профессионального дана и множества завоёванных титулов[25]. Прежде компьютерные программы Zen и Шаблон:Нп5 смогли одержать победу над профессиональными игроками, имея фору в четыре или пять камней[26][27]. Канадский исследователь теории игр и искусственного интеллекта Джонатан Шеффер после победы AlphaGo над Фань Хуэем сравнил программу с «ребёнком-вундеркиндом», которому недостаёт опыта, и заявил, что настоящие достижения начнутся тогда, когда программа сыграет с настоящим топ-игроком; победу в матче он предрекал всё же Ли Седолю[24] Шаблон:Нп5, профессиональный игрок и генеральный секретарь Международной федерации го, заявила, что у AlphaGo и Ли Седоля равные шансы на победу в грядущем матче[24].

После своего поражения, Фань Хуэй заявил, что благодаря этому матчу он стал играть лучше и стал видеть те вещи в игре, которые не замечал ранее; к марту 2016 года мировой рейтинг Фань Хуэя поднялся примерно на 300 позиций[28]

Подготовка

Эксперты по го нашли несколько ошибок, сделанных AlphaGo в партиях против Фань Хуэя, в частности, в оценке позиции на всей доске в противовес отдельным тактическим моментам; однако, к началу матча против Ли Седоля, не было известно, насколько с тех пор усилилась программа[25][29]. AlphaGo не была настроена специально под стиль игры Ли Седоля, что и так было бы сложно сделать, поскольку «тренировка» AlphaGo включала в себя просмотр десятков миллионов партий; несколько сотен или тысяч матчей Ли Седоля не были достаточным количеством для того, чтобы изменить стиль игры программы. Вместо этого AlphaGo просматривала партии сильных игроков-любителей, сыгранные на интернет-серверах, после чего играла сама против себя; в базе данных тренировки AlphaGo не было партий Ли Седоля[30][31].

В интервью перед матчем Ли Седоль предсказывал, что он легко выиграет со счётом 4-1 или даже 5-0, затем 2-3 года Google будут дорабатывать AlphaGo, после чего захотят взять у него реванш. В этом случае играть с обновлённой версией AlphaGo будет действительно интересно, считал Ли[32][33].

Игроки

Файл:Lee Se-Dol.jpg
Ли Седоль в 2016 году

Ли Седоль

Шаблон:Main Ли Седоль, профессиональный игрок, обладатель 9 профессионального дана по го[34], считается одним из сильнейших игроков в истории го[35]. Его карьера началась в 1996 году, когда он получил ранг 1 профессионального дана в возрасте 12 лет, с тех пор он завоевал множество титулов го[36]. Стиль Ли Седоля отличается нестандартными креативными ходами[37]. Предрекавший свою безоговорочную победу[37] Ли Седоль за несколько недель до матча стал обладателем одного из основных корейских титулов го — Мёнин[38].

AlphaGo

Шаблон:Main AlphaGo — компьютерная программа, созданная компанией Google DeepMind. Алгоритм AlphaGo использует комбинацию последних достижений для поиска оптимальной стратегии в дереве игры с новейшими методами машинного обучения в сочетании с интенсивным изучением партий людей, так и тренировкой при игре с самой собой[15]. Изначально AlphaGo тренировали подражанию человеческой игре через изучение множества партий, сыгранных как профессионалами так и сильными любителями, в том числе базы данных сервера Шаблон:Нп5 из около 30 миллионов ходов из 160 тысяч партий игроков от 6 до 9 дана[15][39]. После достижения определённого уровня в стратегии и тактике, программа перешла на игру против самой себя и обучение с подкреплением[40]. Система не использует базу данных ходов. Как пояснил один из создателей программы,[22], Шаблон:Quote

Версия программы, использовавшаяся в матче против Ли Седоля, использовала сходные компьютерные мощности, что и в партиях против Фань Хуэя, — 1920 CPU и 280 GPU[1]. В мае 2016 года представители компании Google объявили, что AlphaGo использовала при обучении TPU, процессор, разработанный Google, специально для машинного обучения[41][42].

Условия проведения матча

Пять партий матча состоялись 9, 10, 12, 13 и 15 марта 2016 года в Сеуле[43].

Партии игрались по китайским правилам, коми составляло 7,5 очков; временной контроль — по 2 часа основного времени каждому игроку 3 периода бёёми по 60 секунд[9]. Партии проходили в закрытом зале в присутствии трёх официальных наблюдателей, среди которых был Фань Хуэй. За время проведения игр не было зарегистрировано каких-либо происшествий, приведших к вмешательству наблюдателей.

Прямая трансляция партий матча шла на YouTube, параллельно с ней велись трансляции с комментариями игры на английском языке от Майкла Редмонда[44] (единственный неазиатский игрок, имеющий 9 профессиональный дан[45]) и на корейском языке от Ю Чханхёка, Сон Тхэгона и других корейских профессионалов[46][47][48]. Айа Хуань (игрок, обладатель 6 любительского дана и сотрудник команды разработчиков DeepMind) ставил камни на гобан за AlphaGo[6]. Работа программы велась с помощью Google Cloud Platform, сервер располагался в США[49].

Разработчики решили перед каждой партией использовать «фиксированную» версию программы, таким образом она не использовала для самообучения партии, сыгранные в этом матче и не подстраивалась под стиль игры Ли Седоля, каждый раз заново определяя свою стратегию[50].

Победитель матча получал в качестве награды 1 миллион долларов. Представители Google DeepMind заявили, что в случае победы AlphaGo они планируют передать эти деньги в благотворительные фонды (включая ЮНИСЕФ) и организации, занимающиеся развитием го[8]. Ли Седоль получил 150 тысяч долларов за участие в матче и по 20 тысяч долларов за победы в отдельных партиях[8][9].

Ход матча

Резюме

AlphaGo — Ли Седоль
Игра # Чёрные Белые Результат Дата Ходов Затраченное время[прим. 1]
1 Ли Седоль AlphaGo 0-1 (сдался) 9 Марта 2016 186 Ли Седоль: 1ч. 32мин. — AlphaGo: 1ч. 55мин.
2 AlphaGo Ли Седоль 1-0 (сдался) 10 Марта 2016 211 Ли Седоль: 2ч. — AlphaGo: 2ч.
3 Ли Седоль AlphaGo 0-1 (сдался) 12 Марта 2016 176 Ли Седоль: 2ч. — AlphaGo: 1ч. 51мин.
4 AlphaGo Ли Седоль 0-1 (сдался) 13 Марта 2016 180 Ли Седоль: 2ч. — AlphaGo: 1ч. 59мин.
5[прим. 2][51][52] Ли Седоль AlphaGo 0-1 (сдался) 15 Марта 2016 280 Ли Седоль: 2ч. — AlphaGo: 2ч.
Общий счет: AlphaGo — Ли Седоль: 4-1

Общие комментарии

Комментируя первую партию матча, и Чо Хансын (9 профессиональный дан) и Майкл Редмонд отметили, что AlphaGo значительно усилилась по сравнению с октябрьским матчем против Фань Хуэя[53]. Уже на стадии фусэки стало ясно, что программа играет на уровне лучших игроков среди людей; Не Вэйпин (9 профессиональный дан, Китай) предположил, что AlphaGo играет в силу 6 или 7 профессионального дана в фусэки и 13—15 дана в тюбане[54]. Сам Ли Седоль после проигрыша во второй партии заявил: «Вчера я был удивлён, но сегодня у меня нет слов»[55]. После третьего поражения Ли Седоля AlphaGo досрочно победила в матче и комментаторы сошлись на том, что остаётся надежда на одну победу человека[56]. Кэ Цзе, возглавлявший на тот момент рейтинг игроков и также бросивший вызов AlphaGo, заявил, что он начал сомневаться в своей победе над программой[57]. В партиях со стороны программы были замечены ошибки; Демис Хассабис заявил, что они будут тщательно проанализированы, и что видимо AlphaGo «не знает некоторые классические тэсудзи и совершает тактические ошибки», что стало видно после проигранной ей партии, когда программа после ключевого победного хода Ли Седоля стала делать нелогичные ходы вместо того, чтобы сдаться[58]. После матча Ли Седоль заявил, что был побеждён психологически, но вовсе не технически[59]. Программа показала способность к креативным решениям, что удивило многих игроков (например, ход № 37 во второй партии); некоторые ходы противоречили классической теории го, но в матче доказали свою эффективность, некоторые профессионалы стали использовать эти находки в своих партиях[22]. Чо Хе Ён (9 профессиональный дан) заявила, что она хотела бы учиться игре у AlphaGo, поскольку та «знает всё»[60]. Сам Ли Седоль после матча решил изменить некоторые аспекты своей игры[59]. Комментаторы во время матча сошлись на том, что AlphaGo совершала ошибки, и были уверены, что в конечном итоге ей не хватит территории для победы[22], но в итоге ходы, изначально казавшиеся слабыми, привели к выигрышу[56].

Ключевые моменты партий

Во время партий наблюдатели отметили четыре исключительных хода, повлиявших на исход в партиях; Ли Седоль прокомментировал их в серии статей в издании Шаблон:Нп5[61]:

Первая партия:
Ход, поразивший Ли Седоля.

Шаблон:Goban

Вторжение, ход 102[62].
Вторая партия:
Неожиданный креативный ход программы[63].

Шаблон:Goban

Ход 37, «удар в плечо», отвергающийся классической теорией игры.
Третья партия :
Впечатляющая контратака[56].

Шаблон:Goban

Ход 32 разворачивает атаку в партии.
Четвёртая партия :
«Божественный ход» Ли Седоля.

Шаблон:Goban

После сыгранного тэсудзи (78 ход)
оценка AlphaGo резко изменилась[64].

Первая партия

В первой партии, прошедшей 9 марта, победу одержала AlphaGo (белые). Ли Седоль держал игру под контролем большую часть времени, программа получила преимущество в течение финальных 20 минут, заставив Ли сдаться[62]. После игры Ли заявил, что он допустил критическую ошибку в начале партии, и что стратегия программы на начальной стадии игры была «великолепна», и искусственный интеллект сделал один необычный ход, который никогда бы не сыграл человек[62]. Обозреватель сайта Go Game Guru Дэвид Омерод отметил, что седьмой ход Ли Седоля был «странным ходом, сделанным с целью протестировать силу AlphaGo в фусэки», и что ответный ход программы был «точным и эффективным»; по его оценке, первая часть игры осталась за AlphaGo, а Ли начал отыгрывать преимущество с ходом 81, а затем сделал «сомнительные» ходы 119 и 123, за которыми последовал 129 ход, приведший к поражению[53]. Чо Хансын, комментировавший партию, отметил мощный прогресс AlphaGo по сравнению с матчем против Фань Хуэя в октябре 2015 года[53]. Майкл Редмонд отметил, что стиль программы стал более агрессивным по сравнению с партиями против Фань Хуэя[65].

По мнению Ким Сонрёна (9 профессиональный дан), Ли Седоль был потрясён ходом 102[66], после которого он раздумывал над ответным ходом более 10 минут[66]. Ли Седоль признал своё поражение на 186 ходу, спустя примерно три с половиной часа игры, хотя на часах у него ещё оставался запас времени 28 минут и 28 секунд[66].

Шаблон:Goban

Ходы 1—99

Шаблон:Goban

Ходы 100—186

Вторая партия

Во второй партии, прошедшей 10 марта, AlphaGo победила, играя чёрными. После игры Ли Седоль заявил, что «AlphaGo показала почти что идеальную игру»[67], и что «с самого начала партии он не ощущал ни одного момента, где он бы лидировал»[68]. Один из создателей программы, Демис Хассабис, заявил, что система была уверена в победе с середины игры, когда даже профессионалы, комментировавшие партию, не могли определить, кто был впереди[68].

Майкл Редмонд отметил, что 37 ход программы был «креативным» и «уникальным»[22]. Ли Седолю понадобился необычайно длительный период времени, чтобы ответить на него[22]. Шаблон:Нп5 (8 профессиональный дан) охарактеризовал ход № 37 как «редкий и интригующий удар в плечо», но при этом отметил, что ответный ход Ли был «изысканным». Он заявил, что контроль над партией переходил от одного игрока к другому несколько раз и в особенной степени отметил ходы программы № 151, 157 и 159, назвав их «блестящими»[63].

AlphaGo в этой партии отклонялась от общепринятых норм и продемонстрировала более широкий подход, который профессионалы го охарактеризовали как кажущиеся на первый взгляд ошибки, на самом деле осуществлявшие далеко идущую стратегию[69]. Создатели программы пояснили, что AlphaGo пытается максимизировать не количество очков или величину выигрыша, а вероятность своей победы[22][60]: Если AlphaGo должна выбирать между победой в 20 очков с 80 % вероятностью или победой в 1 очко с 99 % вероятностью, она выберет последнее, даже если ради этого придётся потерять очки[22]. Например, кажется, что ход 167, дающий Ли Седолю шанс на борьбу, расценивался комментаторами как очевидная ошибка; Ан Ёнгиль заявил, что «когда AlphaGo делает ход, выглядящий слабым, мы можем расценить его как ошибку, но, возможно, точнее будет считать такой ход провозглашением победы?»[56].

Шаблон:Goban

Ходы 1—99

Шаблон:Goban

Ходы 100—199

Шаблон:Goban

ходы 200—211

Третья партия

В третьей партии, состоявшейся 12 марта, AlphaGo одержала победу и досрочно выиграла весь матч[70].

После второй партии профессиональные игроки всё ещё выражали свои сомнения в том, является ли AlphaGo настолько сильным игроком, насколько таковым может быть человек. После третьей партии, согласно мнению аналитиков, эти сомнения развеялись, отмечалось мастерство программы в ведении борьбы — при кажущейся суровой атаке Ли Седоля, он не получил преимуществ от этой атаки[56].

Ан Ёнгиль и Дэвид Омерод заявили, что AlphaGo «сильнее любого известного нам игрока-человека»[56]. Выяснилось, что AlphaGo способна управлять ситуацией при ведении ко-борьбы, что ранее считалось значительной слабостью большей части программ, играющих в го, в предыдущих двух партиях важной ко-борьбы на доске не возникало[71]. Также они отметили 148 ход программы — в разгаре сложной ко-борьбы AlphaGo, имея «уверенность» в выигранной борьбе, сделала большой ход в другом месте доски[56].

Ли, играя чёрными, выбрал Высокое китайское фусэки и создал сферу влияния, в которую AlphaGo вторглась на 12 ходу, после чего программа смогла защитить свою слабую вторгшуюся группу[56]. По мнению Ана Ёнгиля, 31 ход Ли возможно стал причиной его поражения[56], Энди Джексон (Американская ассоциация го) решил, что исход партии определился уже на 35 ходу[60]. К 48 ходу AlphaGo завладела контролем над партией и заставила Ли Седоля делать защитные ходы. Контратака Ли на 77-79 ходах не принесла успеха, к 90 ходу программа упростила позицию на доске, после чего заполучила большое количество территории на нижней стороне[56]. Ли вновь попытался провести атаку, но ходы программы оказались безошибочными. На 131 ходу он попытался устроить ко-борьбу, провоцируя программу на ошибку. На 176 ходу Ли Седоль сдался[56].

Шаблон:Goban

Ходы 1—99

Шаблон:Goban

Ходы 100—176 (122 в 113,
154 в Файл:Go wT.svg, 163 в 145, 164 в 151,
166 и 171 в 160, 169 в 145, 175 в Файл:Go bT.svg)

Четвёртая партия

Четвёртая партия, состоявшаяся 13 марта, завершилась победой Ли Седоля. По словам Демиса Хассабиса, программа сделала ошибку на 79 ходу, когда, по её собственным оценкам, вероятность её победы составляла 70 %; на 87 ходу эта величина резко упала[72][73]. Дэвид Омерод охарактеризовал ходы программы с 87 по 101 как типичные ошибки для программы, работающей на основе метода Монте-Карло[64] — поисковой механизм пытается отсечь некоторые последовательности, не относящиеся к конкретной ситуации; в некоторых случаях это может привести к тому, что программа отсекает правильные ходы и уже не может рассматривать их в дальнейшем[64].

В этой партии Ли Седоль выбрал стратегию амаси (территориально-ориентированный стиль, позволяющий противнику занимать ключевые пункты влияния, но при этом сам игрок получает гарантированную территорию, после чего может попытаться развалить влияние противника), решив получать территорию по сторонам, а не по центру, в противовес стратегии AlphaGo, рассчитанной на победу благодаря множеству небольших приобретений[64][74]. Сделав выбор в пользу такой стратегии, Ли Седоль надеялся загнать противника в ситуацию ва-банк, что могло быть вероятным слабым местом программы, чьей силой является оценка размена; при такой ситуации способность AlphaGo к выявлению мельчайших преимуществ не оказывала бы сильного влияние на вероятность победы[64].

Первые 11 ходов были идентичны началу второй партии, где Ли также играл белыми. В стадии фусэки Ли сконцентрировался на получении территории в углах и по сторонам доски, позволив AlphaGo построить влияние на верхней стороне и в центре. После этого Ли вторгся в зону влияния AlphaGo (ходы 40—48), следуя принципам амаси. AlphaGo пожертвовала четыре камня и захватила инициативу (ходы 47—69). В ответ на ходы Ли Седоля с 72 по 76 программа не совершила ошибок, и комментаторы начали заявлять о том, что партия вновь обернётся поражением Ли, тем не менее, 78 ход (являвшийся тэсудзи в данной ситуации) и последовавшая за ним комбинация до 82 хода полностью перевернула исход партии[64]. Ход, позволивший разделить соперника в центре, усложнил игру[75]. Ходы AlphaGo 83 и 85 были приемлемыми, но далее с 87 по 101 ход программа совершила ряд слабых, откровенно плохих ходов. На 92 ходу Ли Седоль захватил лидерство в партии, а ход 105 Ан Ёнгиль описал как окончательный ход, приведший к поражению программы; AlphaGo не смогла отыграть потерянные очки и сдалась после 180 хода[64]. По оценкам AlphaGo, её вероятность победы составляла менее 20 %[75].

Гу Ли (9 профессиональный дан, Китай) назвал 78 ход Ли Седоля «божественным ходом» (в терминологии игры го — особый, единственно верный и гениальный ход, случающийся «раз в жизни», чаще всего в критический момент партии) и отметил, что сам абсолютно не видел этот ход[64]. Ан Ёнгиль заявил, что партия стала «шедевром Ли Седоля и почти определённо станет известной в истории го»[64].

Шаблон:Goban

Ходы 1—99

Шаблон:Goban

Ходы 100—180 (177 в Файл:Go bS.svg, 178 в Файл:Go bT.svg)

Пятая партия

По условиям матча, кто играет чёрными в последней партии, должно было решиться по жребию. Однако на пресс-конференции после четвёртой партии Ли Седоль заявил, что по его мнению AlphaGo сильнее, когда играет белыми, поэтому он желал бы в финальной партии сыграть чёрными, тем более, что он уже выиграл белыми. Представители AlphaGo согласились, поэтому жеребьевка не проводилась[51][52].

В последней партии, сыгранной 15 марта, победителем стала AlphaGo (белые)[76]. До самого конца в этой партии шла равная борьба. Демис Хассабис заявил, что в самом начале программа совершила грубую ошибку, что и привело к такой равной борьбе[76].

Играя чёрными, Ли Седоль, выбрал фусэки, схожее с сыгранным им в первой партии матча, после чего перешёл к территориальной стратегии, приведшей к победе в предыдущей партии. Результат казался равным до ходов с 48 по 58, где AlphaGo, сыграв ненужные форсированные ходы потеряла ко-угрозы и адзи, позволив Ли Седолю захватить лидерство[77]. Майкл Редмонд предположил, что скорее всего программа не увидела известное тэсудзи — опытные игроки чаще всего знают такую комбинацию ходов, но программе её пришлось бы просчитать с самого начала[76].

К 90 ходу, безошибочно ответив на атакующие ходы Ли Седоля, программа восстановила равновесие в партии, после чего сделала ряд ходов, названных Дэвидом Омеродом «необычными… но хитроумно впечатляющими», и позволивших захватить небольшое преимущество[77]. Ли пытался отыграть очки, но программа отвечала безошибочно. Ан Ёнгиль особо отметил ходы 154, 186 и 194. В стадии йосе AlphaGo также сыграла безупречно, оставив за собой лидерство по территории, что заставило Ли Седоля сдаться на 280 ходу[77].

Шаблон:Goban

Ходы 1—99

Шаблон:Goban

Ходы 100—199 (118 в 107, 161 в Файл:Go bS.svg)

Шаблон:Goban

Ходы 200—280 (240 в 200, 271 в Файл:Go bS.svg,
275 в Файл:Go wS.svg, 276 в Файл:Go bT.svg)

Освещение матча

Прямые трансляции партий матча и их разборов велись на корейском, китайском, японском и английском и русском языках. Трансляция на корейском языке шла на канале Baduk TV[78]. Первую партию на китайском языке комментировали Гу Ли и Кэ Цзе для Tencent и LeEco соответственно, трансляции собрали 60 миллионов зрителей[28]. Онлайн-трансляцию матча на английском языке вели Майкл Редмонд и Крис Гарлок, вице-президент Американской ассоциации го; в среднем количество зрителей составляло около 80 тысяч человек; наибольшее количество зрителей зафиксировано в конце 1 первой партии и составило 100 тысяч[79]. Разбор партий на YouTube вели Чо Хе Ён (9 дан) и Ким Мёнван (9 дан)[60]. В России прямые трансляции партий матча с разбором вели 3 профессиональный дан Александр Динерштейн (1 партия)[80][81], Илья Шикшин (1 профессиональный дан) и многократная чемпионка Европы среди женщин Наталья Ковалёва (2—5 партии)[82].

Последствия матча

Разработки в области искусственного интеллекта

Победа AlphaGo стала значительным событием в сфере исследований искусственного интеллекта[83]. Ранее обучение компьютера игре в го считалось недосягаемым для существующих технологий и уровня их развития[83][84][85]. Большая часть экспертов склонялась к тому, что до появления программы уровня силы AlphaGo должно пройти ещё около 5 лет[86], некоторые эксперты полагали, что понадобится даже 10 лет, прежде чем компьютер сможет побеждать чемпионов по го[87][88]. В начале 2016 года большинство прогнозов указывало на победу Ли Седоля[83].

Когда компьютер стал побеждать сильнейших игроков среди людей в шашки, шахматы, а теперь и го, достижения компьютерных программ в сфере популярных настольных игр перестают считаться столь значительным достижением и поворотным пунктом в истории развития искусственного интеллекта по сравнению с предыдущими годами; разработчик Deep Blue Шаблон:Нп5 назвал победу AlphaGo «концом эпохи…, с настольными играми практически покончено, и настало время двигаться дальше»[83]. Разработчики DeepMind заявляли, что рассматривают возможность проведения матча в StarCraft II с участием разработанной ими программы и Тима Мортена, чемпиона по StarCraft II[89][90]. Настольные игры с неполной информацией (покер, бридж) также могут стать объектом исследования возможностей компьютерных программ[91][92].

В сравнении с Deep Blue или Watson, алгоритмы работы AlphaGo рассчитаны на более широкие задачи, это может говорить о том, что прогресс произошёл и в сфере общего развития искусственного интеллекта[93]; победа AlphaGo может стать толчком к развитию программ с более широкими задачами. В марте 2016 года британский исследователь Сьюарт Дж. Рассел заявил, что «методы искусственного интеллекта развиваются гораздо быстрее, чем ожидалось, что делает более актуальным вопрос о долгосрочных результатах», добавив, что «для гарантии того, что все увеличивающие свою мощность системы ИИ оставались бы под полным контролем человека… предстоит совершить много работы»[94]. Физик Стивен Хокинг выступил с предостережением по поводу того, что будущие саморазвивающиеся системы ИИ могут привести к неожиданному Шаблон:Нп5[95], некоторые учёные, в частности Жан-Габриэль Ганазия, заявивший, что «такие вещи, как 'здравый смысл'… никогда не создать», отвергают такой сценарий[96]; Ганазия не видит причин «говорить о страхах. Как раз наоборот, это вселяет надежду во многих сферах, например, в здравоохранении и исследовании космоса»[94]. Шаблон:Нп5 говорит, что «людям не следует бояться… но им нужно обратить внимание на это»[97].

До публикации статьи в журнале Nature в январе 2016 года несколько организаций уже занимались исследованиями нейронных сетей для создания программ, играющих в го, в частности, в Facebook шла разработка программы Шаблон:Нп5, впоследствии код программы был выложен в открытый доступ[98][99]. После матча началось развитие программ — конкурентов AphaGo, среди которых выделяются Deep Zen Go и Fine Art.

Программа Deep Zen Go ранее разрабатывалась под названием Zen, но именно после успеха AlphaGo разработчик добавил в Zen элемент глубокого обучения. В ноябре 2016 года состоялся матч между Deep Zen Go и самым титулованным игроком Японии Тё Тикуном[100][101]. Матч завершился победой человека со счётом 2:1[102].В марте 2017 года состоялся «Турнир четырёх», где сразились сильнейшие игроки Японии, Китая и Кореи (Юта Ияма, Шаблон:Нп5 и Пак Чжон Хван) и Deep Zen Go[103], по итогам матча компьютер выиграл одну партию из трёх (против Юты Иямы)[104][105].

Программа Fine Art разработана китайской компанией Tencent. В марте 2017 года она выиграла чемпионат по го среди программ, в котором, однако, не участвовала AlphaGo; Deep Zen Go заняла второе место. Ранее, в январе 2017, Fine Art смогла несколько раз обыграть сильнейшего игрока в го среди людей Кэ Цзе, который позже сыграл и с AlphaGo, проиграв всухую и сочтя дальнейшие игры с искусственным интеллектом бессмысленными[106].

Го-сообщество

Игра го, ранее считавшаяся сугубо азиатской игрой, не настолько распространённой в странах Запада, получила широкую популярность в различных странах мира благодаря тому, что миллионы людей смотрели и обсуждали ход матча[83]. По словам Демиса Хассабиса, этот матч посмотрело 280 миллионов людей, о нём вышло 35 тысяч статей в прессе, и продажи досок для го возросли в десять раз[107].

Многие из топ-игроков отметили, что ходы сделанные программой, нестандартны; некоторые ходы изначально казались сомнительными, но в течение партии показали свою эффективность[87]. В то время, как игроки стараются изучить и перенимать лучшие ходы из других партий, AlphaGo делает свои собственные оригинальные ходы[83]. AlphaGo значительно усилилась по сравнению с матчем против Фань Хуэя, однако Ли Седоль после своего поражения заявил, что игра программы всё ещё не идеальна[108][109]

Китайский игрок Кэ Цзе, возглавлявший мировой рейтинг игроков, до начала матча заявил, что он способен победить AlphaGo, но не пожелал играть с ней, поскольку программа начала бы «копировать его стиль»[110]. После первых трёх партий матча Кэ Цзе уже признал, что «может проиграть»[111], но после четвёртой партии вновь начал уверено говорить о своей победе, утверждая что если игра программы в четвёртой партии матча — «её истинная сила, то она не заслуживает играть с ним»[112].

Судья матча против Фань Хуэя Тоби Мэннинг и генеральный секретарь Международной федерации го Шаблон:Нп5 заявили о том, что в будущем игроки смогут учиться у компьютера, узнавать, где они совершили ошибки в партии, и совершенствовать свои игровые навыки[109].

После матча Ли Седоль принёс извинения за своё поражение и заявил, что «недооценил способности AlphaGo и чувствовал себя бессильным»[83]. Он особо подчеркнул, что результат матча — «поражение Ли Седоля», а не «поражение человечества»[95][113]. Ли признал, что его проигрыш был неизбежным, но при этом «роботы никогда не поймут красоту игры так, как люди»[95]. Результат в четвёртой партии Ли назвал «бесценной победой, которую он ни на что не променяет»[113]. Ли Седоль заявил, что многому научился, играя с AlphaGo, и его стиль стал более гибким; он понял, насколько слабой может быть человеческая интуиция, а его навык прогнозирования следующих ходов противника существенно усилился[114].

Корейская ассоциация падук присвоила AlphaGo ранг почётного 9 профессионального дана за «искренние усилия в освоении даосских фундаментальных основ го и достижение уровня игры, близкого к божественному»[10].

Правительство Республики Кореи

После завершения матча, 17 марта 2016 года представители правительства Республики Кореи заявили о том, что собираются инвестировать 863 миллиона долларов (1 триллион корейских вон) в исследования в области искусственного интеллекта в течение следующих пяти лет[115]

Организация следующего матча

Шаблон:Main Многие игроки выразили желание стать следующим соперником AlphaGo[116], тем не менее среди наиболее вероятных кандидатов называли Кэ Цзе, который заявлял, что победит программу[117]. Матч с Кэ Цзе состоялся с 23 по 27 мая 2017 года, AlphaGo выиграла все три партии[118][119][120].

Примечания

Шаблон:Примечания

Комментарии

  1. Время зафиксировано в официальных видеозаписях мачта; 2 часа обозначает, что игрок вышел на бёёми.
  2. В пятой партии предполагалось, что выбор цвета будет определяться при помощи нигири, но Ли Седоль попросил сыграть чёрными, поскольку после предыдущей победы, где он играл белыми, он желал попытаться победить и с чёрным цветом, поскольку считал победу чёрными более «ценной». Демис Хассабис согласился на его предложение.

См. также

  • ja:Ponanza — сильнейшая на середину 2010-х годов программа по сёги, аналогичный решающий матч которой с мэйдзином по сёги Шаблон:Нп5 прошёл в рамках 2-го сезона Шаблон:Нп5 в апреле 2017 года.

Ссылки

Статьи

Разборы партий

На русском языке
  • 1 партия — разбор от Александра Динерштейна, 7-кратного Чемпиона Европы по го
  • 2 партия — разбор от Ильи Шикшина, 3-кратного Чемпиона Европы по го и Натальи Ковалёвой, многократной чемпионки Европы среди женщин
  • 3 партия — разбор от Ильи Шикшина и Натальи Ковалёвой
  • 4 партия — разбор от Ильи Шикшина и Натальи Ковалёвой
  • 5 партия — разбор от Ильи Шикшина и Натальи Ковалёвой
Официальные комментарии от Майкла Редмонда (9 профессиональный дан) и Криса Гарлока на канале Google DeepMind в YouTube (на английском языке)
Разборы от Ли Седоля (опубликованы в газете Dong-a Ilbo после матча)
Разборы от Ли Чжэ (6 профессиональный дан)

Шаблон:Го

  1. 1,0 1,1 Шаблон:Cite web
  2. Шаблон:Cite web
  3. Шаблон:Cite web
  4. Шаблон:Cite web
  5. Шаблон:Cite web
  6. 6,0 6,1 Шаблон:Cite web
  7. Шаблон:Cite web
  8. 8,0 8,1 8,2 Шаблон:Cite news
  9. 9,0 9,1 9,2 Шаблон:Cite web
  10. 10,0 10,1 Шаблон:Cite web
  11. Шаблон:Cite web
  12. Шаблон:Cite web
  13. Шаблон:Статья
  14. Шаблон:Cite web
  15. 15,0 15,1 15,2 15,3 15,4 Шаблон:Статья
  16. Шаблон:Cite web
  17. Шаблон:Cite web
  18. Шаблон:Cite web
  19. Шаблон:Cite web
  20. Шаблон:Cite web
  21. Шаблон:Cite web
  22. 22,0 22,1 22,2 22,3 22,4 22,5 22,6 22,7 Шаблон:Cite web
  23. Шаблон:Cite web
  24. 24,0 24,1 24,2 Шаблон:Citation Шаблон:Wayback
  25. 25,0 25,1 Шаблон:Статья
  26. Шаблон:Cite web
  27. Шаблон:Cite web
  28. 28,0 28,1 Шаблон:Cite web
  29. Шаблон:Cite web
  30. Шаблон:Cite web
  31. Шаблон:Cite web
  32. Шаблон:Cite web
  33. Шаблон:Cite web
  34. Lee SeDol Шаблон:Wayback. gobase.org. accessed 22 June 2010.
  35. Шаблон:Cite web
  36. Шаблон:Cite web
  37. 37,0 37,1 Шаблон:Cite web
  38. Шаблон:Cite web
  39. Шаблон:Cite web
  40. Шаблон:Cite web
  41. Шаблон:Cite web
  42. Шаблон:Cite web
  43. Шаблон:Cite web.
  44. Шаблон:Cite web
  45. Шаблон:Cite web
  46. Шаблон:Cite web
  47. Шаблон:Cite web
  48. Шаблон:Cite web
  49. Шаблон:Cite web.
  50. Шаблон:Cite web.
  51. 51,0 51,1 Шаблон:Cite web
  52. 52,0 52,1 Шаблон:Cite web
  53. 53,0 53,1 53,2 Шаблон:Cite web
  54. Шаблон:Cite web
  55. Шаблон:Cite web
  56. 56,00 56,01 56,02 56,03 56,04 56,05 56,06 56,07 56,08 56,09 56,10 Шаблон:Cite web
  57. Шаблон:Cite web
  58. Шаблон:Cite web
  59. 59,0 59,1 Шаблон:Cite web
  60. 60,0 60,1 60,2 60,3 Шаблон:Cite web
  61. Первая партия: Шаблон:Cite web
    Вторая партия:Шаблон:Cite web
    Третья партия: Шаблон:Cite web
    Четвёртая партия: Шаблон:Cite web
    Пятая партия: Шаблон:Cite web
  62. 62,0 62,1 62,2 Шаблон:Cite news
  63. 63,0 63,1 Шаблон:Cite web.
  64. 64,0 64,1 64,2 64,3 64,4 64,5 64,6 64,7 64,8 Шаблон:Cite web
  65. Шаблон:Статья
  66. 66,0 66,1 66,2 Шаблон:Cite web
  67. Шаблон:Cite news
  68. 68,0 68,1 Шаблон:Cite web
  69. Шаблон:Cite news
  70. Шаблон:Cite news
  71. Шаблон:Cite web
  72. Шаблон:Cite web
  73. Шаблон:Cite web
  74. Шаблон:Cite web
  75. 75,0 75,1 Шаблон:Cite web
  76. 76,0 76,1 76,2 Шаблон:Cite web
  77. 77,0 77,1 77,2 Шаблон:Citation Шаблон:Wayback
  78. Шаблон:Cite web
  79. Шаблон:Cite web
  80. Шаблон:Cite web
  81. Шаблон:Cite web
  82. 2 партия: Шаблон:Cite web
    3 партия: Шаблон:Cite web
    4 партия: Шаблон:Cite web
    5 партия: Шаблон:Cite web
  83. 83,0 83,1 83,2 83,3 83,4 83,5 83,6 Шаблон:Cite news
  84. Шаблон:Cite news
  85. Шаблон:Cite news
  86. Шаблон:Cite news
  87. 87,0 87,1 Шаблон:Cite news
  88. Шаблон:Cite news
  89. Шаблон:Cite web
  90. Шаблон:Cite web
  91. Шаблон:Cite web
  92. Шаблон:Cite web
  93. Шаблон:Cite news
  94. 94,0 94,1 Шаблон:Cite news
  95. 95,0 95,1 95,2 Шаблон:Cite news
  96. Шаблон:Cite news
  97. Шаблон:Cite news
  98. Шаблон:Cite web
  99. Шаблон:Cite web
  100. Шаблон:Cite web
  101. Шаблон:Cite web
  102. Шаблон:Cite web
  103. Шаблон:Cite web
  104. Шаблон:Cite web
  105. Шаблон:Cite web
  106. Шаблон:Cite web
  107. Шаблон:YouTube
  108. Шаблон:Cite news
  109. 109,0 109,1 Шаблон:Статья
  110. Шаблон:Cite news
  111. Шаблон:Cite web
  112. Шаблон:Cite web
  113. 113,0 113,1 Шаблон:Cite news
  114. Шаблон:Cite web
  115. Шаблон:Cite web
  116. Шаблон:Cite web
  117. Шаблон:Cite web
  118. Шаблон:Cite web
  119. Шаблон:Cite web
  120. Шаблон:Cite web