Дебютный репертуар AlphaZero


Вниманию серпуховских маэстро предлагается перевод 14 главы из книги Мэтью Сандлера и Наташи Реган «Game Changer» («Всё меняется»). Книга посвящена анализу партий нейронного компьютера AlhpaZero и компьютерной программы StockFish и тем революционным изменениям в шахматах, которые привнёс в них искусственный интеллект.

Дебютный репертуар AlphaZero

Дебютный репертуар AlphaZero разработан им самим и направлен на получение таких позиций, которые ему нравятся и которые он хорошо понимает. Мы сравнили подход лучших шахматистов к построению дебютного репертуара с подходом AlphaZero. Мы рассмотрели дебютные предпочтения AlphaZero.

Раздел А – Современный подход к разработке дебютного репертуара

Стандартный подход топовых игроков заключается в создании узкого, хорошо проработанный репертуара черными и широких вариациях белыми. С помощью мощных компьютерных программ стало значительно легче нейтрализовать игру белым цветом, чем победить играющего чёрными (другими словами, легче разрушать чем создавать). В турниры высшего уровня ничья черными считается положительным результатом, но такой эффективный подход к игре черными базируется на небольшом выборе линий для глубокого анализа в котором все возможные подводные камни должны быть предвидены. В противовес этому белые могут использовать два вида оружия: 1. Разнообразие вариантов и 2. Порядок ходов.

1.Разнообразие вариантов

В отличие от практики 20-летней давности, когда сильнейшие игроки специализировались в одном первом ходе, в настоящее время все топовые игроки имеют в своём репертуаре четыре основных первых хода – 1.d4, 1.е4, 1.♘c3 в 1.с4. Это ставит перед играющим чёрными игроком практическую проблему с точки зрения памяти, запомнить четыре варианта глубоких анализов наиболее сильнейших ходов для каждой конкретной игры требует огромного напряжения. Кроме того, играющие белыми палатки применяют много различных вариантов против основных дебютов. Например, Магнуса Карлсен, который при помощи своей феноменальной техники реализует небольшие стойкие преимущества в безобидных на вид системах при игре белыми. Играющие белыми используют компьютерные движки для глубокого анализа таких систем, чтобы найти скрытые тактические возможности и поймать неосторожно играющих черным цветом.

2. Порядок ходов

Особенностью дебютов ферзевой пешки заключается в том, что нужная позиция может быть достигнута начиная с 1.♘f3 или даже 1.с4 на первом ходу. Это дает белым много возможностей запутать черных, просто меняя порядок первых трех ходов. В результате белые могут в конечном итоге играть по основной линии, уклоняясь от конкретных боковых вариантов защиты, которые намеревались использовать черные. Даже, когда стандартная теоретическая позиция в конце концов достигнута, черные будут тратить время, пытаясь разгадать намерения белых и свернуть с основной линии. Такие трюки с порядком ходов расширяют количество дебютных вариантов которые  черные должны освоить, что увеличивает вероятность ошибок в запоминании, быстрого расхода времени и ошибок в дальнейшей игре. Недостатком этого гибкого подхода является то, что он белые готовятся играть 1.d4 системы в которых белый конь выходит на поле f3. Это сужает дебютные возможности белых в которых откладывается вывод коня на f3 для получения острых атакующих позиций. Вариант Земиша в Староиндийской защите, рассматриваемый в следующей главе и система атаки центра Ботвинника в Карлсбадском варианте Отказанного ферзевого гамбита, рассматриваемая в главе о Карлсбадском варианте, являются двумя примерами. Однако, с точки зрения долгосрочной перспективы, гибкость, полученная в первых трех ходах, стоит больше, чем возможность использовать самые острые варианты против определенных дебютов. В своей карьере вы будете сталкиваться с периодами в которых в основных вариантах таких дебютах как Защита Нимцовича или Защита Грюнфельда, которые постоянно встречаются на высшем уровне, вы не сможете найти преимущество белых. В таких случаях, игрок с гибким дебютным репертуаром вместо того, чтобы просто повторять основную линию не долго после того, как устраиваются в голове от стерильной позиции, может варьировать дебютные ходы и заставить противника пойти на незнакомый вариант. Такой порядок ходов может продолжаться до тех пор, пока не придет вдохновение (либо к вам, либо к другому игроку!) и ваши основные варианты снова станут использоваться в шахматных партиях.

Раздел B – Как AlphaZero разработал свой дебютный репертуар

Интересно сравнивать дебютные предпочтения AlphaZero. Черными AlphaZero чётко ограничивает свой дебютный репертуар встречая 1.e4 неизменно 1…e5 – самый популярный выбор на высшем уровне – на 1.d4 отвечает 1…♘f6 2.е6 с4, переходя в Защиту Нимцовича после 3.♘c3 ♗b4 или в защиту Рагозина после 3.♘f3 d5 4.♘c3 ♗b4. Белыми он предпочитает дебюты с 1.d4 где конь выходит исключительно на f3. Он также довольно часто начинает партию 1.♘f3, хотя эти партии часто переносят стандартным дебютам с 1.d4, он также c некоторой регулярностью применяет антинимцовича и антистароиндийский порядок ходов 1.♘f3 ♘f6 2.c4 e6 3.♘c3♗b4 4.♕c2.

Антинимцовича и антистароиндийский порядок ходов

В этом варианте белые получают пару слонов после последующих …♗xc3, ♕xc3 — типичных для Нимцо-индейцев – но без занятия центра пешкой d. AlphaZero добивался  большого успеха держа свои пешки на d3 и e3, и размещая своего чернопольного слона на большой диагонали с b2-d4 и ♗b2: есть несколько фантастических примеров игры с такой структурой.

По-видимому, дебютный репертуар AlphaZero в целом соответствует выбору лучших мировых игроков, хотя заметное нежелание играть 1.e4 не позволяет полностью отнести его к дебютному выбору современных шахматистов!

Раздел C —  Дебюты AlphaZero  

Игра AlphaZero в дебюте может быть охарактеризована как классическая и сдержанная. AlphaZero любит делать первые дебютные ходы движения захватывая пространство в центре, развиваясь естественным образом. Однако в миттельшпиле желание открыть линии и диагонали, атаковать позицию соперника существенно добавляет остроты его дебютным построениям. Играя белыми AlphaZero более охотно отказывается от солидных построений и обостряют игру, ослабляя позицию короля противника, его пешечное прикрытие.

I.Выбор AlphaZero за чёрных

В нашей подборке из 30 партий сыгранных AlphaZero черными на 1.е4 он 26 раз подряд отвечал 1…е5.

1.e4 е5

Это был Берлинский вариант Испанской партии (2.♘c3 ♘c6 3.♗b5 ♘f6).

Выбор SF Количество партий Победы SF Ничьи Победы AZ
4.0-0 12 2 7 3
4.d3 5 0 5 0
4.Bxc6 1 0 1 0
Всего 18 2 13 3

4.0-0 ведет к известному эндшпилю в Берлинской варианте после 4…♘xe4 5.d4 ♘6 6.♗xc6 dxc6 7.dxe5 ♘f58.♕xd8+♔xd8 который AlphaZerо играет очень хорошо.

Берлинский эндшпиль

На самом деле, оба его поражения были результатом подавления его возможностей. Чем того, что его переиграли, тогда как его победа была примером потрясающей стратегической игры («Класс игры в эндшпиле»). Stockfish часто выборал 4.d3, за которым следовало 5.♗xc6 приведшее к очень интересным играм. Я чувствовал, что эти позиции AlphaZero понимает хорошо.

Медленный Берлин

1.е4 е5 2.♘f3 ♘c6 3.♗b5 ♘f6 4.d3 ♗c5 5.♗xc6 dxc6 6.c3♗d6 7.0-0 ♗e6 8.b3 h6 9.♘bd2  ♘d7

Фиксированный центр вокруг которого AlphaZero может маневрировать своими конями, открытие линии для его фигур и даже возможность длинной рокировки с надвижением пешек королевского фланга: всё о чём AlphaZero может мечтать! Stockfish показал отличную игру в защите этих позиций, чтобы завершить пять партий вничью.

Другой выбор Stockfish был 1.e4 e5 2.♘f3 ♘с6 3.♗с4 который привел к острым партиям и двум победам AlphaZero:

Выбор AZ Количество партий Победы SF Ничьи Победы AZ
3…Bc5 6 0 5 1
3…Nf6 2 0 1 1
Всего 8 0 6 2

И снова АlphaZero был тем кто задавал темп в этих играх. Одним из примечательных моментов было то, что после 3…♗c5 4.d3 AlphaZero делал выбор между двуья странными ходами – 4…a6 и 4…d6 – решив защищать пешку f7 после 5.♘g5 двумя креативнами способами: 5…♘h6 и 5…♕f6 (контратакуя оле f2) с последующим …♘d8. Это было немного странно, но 5…♘h6 в исполнении AlphaZero был прелюдией к нескольким атакующим играм!

Stockfish пробовал 1.d4 и 1.♘f3 всего четыре раза в этом выборе игр a выбор AlphaZero был немного странным. В одной из партий АlphaZero применил Защиту Рагозина (1.♘f3 d5 2.d4 ♘f6 3.c4 e6 4.♘c3 ♗b4), что кажется мне вполне правильным: солидный дебют с крепким центром и возможностью обострения позиции (4…♗b4 более активный ход, чем классический 4…♗e7).

Защита Рагозина

1.d4 ♘f6 2.c4 e6 3.♘f3 d5 4.♘с3 ♗b4

Действительно, когда я запросил серию игр в которых Stockfish должен был играть 1.d4 это был обоюдный выбор. Однако этот выбор не был на 100% последовательным. AlphaZero также пробовал играть Славянскую защиту (1.d4 d5 2.c4 c6) и даже намекнул на попытку сыграть Индийскую защиту после 1.d4 ♘f6 2.♘f3 g6, что выглядело нехарактерно для его стиля: недостаток пространства и угроза атаки на королевском фланге – постоянные риски для играющего Индийскую защиту! На самом деле, как я позже заметил, когда просмотрел дальше дебютные ходы АlphaZero как Stockfish предпочитает позиции в духе Защиты Грюнфельда (играя …d7-d5 после 1…♘f6 и 2…g6), что обеспечивает больше открытых линий и предоставляет возможность для активной игры. Это выглядит более подходящим для его стиля игры Когда я заставлял Stockfish играть 1.c4, АlphaZero неизменно отвечал 1…e5, что кажется мне вполне логичным: АlphaZero старается захватить как можно больше пространства.

II. Выбор АlphaZero за белых

Дебютный AlphaZero белыми базируется на главных линиях после 1.d4, хотя иногда он играл и 1.♘f3.

Выбор AZ Количество ходов Победы SF Ничьи ПобедыAZ
1.Nf3 23 0 11 12
1.d4 57 1 38 18
Всего 80 1 49 30

Единственное поражение AlphaZero было связано с тем, что его искусственно принудили к игре в ничейном положении

Without being churlish, the one loss here что due to alpha Zero over Pressing in a drawn положение. Обычно 1.♘f3 обычно трансформировались в варианты с 1.d4, но несколько игр приводили к позициям английского типа:

Позиция английского типа после 1.f3

1.♘f3 ♘f6 2.c4 e6 3.♘c3♗b4 4.♕с2

Выбор AZ Количество игр Победы SF Ничьи Победы AZ
4.Qc2 11 0 6 5

Тип позиции в которых белые в итоге остаются с преимуществом двух слонов без существенных слабостей в пешечной структуре подходят AlphaZero лучше всего. Это вызвано желанием избежать ранних ослаблений пешечной структуры также отражается в основном ответе на 1.d4 Stockfish: 1…♘f6 с последующим 2…e6.

1.d4 f6 2.c4 e6

1.d4 ♘f6 2.c4 e6

Для удобства изложения я буду считать игры начинающиеся с 1.d4♘f6 2.c4 e6 3.♘f3 также как и начинающиеся с 1.d4♘f6 2.♘f3 e6 3.с4.

Выбор AZ Количество игр Победы SF Ничьи Победы AZ
3.Nf3 37 1 24 12
4.Nc3 12 0 9 3
4.g3 4 0 2 2
Всего 53 1 35 17

В случае 3.♘f3 (или 3.g3) черные не имеют возможности связать коня на c3 …♗b4 (что черные делают в случае 3.♘c3) и таким образом не имеют никакого шанса сдвоить белые пешки …♗xc3+. Я действительно был поражен количеством игр в которыхАlphaZero играл 3.♘с3 ♗b4.

Защита Нимцовича

1.d4♘f6 2.c4 e6 3.♘с3 ♗b4

Я никогда не видел AlphaZero охотно позволял создавать слабости на ферзевом фланге в миттельшпиле (только на королевском для открытия линий против позиции короля Stockfish). Я мог бы также предположить, что он сыграет 4.♕с2 предотвращая возможность сдваивания пешек, но не в этом случае:

Выбор AZ Количество игр Победы SF Ничьи Победы AZ
4.e3 6 0 5 1
4.Nf3 4 0 3 1
Всего 10 0 8 2

При разыгрывании Новоиндийской защиты после 3.♘f3 b6 АlphaZero неизменно играет 4.g3:

Новоиндийская защита

1.d4 ♘f6 2.♘f3 e6 3.c4 b6 4.g3

Этот солидный вариант избегает создания пешечных слабостей на ферзевом фланге, нейтрализует белопольного слона черных на диагонали a8-h1, укрепляет позицию белого короля и подготовливает рокировку короля в безопасное место. Конечно, как мы уже видели, AlphaZero очень успешно удается оживить эту прочную позицию с помощью раннего продвиженияwith d4-d5 с жертвой пешки и продвижения ладейной пешки (h4-h5-h6). Это один из вариантов, который AlphaZero играет наиболее впечатляюще:

Выбор AZ Количество партий Победы SF Ничьи Победы AZ
4.g3 31 0 20 11

Репертуар AlphaZero против основных вариантов Stockfish — Славянская защита. Это хорошая иллюстрация того, что не боится отказываться от солидных построенийAlphaZero not being afraid to abandon its solid shell if it feels ther если чувствует, что может получить преимущество в миттельшпиле. Здесь нет ничего солидного: АlphaZero последовательно играет самые острые и сложные варианты: Вариант Ботвинника и Московский вариант.

Славянская защита

1.d4 d5 2.c4 c6 3.♘f♘f6 4.♘c3 e6 5.♗g5

Выбор SF Количество партий Победы SF Ничьи Победы AZ
5…Be7 5 1 2 2
5…Nbd7 1 0 1 0
5…h6 1 0 0 1
5…dxc4 1 0 0 1
Всего 8 1 3 4

Как вы можете видеть Stockfish в основном предпочитает «скучный» 5…♗e7, но против 5… dxc4 обе стороны избирали острейший вариант Ботвинника и следовали теории до 19 хода:

Бросая вызов Ботвиннику

AlphaZero Stockfish 8

Лондон 2018

1.d4 d5 2.c4 e6 3.♘c3 c6 4.♘f3 ♘f6 5.♗g5 dxc4 6.e4 b5 7.e5 h6 8.♗h4 g5 9.♘xg5 hxg5 10.♗xg5 ♘bd7 11.g3 ♖g8 12.h4 ♖xg5 13.hxg5 ♘d5 14.g6 fxg6 15.♕g4 ♕e7 16.♗g2 ♘7b6 17.♕xg6+ ♕f7 18.♕xf7+ ♔xf7 19.♘e4

19…♗g7 Это выглядит новинкой со стороны Stockfish, но не меняет оценки позиции. У белых более комфортная позиция. 20.f4 ♔f8 21.♔f2 a5 22.g4 ♖a7 23.♘d6 ♖d7 24.♘xc8 ♘xc8 25.♗xd5♖xd5 26.f5 ♘b6 27.f6

27…xd4 28.g5 d2+ 29.e3 d5 30.f4 d4+ 31.e3 d5 32.f4 d4+ 33.f3 d7 34.h7 xe5+ 35.e3 d3+ 36.f4 d7 37.xg7 d3+ 38.Е4 c5+ 39.e5 d3+ 40.Е4 С5+ 41.f3 xg7 42.fxg7+ xg7 43.e1 b4 44.Е2 f7 45.с2 d7 46.Е4 С5 47.xc4 g6 48.f4  1-0

Другим дебютом, который я протестировал с АlphaZero была Защита Грюнсфельда. AlphaZero тяготел к солидному продолжению со 7.♗e3:

Грюнфельд соe3

1.d4 ♘f6 2.c4 g6 3.♘c3 d5 4.cxd5 ♘xd5 5.е4 ♘xc3 6.bxc3 ♗g7 7.♘f3 c5 8.♗e3

Это продолжение предпочитают такие игроки как Крамник, и, как мы видим на протяжении всей книги, AlphaZero сыграл несколько замечательных игр в этом варианте.

Историческая параллель

Шахматист с железной логикой Михаил Ботвинник Михаил Ботвинник стал чемпионом мира в 1948 году и продолжал бороться за мировое первенство вплоть до 1963 года, дважды теряя и возвращая. Игра AlphaZero очень сильно напоминает мне подход Ботвинника к игре белым цветом. Ботвинник любил фиксировать центр в начале игры, предотвращая контратаку цента черными и переводил игру на фланги. Ботвинник чувствовал, что белые имеют преимущество в такой борьбе и не в последнюю очередь благодаря праву первого хода. В главе «Карлсбад» мы рассмотрим его любимую систему в отказанном ферзевом гамбите, а также два других дебюта с фиксированным центром в которых Ботвинник добивался больших успехов. Во-первых, разменный вариант Славянской защиты:

Разменный вариант Славянской защиты

1.d4 d5 2.с4 с6 3.cxd5 cxd5


Как и AlphaZero экс-чемпион мира Михаил Ботвинник любил в начале игры фиксировать центр и играть на флангах

Во-вторых, запатентованная структура Ботвинника в английском начале: система Ботвинника.

Система Ботвинника

1.c4 e5 2.♘c3 ♘c6 3.g3 g6 4.♗g2 ♗g7 5.e4

Следующая партия Ботвинника, сыгранная им еще в молодости, лучше всяких слов показывает стиль и философию Ботвинника: пространственное преимущество, неподвижный центр лишающий противника всякой контригры, атака на флангах и размен активных фигур противника. Я это видел, AlphaZero играет именно так! Это также  напомнает партию Аронян — Воробьев (сыгранной гораздо позже) из главы «Марш ладейной пешки».

Михаил Ботвинник — Хрисогон Холодкевич

Москва чемпионат СССР 1927

1.d4 ♘f6 2.c4 g6 3.♘c3 ♗g7 4.e4 d6 5.g3 0-0 6.♗g2 ♘bd7 7.♘ge2 c5 8.0-0 cxd4 9.♘xd4  Ботвинник стремился достичь подобной структуры во многих дебютах. Пешки на c4 и e4 мешают прорыву черных в центре с помощью …d6-d5. 9…♘e5 10.b3 ♗d7 11.♗b2 ♘c6 и теперь Ботвинник проводит план, который он считал типичным способом победить в таких структурах. 12.♘d5 ♘xd5 13.exd5 ♘xd4 14.♗xd4 b5 15.♗xg7 ♔xg7 16.♕d4+ ♔g8 17.cxb5

Ключевой момент плана Ботвинника и далеко не очевидная идея. Белая пешка на d5 не требует поддержки пешки c4, чтобы выполнить свою функцию связывания пешки e7. 17.cxb5 обеспечивает преимущество на ферзевом фланге и дает белым прекрасную возможность завершить игру либо на ферзевом фланге (как и произошло в этой партии), либо на королевском фланге (посредством продвижения ладейной пешки, как это сделал Аронян). 17…♗xb5 18.♖fe1 ♕d7 19.♖e3 f5 20.a4 ♗a6 21.♖ae1 Связывая фигуры черных защитой слабой пешки е7. Превосходство белых очевидно на всей доске. 21…♖f7 22.b4 ♗b7 23.b5 a6 24.b6 ♖c8 25.a5 ♖c5 26.♖c3

Отличная игра. У противника были разменяны все активные фигуры и оставлены пассивные. 26…xc3 27.xc3f8 28.e3 e8 29.с1с8 30.xc8+ xc8 31.e6+ xe6 32.dxe6 g7 33.b7 xb7 34.xb7 f6 35.xa6 xe6 36.c8+  1-0

Вывод

Однажды я заметил английскому гроссмейстеру Марку Хебдену известному своими необычными и удивительно хорошо проработанными дебютными схемами, что я боюсь того дня, когда компьютеры докажут, что его дебюты были лучшими с самого начала! «Откуда ты знаешь, что я не тот компьютер?» — таков был его ответ! Однако это еще не так и разработанный AlphaZero репертуар с 1.d4 — это обновленный и усиленный классический. Говоря как шахматист всю жизнь играющий 1.d4, я думаю, что репертуар AlphaZero с 1.d4 выглядит как идеальный репертуар, включающий в себя солидность, гибкость и развитие с потенциалом обострения, когда это потребуется.