Tag Archives: шлубокое обучение в нейронных сетях

За кого болеть

игра ГоНовость о том, что компьютерная программа победила чемпиона Европы по Го, облетела интернет, наделала много шума и уже вызвала оскомину у многих, в том числе и у игроков в Го. Я хотел бы посмотреть на один аспект этой истории.

В игре Го существуют как любительские так и профессиональные даны. Так, у любителей даны от 1 (слабее) до 10 дана (самый сильный), и есть приблизительная корреляция: 6 любительский дан равен 1 профессиональному дану. Некоторые программы с искусственным интеллектом (ИИ, для краткости) уже несколько лет успешно сражаются с первыми любительскими данами.

Fan Hui Китаец Фан Хуй (Fan Hui), на фото слева, которого и выиграла программа AlphaGo в матче из 5 партий, обладает 2 профессиональным данном. Выиграла, как оказывается еще в октябре 2015 года, но новость задержалась, чтобы быть одновременно опубликованной со статьей в журнале Nature.

Lee SedolТеперь в марте программа будет играть с корейцем Ли Седолом (Lee Sedol). Ли, га фото слева, – корейский профессионал, в марте ему исполнится, 33 года, и он обладает 9 профессиональным данном. Те, кто играл в Го, понимают, что разница между данами подобна пропасти. Ты играешь и тебе кажется, что ты вообще не понимаешь, что происходит на доске : все вроде неплохо, ровно перед тем моментом, когда понимаешь, что тебя просто порвали как грелку.

В общем, программе придется «попотеть», чтобы одолеть Ли Седола. Однако
Демис Хассабис (Demis Hassabis), основатель компании DeepMind, которая и разработала AlphaGo, чувствует себя уверено (Gibney, 2016).

Вот что любопытно: Ник Бостром в книге Superintelligence писал (Bostrom, 2014, стр. 34) что компьютерные программы достигают успеха в игре Го со скоростью около 1 дана в год, и если так пойдет, то программы смогут победить самого сильного профессионала приблизительно через 10 лет. Если эта информация на момент печати была корректна, то это должно произойти в 2024 году.

Я помню дискуссии много лет назад, когда DeepBlue одолела Каспарова: тогда говорили, что победа над шахматами – это конечно круто, но одолеть Го не получится – эта игра обладает куда большей вариабельностью в ходах. Потом стали появляться однако неплохие коммерческие программы, которые становились сильнее с каждым годом. Но тем не менее, прорыва не было – до тех порю пока вот не использовали самообучение ИИ в виде deep learning (глубокого обучения в нейронных сетях).

Если программа выиграет и Ли Седола, считающегося одним из самых сильных игроков, то целый ряд оценок развития ИИ нужно будет значительно корректировать, приближая даты их реализации.

Deep learning как подход в развитии ИИ оказывается невероятно успешным. Пока есть проблема с переносом умения или интеллекта из одной области в другую – так, победа в Го пока будет означать только победу в игре. Когда станет возможным автоматический перенос на новые задачи, то мы увидим нечто невероятное во всех сферах нашей жизни, причем в считанные дни. И есть ощущение, что как-то это все слишком быстро развивается, и мы как бы не особо готовы к таким переменам.

Хотелось бы, чтобы они сделали трансляцию, потому что такой матч стоит посмотреть. Мы должны болеть за человека! :)

Update от 30 января 2016:

Как пишет корейское СМИ dongA.com (источник) Ли Седол рад, что его выбрали соревноваться с машиной. Он уверен, что победит ИИ со счетом 5:0 или в крайнем случае, 4:1, и отметил, что через пару лет, если его пригласят на реванш, победить будет непросто.  Победитель, кстати, получит денежный приз в размере 1 миллион долларов. Если победит ИИ, то все деньги будут направлены на его дальнейшее развитие.

Gibney, E. (2016). Google AI algorithm masters ancient game of Go, Nature, 27 Jan 2016. Ссылка.

Bostrom, N. (2014). Superintelligence : paths, dangers, strategies (First edition. ed.). Oxford University Press: Oxford (UK).