Главная Вводить Новшества Google Artificial Intelligence 'Alpha Go Zero' только что нажал кнопку сброса о том, как учиться

Google Artificial Intelligence 'Alpha Go Zero' только что нажал кнопку сброса о том, как учиться

Ваш гороскоп на завтра

Помните (смутно), как вы научились ходить, говорить, ездить на велосипеде или водить машину? Это было беспорядочно и полно ошибок, но навыки, которым вы научились таким образом, остались. За пределами живых систем было сложно структурировать достаточно сильные алгоритмы, чтобы учесть «реальный жизненный опыт» и развить липкое, адаптируемое поведение для искусственного интеллекта.

Что ж, Alpha Go Zero просто сделала это.

«Он начинается с чистого листа и выясняется только для себя, только из игры с самим собой, и без каких-либо человеческих знаний или каких-либо человеческих данных, или функций, или примеров, или вмешательства людей. Он открывает, как играть в го, исходя из первых принципов, - говорит профессор DeepMind Дэвид Сильвер.

У ИИ было несколько итераций, каждая из которых умнее и способнее предыдущей. В предыдущей версии использовалась огромная база данных предыдущих игр, а также множество алгоритмов, которые указывали на победу. Такой подход привел к поражению действующего чемпиона мира профессионального игрока в го. В покере AI Libratus недавно обошел лучших игроков в покер почти на 2 миллиона долларов, также обучаясь самостоятельно, а не на игровых данных человека.

Дэйв Наварро собственный капитал 2015

Теперь, в этой последней версии Alpha Go, программа искусственного интеллекта учила сам как играть в го - без человеческого фона.

Запустив миллионы игровых симуляторов против самого себя, ему потребовалось 40 дней, чтобы научиться - с нуля - как превзойти самого себя по версии чемпиона мира. Это действительно меняет правила игры не только для го, но и для открытия новых знаний. Насколько точны или полны ваши знания в предметной области? Есть много Чтобы узнать больше, об этом говорит нам этот увлекательный эксперимент по обучению с Alpha Go Zero.

«Идея Alpha Go состоит не в том, чтобы побеждать людей, а в том, чтобы на самом деле открыть, что значит заниматься наукой - чтобы программа могла узнать от самой себя, что такое знания», - говорится в сообщении Сильвера на YouTube о достижение.

Команда Alpha Go Zero Deep Mind называет это обучением из первых принципов, «tabula rasa» (чистый лист).

'Если ты сможешь добиться чистая доска обучения, у вас есть агент, которого можно перенести из игры Go в любую другую область, и, учитывая особенности игры, в которой вы участвуете, вы придумываете алгоритм, который настолько универсален, что его можно применять где угодно '', - говорит он. . Это провокационная идея, если расширить концепцию. Только подумайте, что мы могли бы сделать с набором сильных обучающихся алгоритмов, которые могли бы систематически решать сложные проблемы и учиться быстрее, чем коллективные знания нашей цивилизации. . . в дни, а не десятилетия.

чарльз краутхаммер фокс новости зарплата

На данный момент главный вывод заключается в том, что «алгоритмы имеют гораздо большее значение, чем вычисления или доступные данные», - сказал Сильвер. Уже одно это меняет правила игры в нашем подходе к расширению известного мира. Хотя Alpha Go работает на аппаратном обеспечении на сумму около 25 миллионов долларов - это не совсем легкая система, - вы знаете, что гуру искусственного интеллекта давно работают над созданием более чистых и лучших наборов данных. Сегодня многие наборы больших данных считаются слишком шумными - полными плохих данных - для точного обучения искусственного интеллекта. Если ИИ учится на данных, а данные плохие, он не учится. Большая проблема.

Что, если вам нужны не чистые данные, а просто опыт, а искусственный интеллект сможет обучаться?

Это захватывающее достижение в Alpha Go Zero. Несмотря на то, что это нишевый мир игр, основанный на правилах, он имеет большое значение для каждой отрасли, основанной на физических правилах, - например, в химии, дорожном движении, биологии, фармакологии, путешествиях, логистике и производстве. Если мы сможем разработать правила настолько гибкие, что они могут работать на основе более широкого опыта, и настолько направленные, что они всегда будут создавать более сильные навыки - например, Alpha Go Zero - тогда можно создать искусственный интеллект, который вдохновляет системы. Эти системы не будут нуждаться в внешних данных, не будут иметь проблем с очисткой данных и не будут нуждаться в замедлении работы оператора. Отчасти поэтому Alphabet, материнская компания Google, сделала ставку на искусственный интеллект и быстро инвестирует в него. (Amazon также инвестирует в искусственный интеллект, например, в свое последнее приобретение AI BodyLabs.)

эмбер наджм т-пейн

Профессор Deep Mind Дэвид Сильвер говорит: «Тот факт, что мы видели, как программа достигла высокого уровня производительности ... должен означать, что теперь мы можем начать решать некоторые из самых сложных и важных проблем для человечества».

Этот пост был обновлен, чтобы уточнить, что AI Libratus недавно победил лучших игроков в покер, используя стратегию, предполагающую самостоятельную игру, а не вводимые человеком данные.