Не рассуждайте. Не уступайте экспертам. Ищите сами.

Любой вопрос о будущем подвержен неизвестному, неизвестному, бесполезным размышлениям о неизведанных вещах. Нам нужны примеры, которые мы можем наблюдать и исследовать сейчас. Хотя у нас нет сильного ИИ, у нас есть четкие примеры слабого и сильного интеллекта. Сравнение природы знания в его слабой и сильной формах предлагает проницательный и нетехнический взгляд на перспективы сильного ИИ.

Наша последняя остановка в этом путешествии по ландшафту искусственного интеллекта представила индукцию как преобладающую теорию создания знаний и центральную роль, которую объяснения играют в работоспособных индуктивных системах. Здесь я применим эту концепцию, чтобы пролить свет на одну из самых спорных и важных дискуссий в области ИИ: находимся ли мы на пути к общему искусственному интеллекту? Является ли завтрашний сильный ИИ неизбежным продолжением более слабых примеров сегодня?



План таков: мы рассмотрим две точки в иерархии знаний, одна из которых связана со слабым ИИ, а другая - с гораздо более сильной формой. Я назвал эти пункты предсказаниями и объяснениями, соответственно, и по мере продвижения буду уточнять эти термины. На конкретных примерах вы можете сами оценить качество каждого интеллекта и решить, будет ли путь от слабого к сильному гладким и постепенным или опасным и непересекающимся.

Возможное не неизбежно

Прежде чем мы углубимся, есть один аспект этой дискуссии, который мы должны отложить в сторону, а именно разницу между возможным и неизбежным. Есть разумные основания полагать, что сильный ИИ физически возможен. Физик и пионер квантовых вычислений Дэвид Дойч подробно обсуждает эту возможность в The Fabric of Reality. Утверждение о возможности основано на принципе Тьюринга: Существует абстрактный универсальный компьютер, репертуар которого включает любые вычисления, которые может выполнить любой физически возможный объект. Жизнь олицетворяет разум. Принцип Тьюринга гласит, что компьютер можно легко построить и запрограммировать для воспроизведения любого физического воплощения, включая такие объекты, как мозг, производящий интеллект. Возможность сильного ИИ логически вытекает из принципа Тьюринга, который, как утверждает Дойч, настолько широко признан, что является прагматически верным.

«Принцип Тьюринга гарантирует, что компьютер может делать все, что может делать мозг. Это, конечно, правда, но это ответ с точки зрения предсказания, а проблема заключается в объяснении ». Дэвид Дойч

Несмотря на этот принципиальный аргумент, неизбежность ИИ остается предметом горячих споров среди философов, ученых и математиков (особенно серьезным критиком является Роджер Пенроуз). Однако разногласия коренятся не столько в теоретических аргументах, сколько в конкретных выводах «как нам добраться отсюда». Дойч объясняет: «Тогда энтузиастам искусственного интеллекта недостаточно резко ответить, что принцип Тьюринга гарантирует, что компьютер может делать все, что может делать мозг. Это, конечно, правда, но это ответ с точки зрения предсказания, а проблема заключается в объяснении. Есть пробел в объяснении ».

Чтобы оценить неизбежность ИИ, нам нужно осветить объяснительные пробелы между слабыми и сильными формами интеллекта.

Когда все предсказание

И последний кусочек домашнего хозяйства. Для некоторых неизбежность ИИ - это не только ответ с точки зрения предсказания, предсказание - это суть интеллекта. Это явно неправда. Интеллект подобен Уитмену: Я большой, я вмещаю множество. Но по закону молота обращаться со всем как с гвоздем. Таким образом мотивированный, любой функциональный пробел в ИИ может быть оформлен как проблема прогнозирования: суть проблемы ИИ - это прогнозирование в условиях неопределенности; рассуждение влечет за собой действия по предсказанию; предсказание общих правил исходя из здравого смысла; и так далее.



Когда все основано на предсказании, включая цель, каждая открытая проблема кажется возрастающей. Часто аргументы в пользу неизбежности ссылаются на косвенные факторы производства в механизмах прогнозирования, такие как темпы инвестиций и увеличение количества людей, вычислительных ресурсов и данных. Это версия плана развития искусственного интеллекта размером с твит: прогнозирование - это единица интеллекта. Чтобы добиться большего интеллекта, просто добавьте больше ресурсов прогнозирования.

В недавней статье для Harvard Business Review один из самых влиятельных исследователей искусственного интеллекта Эндрю Нг предлагает следующее эмпирическое правило: Если обычный человек может выполнить умственную задачу менее чем за одну секунду размышлений, , мы, вероятно, сможем автоматизировать это с помощью ИИ сейчас или в ближайшем будущем . Данные и умение грамотно применять программное обеспечение - единственные ограниченные ресурсы, мешающие прогрессу в выполнении этих односекундных задач. Честно говоря, Нг прерывает шумиху, признавая, что вполне может быть прорыв, который сделает возможными более высокие уровни интеллекта, но пока еще нет четкого пути к этой цели.

Тенденция объединять возможности низшего порядка, такие как предсказания, с более сложными формами интеллекта, не ограничивается небрежными разговорами на деловых и маркетинговых форумах. Он глубоко проникает в технические области статистики и машинного обучения.

Статистик Галит Шмуэль объясняет, как смешение предсказания и объяснения достигло масштабов эпидемии из-за неизбирательного использования статистического моделирования. Хотя это различие было признано в философии науки, в статистической литературе отсутствует подробное обсуждение многих различий, возникающих в процессе моделирования для объяснительной и прогнозной цели. Для многих объяснение стало означать эффективное или интерпретируемое предсказание.

Рассмотрим этот пример из Вашингтонского университета, объясняющий предсказания любого классификатора. Под« объяснением прогноза мы подразумеваем представление текстовых или визуальных артефактов, которые обеспечивают качественное понимание взаимосвязи между компонентами экземпляра (например, словами в тексте, фрагментами изображения) и прогнозом модели». Объяснение - это интерпретируемое человеком описание, полученное на основе более сложной модели.

Это элегантное решение, позволяющее сделать сложные модели более интерпретируемыми, но, как мы увидим, это далеко от объяснений в более строгом научном смысле этого слова. Что характерно, Нг и его сотрудники использовали этот подход для объяснения предсказаний в недавней статье.

Нас не интересует игра слов, мы хотим понять суть дела. И как бы мы это ни называли, нам нужно определить, что-то существенное разделяет продукты сильного и слабого интеллекта. Для этого мы более подробно рассмотрим прогнозы, связанные с машинным обучением, и объяснения, связанные с научными открытиями.

Слабый интеллект: механизмы прогнозирования

Это моя собака Тор. Его обоняние на порядки лучше моего. Он слышит звуки на частотах на 20 000 Гц выше моего верхнего предела. Тор воспринимает мир так, как я никогда не мог постичь. Он строит удивительно универсальные прогностические модели. Он учится посредством положительного и отрицательного подкрепления (печеночные угощения и тайм-ауты соответственно). Он часто меня удивляет, когда я не слышу то, что он слышит, и не чувствую того, что он пахнет. Но он никогда, никогда не объясняет. Когда мир Тора меняется, он не спрашивает почему.

Несмотря на нашу неспособность к глубокому разговору, я полюбил Тора. То же самое я испытываю и к другому моему движку прогнозирования - к навигационному приложению в моем телефоне. Меня часто радует то, что я проезжаю через пробки так, как я никогда раньше не ездил. Как и Тор, приложение использует поток данных, которые мне недоступны, быстро выстраивая и обновляя свои направления. Как поясняется в блоге Google по искусственному интеллекту: Чтобы предоставлять нашим пользователям наилучшие возможности, эта информация должна постоянно отражать постоянно меняющийся мир. Но он никогда не предлагает более высокого уровня объяснения трафика, выходящего за рамки его смысла.

Сторонники предсказания могут кричать. «Это ваши примеры предсказаний, приложение для навигации и ваша собака ?!» Опять же, имейте в виду, что я всего лишь пытаюсь найти плато слабого интеллекта, чтобы мы могли сопоставить его с более сильными формами, которые следуют ниже. В этом духе нам нужно установить границы.

Заглянув под капот, природа предсказаний раскрывается в их границах. Бретт Холл предлагает простую иллюстрацию, кастрюлю с кипятком. Температура воды постоянно повышается до точки кипения. Основываясь на наблюдениях до точки кипения, было бы вполне разумно предсказать, что температура будет продолжать расти. Но как только температура превышает точку кипения, это не поддается предсказанию и требует объяснений. Холл иронично спрашивает, если экстраполяция не удалась даже в применении к этой простой системе, как можно ожидать ее успеха, когда все обстоит сложнее?

Вы можете подумать, что это игрушечная модель, примененная к сложной системе. Он обязательно потерпит неудачу. Просто дайте ему больше данных и более надежную модель! Это справедливая критика, поскольку вся предпосылка инкрементальной дорожной карты заключается в том, что мы можем продолжать получать новые данные для создания все более сложных систем.

Итак, давайте возьмем самую идеализированную концепцию предсказательной машины, которую мы только можем себе представить, - оракула с божественными способностями предсказания. Вы можете спросить оракула о чем угодно, и он предскажет, что произойдет. Конечно, когда деньги являются королем, вы просите их предсказывать цены на акции. И это работает! Вы вкладываете небольшие суммы денег в акции, которые, согласно прогнозам, будут расти, и ваши вложения увеличиваются. (Любопытно, что вы замечаете небольшое расхождение между прогнозируемыми значениями и фактическими ценами на акции, но в то время вы ничего об этом не думаете.)

Постепенно размер и темпы ваших инвестиций увеличиваются, равно как и ваше влияние и репутация. Теперь вы не только играете на рынках, но и перемещаете их! Но, как ни странно, ваш оракул начинает вас подводить. Эти расхождения между прогнозируемыми и фактическими ценами сейчас довольно заметны, часто подрывая ваши инвестиции. Предсказания вашего оракула снизились до приблизительных значений. Он по-прежнему описывает систему, но не может сказать вам о влиянии ваших вмешательств на эту систему, не перемещая вас внутри модели.

Эти особенности заключают в себе то, что политолог Юджин Михан назвал системной парадигмой объяснения. Он описал объяснения как эмпирические обобщения, формализованные в таких моделях, как байесовские сети и структурные уравнения. Прогнозируемые результаты недостаточны. Наблюдения не могут просто соответствовать модели, поскольку модель может быть создана, чтобы соответствовать любому набору фактов или данных. Если система в достаточной степени отражает окружающую среду, прогноз применяется; если нет, предсказание не выполняется. Вот что значит «отразить постоянно меняющийся мир». И эта проблема присуща задаче предсказания.

Неявно системная парадигма объяснения - это то, что многие люди связывают с механизмами прогнозирования и постепенным путем их улучшения. Однако, будучи образцом сильного ИИ, мы можем добиться большего.

Сильный интеллект: научные объяснения

Ранее я утверждал, что наука, наша самая успешная организация, создающая знания, является образцом для искусственного интеллекта. Имея это в виду, я приведу примеры, иллюстрирующие научную концепцию объяснений. По сравнению с прогнозом эти примеры охватывают ряд важных различий по форме, функциям, охвату и интеграции. Я также воспользуюсь одним из лучших научных объяснений, квантовой механикой, чтобы осветить эти различия. Если ИИ начнет автоматизировать это качество научных открытий, мы все наверняка согласимся, что оно действительно сильное.



Но давайте начнем с восхода солнца. Очень долгое время мы верили, что солнце восходит, потому что наблюдаем его. Но теперь мы понимаем это с точки зрения функционирования Солнечной системы и законов физики. Объяснение намного надежнее предсказания. Мы знаем, что солнце встает, даже когда облачно. Если бы мы вращались вокруг планеты, частые восходы солнца были бы совсем не удивительны. (Однако они по-прежнему внушают благоговение!) Несмотря на внешность, в действительности мы знаем, что солнце вообще не встает.

Давайте ненадолго остановимся, чтобы увидеть этот объясненный восход солнца. Между нашими наблюдениями за восходом солнца и его объяснением существует огромная дистанция. Наблюдения кажутся регулярными и единообразными. Каждое утро на востоке встает солнце. Однако более глубокое объяснение восхода солнца позволяет получить ненаблюдаемые данные, например, что происходит, когда солнце закрывается облаками. Это даже допускает воображение, контрфактический случай наблюдателей на орбите.

В своем обсуждении сложности научного вывода философ Уэсли Сэлмон использовал этот пример, чтобы охарактеризовать предсказания, основанные на грубой индукции, как безусловно донаучные, даже противоположные научным объяснениям. Объяснения находятся на вершине иерархии знаний из-за их глубины и охвата. Научная теория, которая просто суммирует то, что уже наблюдалось, не заслуживает называться теорией. Здесь, в научной среде, обнажается иллюзия индукции. Вопреки идее о том, что знания основаны на данных, наука обнаруживает богатую интеграцию объяснений, которые предсказывают иным образом ненаблюдаемые данные.

Давайте заглянем под капот объяснений, как мы это делали с предсказаниями. Объяснения (или теории) состоят из интерпретаций того, как устроен мир и почему. Эти объяснения выражаются формализмами в виде математических или логических моделей. Модели обеспечивают основу для прогнозов, которые, в свою очередь, предоставляют средства для проверки посредством контролируемых экспериментов.

В этой схеме объяснения представляют собой единство интерпретаций, формализмов и прогнозов. Каждый компонент выполняет свою функциональную роль, и каждый может работать автономно. Итеративно объяснения можно проверять через их прогнозы, а их результаты могут привлекать внимание к пробелам в объяснении, требующим внимания. Но их объединяющая цель - прояснить и критиковать объяснения. В этом свете предсказания (часть) считаются объяснениями (целым). Объяснения больше похожи на живые экосистемы, чем на статические артефакты, динамический поток предположений, предсказаний, экспериментов и критики.

Сложный характер научных объяснений находит богатое выражение в квантовой механике. Есть риск, что этот пример сложнее того, что я пытаюсь объяснить. Но это также одно из самых надежных и противоречивых объяснений в науке. Он действительно отражает природу инопланетного сверхразума, наши ожидания сильного ИИ. Даже в очень упрощенном виде, он служит нашей цели здесь, как вершина сильного интеллекта.

Формализмы квантовой механики могут использоваться для предсказания без какой-либо интерпретации лежащей в основе физической реальности. Тем не менее, существует широкий спектр конкурирующих интерпретаций, таких как схлопывающиеся волны, пилотные волны, множество миров или множество умов, и это лишь некоторые из них. И что важно, эти интерпретации имеют значение. Они вдохновляют исследователей, влияют на исследовательские программы и способствуют производству будущих знаний.

Пройдя немного глубже, рассмотрим различие между законами, которые точно описывают наблюдения (явления), и объяснениями, которые могут создавать эти законы. Философ Нэнси Картрайт в своей влиятельной книге Как лгут законы физики подчеркивает разницу между обобщенным описанием, способным включать в себя множество наблюдений (феноменологические законы), и специфика, необходимая для моделей, чтобы действительно предсказывать реальный мир. Путь от теории к реальности - от теории к модели, а затем от модели к феноменологическому закону. Феноменологические законы действительно верны для объектов в реальности - или могли бы быть; но фундаментальные законы верны только для объектов в модели .

Итак, чтобы оценить, насколько сильно научные объяснения отличаются от предсказаний, давайте вернемся к примеру квантовой механики. Существует обобщенная теория изменения системы (формализованная уравнением Шредингера) и конкретные энергии, действующие на систему (формализованные как оператор Гамильтона, установленный для системы). Картрайт объясняет: «Это правда, что уравнение Шредингера говорит о том, как квантовая система развивается в соответствии с гамильтонианом; но чтобы заниматься квантовой механикой, нужно знать, как выбрать гамильтониан ».

Как и в случае с восходом солнца, квантовая теория включает в себя богатую иерархию объяснений, а не данных, простирающуюся от обобщенных концепций до более конкретных моделей, способных фактически предсказывать результаты.

Индуктивные системы также имеют дело со структурой, такой как иерархия элементов, составляющих изображение. Но здесь мы говорим о структурах, которые не просто описывают или представляют данные, а, скорее, объясняют их основные причины. Эти интеграции образуют решетку, которая поддерживает все здание, вплоть до самого языка как примитивных объяснений. Подобно тому, как реальность существует на разных уровнях абстракции, объяснения нуждаются в поддержке других объяснений. И часто объяснения весьма далеки от данных и наблюдений. Подобно некоторой двойственности разума и тела, это единство является содержанием самого знания.

Неизбежен ли сильный ИИ?

Теперь у нас есть две разные точки зрения: более слабое плато предсказаний и более сильная вершина научных объяснений. Итак, мы переходим от одного к другому, чтобы ответить на вопрос.

Первое препятствие на нашем пути - это промежуток между вмешательствами. Предсказывать - значит делать новые наблюдения, выходящие за рамки того, что мы наблюдали до сих пор. Прогнозы ограничиваются предположением об однородности. Если система изменяется, необходимы новые данные для построения более точной модели. Модель менее ценна, если она просто описательная. Нам нужны прогнозы, на которые мы можем действовать, чтобы купить акции или вылечить болезнь. Но вмешательство влечет за собой изменение системы, нарушая предположение о единообразии.

«Бог запросил факты, и они ответили объяснениями». Жемчужина Иудеи

Итак, насколько велик разрыв в вмешательствах? Judea Pearl - пионер современного ИИ и вероятностного мышления. В Книге почему он помещает ассоциативные предсказания на низшую ступень интеллекта; вмешательства и более творческие контрфактические рассуждения как более сильные формы. Перл объясняет, почему это знание высшего порядка не может быть создано из вероятностных ассоциаций, характеризующих индуктивные системы. Как один из создателей этой идеи, теперь он смущен утверждением, что вероятности представляют собой язык причинно-следственных связей и знаний более высокого порядка. Достаточно сказать, что промежуток между интервенциями в лучшем случае перекрывается шатким мостом, который даже Индиана Джонс не перешел бы без паузы. Но мы продвигались дальше.

В конце концов мы подходим к еще более серьезному препятствию - пропасти данных. Хотя вмешательства создают значительный пробел на нашем пути, они ничто по сравнению с этим препятствием. Топливо индуктивных систем - данные. Научные догадки часто описываются как прыжки в воображение. «Данные» воображения, контрфакты по определению не являются наблюдаемыми фактами! В отличие от данных, знания состоят из богатой решетки взаимно поддерживающих объяснений. Когда я пытаюсь совместить энтузиазм по поводу технологий, управляемых данными, с реальностью предположительных знаний, я вспоминаю Хитрого Койота, сбегающего со скалы. Что его держит?

В своей критической оценке глубокого обучения ученый и исследователь искусственного интеллекта Гэри Маркус утверждает, что глубокое обучение может наткнуться на стену (или, возможно, упасть с обрыва). Он рассматривает многие темы, обсуждаемые в этом посте, такие как закон молота, чрезмерная зависимость от данных, пределы экстраполяции, проблемы, возникающие в результате интервенционных и контрфактических рассуждений, герменевтический характер этих самодостаточных и изолированные системы и их ограниченная способность передавать знания.

Сторонники глубокого обучения продолжают энергично отстаивать свою позицию. Но это представление о том, что ИИ наталкивается на стену, заставляет переосмыслить перспективы индуктивных систем. Следя за пульсом сообщества и некоторыми заметными неудовлетворенными ожиданиями, исследователь ИИ Филип Пенкневски утверждает, что разочарование, а не сильный ИИ, - единственный неизбежный результат.

Как и Перл, Маркус представляет себе будущее, в котором элементы объяснительного знания сочетаются с индукцией. «Правильный шаг сегодня может заключаться в интеграции глубокого обучения, которое лучше всего подходит для классификации восприятия, с символическими системами, которые превосходны в умении делать выводы и абстракции». Несомненно, это правда. Объяснительная сила уже задействована в методологиях машинного обучения, например в отборе данных, выборе допущений, искажающих алгоритмы обучения, и фоновых знаний, используемых для «пуска насоса» индукции.

Но это всего лишь наблюдения экспертов. Вы уже знаете об этом. Вы знаете, что реальность часто бросает вызов вашим предположениям о единообразии и мешает вашим самым лучшим планам. Вы не просто наблюдаете восход солнца, вы знаете, почему он восходит. Вы даже распаковали богатую пояснительную структуру квантовой механики. Вы знаете, что самые продвинутые индукционные системы производят только донаучные знания, грубые по стандартам наших лучших научных объяснений.

И поэтому вы можете ответить за себя: будет ли разрыв между слабым и сильным интеллектом преодолеваться предсказуемыми постепенными шагами или смелыми предположительными скачками?

По моей оценке, все препятствия на пути к сильному ИИ затмеваются инструментальным увлечением индуктивными системами. Индуктивные системы, такие как глубокое обучение, - мощные инструменты. Вполне понятно, даже ожидаемо, что мы должны начать с их практического использования. Когда в начале промышленной революции были изобретены тепловые двигатели, первоначальный интерес был к их практическому применению. Но постепенно, более 100 лет, этот инструментальный взгляд уступил место гораздо более глубокому теоретическому пониманию тепла и термодинамики. Эти объяснения в конечном итоге нашли отражение почти во всех современных отраслях науки, включая квантовую теорию. Инструмент дал нам тепловые двигатели; объяснения дал нам современный мир. Эта разница действительно захватывает дух.

ИИ будет следовать тому же пути от этих первых практических приложений до глубокого теоретического понимания создания знаний. Я надеюсь, что это не займет 100 лет. Но когда это произойдет, последует сильный ИИ. Неизбежно.

Из Объяснимого стартапа, посвященного науке и философии решения проблем.

Картрайт, Н. (1983). В чем заключаются законы физики. Clarendon Press.

Дойч, Д. (1998). Ткань реальности. Пингвин.

Холл, Б. (2017). Индукция. Http://www.bretthall.org/blog/induction

Маркус, Г. (2018). Глубокое обучение: критическая оценка https://arxiv.org/abs/1801.00631

Маркус, Г. (2018). В защиту скептицизма по поводу глубокого обучения. Https://medium.com/@GaryMarcus/in-defense-of-skepticism-about-deep-learning-6e8bfd5ae0f1

Михан, Э.Дж. (1968). Объяснение в социальных науках; системная парадигма. Дорси Пресс

Перл, Дж. И Маккензи, Д. (2018). Книга почему: новая наука о причине и следствии. Базовые книги

Пенкневский, Ф. (2018). Зима AI приближается. Https://blog.piekniewski.info/2018/05/28/ai-winter-is-well-on-its-way/

Рибейро, М.Т., Сингх, С., Гестрин, К. (2016). Почему я должен тебе доверять?: Объясняя предсказания любого классификатора https://arxiv.org/abs/1602.04938

Лосось, W.C. (1967). Основы научных выводов. Университет Питтсбурга Press.

Шмуэли, Г. (2010). Объяснять или предсказывать? Статистическая наука, 25 (3), 289–310. Https://projecteuclid.org/euclid.ss/1294167961