Обучение требует воли

Недавно я прочитал отличную статью Шейна Легга и Джоэла Венесса из DeepMind. http://arxiv.org/pdf/1109.5951v2.pdf

В статье «универсальный интеллект» агента π определяется как:

Поэтому имеет смысл определить обучение как процесс увеличения этой ценности.

Предупреждение. Не путайте разговорное использование слова «интеллект» с «универсальным интеллектом».

К сожалению, этот процесс не происходит естественным путем, и поэтому этот процесс должен управляться внутренней или внешней силой. В классическом машинном обучении мы называем эту силу «надзирателем». В мозгу эта сила исходит от «воли» как на сознательном, так и на подсознательном уровнях.

Хотя это может показаться очевидным, важно отметить, что для обучения агента цель обучения должна быть четко определена. Нельзя ожидать, что агент пропустит кучу данных и надеется, что выйдет что-то хорошее.

Суть двоякая:

Чтобы агент мог обучаться без учителя, он должен иметь внутреннюю волю.
Чтобы агент общего назначения научился выполнять общие задачи, он должен иметь общую цель обучения.

Похоже, что самым сильным кандидатом на роль такого универсального агента является агент, способный к обучению с помощью простой положительной/отрицательной обратной связи и обладающий «волей», стремящейся к максимальному вознаграждению.

Machine Learning Artificial Intelligence

Новые материалы

Что такое гибкие методологии разработки программного обеспечения

Что представляют собой гибкие методологии разработки программного обеспечения в 2023 году Agile-методологии разработки программного обеспечения заключаются в следующем: И. Введение A...

Ториго — революция в игре Го

Наш следующий вызов против ИИ и для ИИ. Сможет ли он победить людей в обновленной игре Го? Обратите внимание, что в следующей статье AI означает искусственный интеллект, а Goban —..

Простое развертывание моделей с помощью Mlflow — Упаковка классификатора обзоров продуктов NLP от HuggingFace

Как сохранить свои модели машинного обучения в формате с открытым исходным кодом с помощью MLFlow, чтобы позже получить возможность легкого развертывания. Сегодня модели упаковки имеют несколько..

Математика и интуиция - Часть 1

У каждой математической формулы есть доказательство. Часто эти доказательства слишком сложно понять, поскольку многие из них основаны на индукции, некоторые - на очень сложных наблюдениях, а..

Раскрытие возможностей НЛП: часть речевой маркировки и ее проблемы

В сфере обработки естественного языка (NLP) маркировка частей речи (POS) выступает в качестве фундаментального метода, позволяющего компьютерам понимать и анализировать человеческий язык на..

Под поверхностью: раскрытие деталей системы с помощью инструментов Linux CLI

Чем больше вы изучаете Linux и продвигаетесь вперед, тем больше вам нужно проверять информацию о вашей системе. Эта информация может касаться аппаратного обеспечения, такого как процессор,..

Как реализовать линейную регрессию в JavaScript

Узнайте, как реализовать линейную регрессию в JavaScript с помощью ML.js Линейная регрессия — это метод машинного обучения, используемый для моделирования связи между зависимой переменной и..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Data Typescript Java Front End Development NLP Computer Science Algorithms Learning Programming Languages ChatGPT Tech Tutorial Productivity Reactjs React Native Angular Cybersecurity Javascript Development Python Programming Developer CSS Swift Learning To Code Science