Ада-оптимизаторы

Оптимизаторы Ada отличаются от оптимизаторов Gradient Descent тем, как используются скорости обучения. В случае градиентного спуска скорость обучения остается неизменной, в то время как в случае AdaGrad идея состоит в том, чтобы использовать разные скорости обучения для разных нейронов для разных слоев на основе разных итераций/

В любой модели глубокого обучения мы всегда найдем два типа функций — плотные и разреженные. Теперь мы не можем использовать одинаковую скорость обучения для обработки плотных и разреженных функций.

Градиентный спуск

Например,

АдаГрад

Для AdaGrad мы немного изменили уравнение для градиентного спуска, чтобы учесть изменение скорости обучения.

где,

Эпсилон используется для предотвращения того, чтобы новое значение стало равным 0. Это очень маленькое положительное значение.

Для веса,

Для смещения,

Gt может стать очень большим числом, учитывая уравнение. Это один из недостатков AdaGrad. Для решения этой проблемы у нас есть AdaDelta и RMSprop.

AdaDelta и RMSprop

Эти оптимизаторы работают аналогичным образом. Идея, стоящая за этим оптимизатором, состоит в том, чтобы не допустить, чтобы Gt из AdaGrad стал очень большим числом. Чтобы это произошло, мы внесем очень небольшую модификацию в AdaGrad. Модификация включает использование средневзвешенного значения.

Для веса,

Для смещения,

Оптимизатор Адама

В Adam Optimizer мы объединяем два метода: Импульс или Средневзвешенное значение и RMSprop.

Momentum помогает нам сгладить кривую, а RMSprop изменить скорость обучения.

Импульс

RMSprop

Примечание. Значение бета будет отличаться для Momentum и RMSprop.

Теперь мы поместим приведенное выше уравнение в нашу формулу обновления веса и смещения.

Я надеюсь, что эта статья даст вам общее представление о различных типах оптимизаторов.

Если у вас есть какие-либо вопросы или вы обнаружите, что что-то искажено, пожалуйста, дайте мне знать.

Спасибо!

Новые материалы

Не зря же это называют интеллектом

Стек — C#, Oracle Опыт — 4 года Работа — Разведывательный корпус Мне пора служить Может быть, я немного приукрашиваю себя, но там, где я живу, есть обязательная военная служба на 3..

LeetCode Проблема 41. Первый пропущенный положительный результат

LeetCode Проблема 41. Первый пропущенный положительный результат Учитывая несортированный массив целых чисел, найдите наименьшее пропущенное положительное целое число. Пример 1: Input:..

Расистский и сексистский робот, обученный в Интернете

Его ИИ основан на предвзятых данных, которые создают предрассудки. Он словно переходит из одного эпизода в другой из серии Черное зеркало , а вместо этого представляет собой хронику..

Управление состоянием в микрофронтендах

Стратегии бесперебойного сотрудничества Микро-фронтенды — это быстро растущая тенденция в сфере фронтенда, гарантирующая, что удовольствие не ограничивается исключительно бэкэнд-системами..

Декларативное и функциональное программирование в стиле LINQ с использованием JavaScript с использованием каррирования и генератора ...

LINQ - одна из лучших функций C #, которая обеспечивает элегантный способ написания кода декларативного и функционального стиля, который легко читать и понимать. Благодаря таким функциям ES6,..

Структуры данных в C ++ - Часть 1

Реализация общих структур данных в C ++ C ++ - это расширение языка программирования C, которое поддерживает создание классов, поэтому оно известно как C с классами . Он используется для..

Как я опубликовал свое первое приложение в App Store в 13 лет

Как все началось Все началось три года назад летом после моего четвертого класса в начальной школе. Для меня, четвертого класса, лето кажется бесконечным, пока оно не закончится, и мой отец..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning React AI Software Engineering Nodejs Development Data Typescript Java NLP Front End Development Computer Science Algorithms Learning Programming Languages ChatGPT Tech Tutorial Reactjs Angular React Native Productivity Cybersecurity Neural Networks Python Programming Javascript Development HTML Javascript Tips Learning To Code Developer

Ада-оптимизаторы

Ада-оптимизаторы

Градиентный спуск

АдаГрад

AdaDelta и RMSprop

Оптимизатор Адама

Импульс

RMSprop

похожие материалы:

Новые материалы

Не зря же это называют интеллектом

LeetCode Проблема 41. Первый пропущенный положительный результат

Расистский и сексистский робот, обученный в Интернете

Управление состоянием в микрофронтендах

Декларативное и функциональное программирование в стиле LINQ с использованием JavaScript с использованием каррирования и генератора ...

Структуры данных в C ++ - Часть 1

Как я опубликовал свое первое приложение в App Store в 13 лет

Метки