Резюме модели машинного обучения с учителем — Регрессия

Регрессия — это контролируемый процесс обучения, в котором зависимая переменная является непрерывной переменной, а независимая переменная может быть либо непрерывной, либо категориальной.

Существует два типа регрессионных моделей ML: параметрические и непараметрические.

Для параметрической модели мы разрабатываем метрику качества, которая оценивает эффективность подбора. Решив метрику качества, мы получим наилучшую подогнанную модель, а также коэффициенты для независимых переменных.

Параметрические модели

1. Обобщенная линейная регрессия (ANOVA)

В следующем примере предположим, что независимая переменная x имеет два уровня — 0 и 1.

2. Простая линейная регрессия

3. Множественная линейная регрессия

4. Регрессия хребта (регуляризация L2)

5. Лассо-регрессия (регуляризация L1)

Все параметрические линейные модели должны соответствовать предположениям, таким как ошибка (остаток) является нормальной, независимость между ошибкой и признаками, равная дисперсия ошибки. Они не допускают гибкой локальной структуры. Для этого нам потребуется использовать непараметрические линейные модели.

Непараметрический

1. Один ближайший сосед (1NN)

2. K ближайший сосед (KNN)

3. Взвешенный KNN

4. Регрессия ядра

5. Машина с градиентным усилением

Непараметрические регрессионные модели могут быть полезны, когда данные не следуют определенному распределению, а допущения линейной регрессии не могут быть достигнуты. Однако есть и недостатки. Подходы к ближайшим соседям могут стать очень сложными по мере роста N. Когда N очень велико, параметрическая модель обычно лучше, чем метод ближайшего соседа, если допущения линейной регрессии верны. У Gradient Boost есть несколько гиперпараметров для настройки — количество деревьев, количество листьев, скорость обучения, которые могут потреблять много вычислительных ресурсов и легко перенастраиваются, когда количество деревьев или листьев слишком велико. И, как и все градиентные подходы, он чувствителен к выбросам.

Регрессия в реальной мировой практике может быть очень сложной. Прежде чем создавать регрессионную модель, я думаю, что есть несколько хороших практик:

Убедитесь, что нулевая/альтернативная гипотеза понятна. На основе плана эксперимента и цели эксперимента определить чистую гипотезу. Это поможет вам в процессе построения модели.
Постройте диаграммы рассеяния и гистограммы для всех независимых и зависимых переменных, чтобы проверить выбросы и линейность между x и y. Гистограммы также могут показать распределение признаков и возможность применения преобразования, если распределение не является нормальным.
Разделите поезд и тестовый набор, тестовый набор имеет решающее значение, когда вы пытаетесь выяснить, какой режим лучше. Если набор данных небольшой, необходима перекрестная проверка. Если набор данных очень мал, то для теста можно использовать исключение одного.
Если есть необходимость настройки гиперпараметра, то разделите данные на поезд — проверка — тест. Примените поиск по сетке + перекрестную проверку, чтобы найти лучший гиперпараметр. Используйте тестовый набор для оценки модели.

Это все для поста.

Надеюсь, вам понравилось читать :)

Regression Machine Learning

Новые материалы

Учебные заметки JavaScript Object Oriented Labs

Вот моя седьмая неделя обучения программированию. После ruby и его фреймворка rails я начал изучать самый популярный язык интерфейса — javascript. В отличие от ruby, javascript — это более..

Разбор строк запроса в vue.js

Иногда вам нужно получить данные из строк запроса, в этой статье показано, как это сделать. В жизни каждого дизайнера/разработчика наступает момент, когда им необходимо беспрепятственно..

Предсказание моей следующей любимой книги 📚 Благодаря данным Goodreads и машинному обучению 👨‍💻

«Если вы не любите читать, значит, вы не нашли нужную книгу». - J.K. Роулинг Эта статья сильно отличается от тех, к которым вы, возможно, привыкли . Мне очень понравилось поработать над..

Основы принципов S.O.L.I.D, Javascript, Git и NoSQL

каковы принципы S.O.L.I.D? Принципы SOLID призваны помочь разработчикам создавать надежные, удобные в сопровождении приложения. мы видим пять ключевых принципов. Принципы SOLID были разработаны..

Как настроить Selenium в проекте Angular

Угловой | Селен Как настроить Selenium в проекте Angular Держите свое приложение Angular и тесты Selenium в одной рабочей области и запускайте их с помощью Mocha. В этой статье мы..

Аргументы прогрессивного улучшения почти всегда упускают суть

В наши дни в кругах веб-разработчиков много болтают о Progressive Enhancement — PE, но на самом деле почти все аргументы с обеих сторон упускают самую фундаментальную причину, по которой PE..

Введение в Джанго Фреймворк

Схема «работать умно, а не усердно» В этой и последующих статьях я познакомлю вас с тем, что такое фреймворк Django и как создать свое первое приложение с помощью простых и понятных шагов, а..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Typescript Data Java Front End Development NLP Algorithms Computer Science Learning Programming Languages ChatGPT Tech Tutorial Angular Productivity React Native Reactjs Cybersecurity Python Programming Javascript Development Neural Networks Learning To Code Developer Javascript Tips Swift