Хобрук: Ваш путь к мастерству в программировании

Публикации по теме 'data-preprocessing'


Основа безупречного машинного обучения: предварительная обработка данных
Введение: В очаровательном мире машинного обучения данные являются ключом к раскрытию невероятных идей. Однако, прежде чем мы сможем отправиться в это волшебное путешествие прогнозирования и распознавания образов, мы должны сначала подготовить наши данные с помощью процесса, называемого «Предварительная обработка данных». Этот важный шаг гарантирует, что наши данные будут чистыми, организованными и готовыми творить чудеса. В этом блоге мы углубимся в важность предварительной..

ПРИМЕР ПРОБЛЕМЫ ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ ВОДЯНЫХ НАСОСОВ ТААРИФЫ
ПРОБЛЕМА Задача здесь состоит в том, чтобы правильно предсказать рабочее состояние водяных насосов, независимо от того, работают ли эти насосы, не работают или работают, но нуждаются в ремонте. Данные по водяным насосам предоставлены TAARIFA и Министерством водного хозяйства Танзании. TAARIFA — это платформа с открытым исходным кодом для краудсорсинговой отчетности и сортировки проблем, связанных с инфраструктурой. Точные прогностические модели могут быть очень полезны для TAARIFA..

Понимание нечеткости: изучение алгоритма FuzzyWuzzy
В мире программирования и анализа данных алгоритмы играют решающую роль в эффективном решении различных задач. Одним из таких алгоритмов, получивших популярность, является алгоритм FuzzyWuzzy, также известный как алгоритм fuzz. Несмотря на свое шутливое название, FuzzyWuzzy служит серьезной цели, предоставляя средства для сравнения и сопоставления строк, даже если они не совсем идентичны. В этом посте мы погрузимся в увлекательный мир нечеткости и разберемся в работе алгоритма..

Особенности разработки в деталях
Разработка функций, без сомнения, является неотъемлемой частью науки о данных. Большинство людей считают, что в науке о данных единственное значение имеет машинное обучение, но это далеко не так. Важными параметрами, которые следует учитывать, являются способы очистки и предварительной обработки ваших данных. В этой статье мы рассмотрим некоторые из ключевых методов, которые мы можем использовать в разработке признаков. Но что такое функциональная инженерия? До этого какие особенности?..

SMOTE (метод передискретизации синтетического меньшинства)
SMOTE (Synthetic Minority Over-sampling Technique) — это широко используемый метод увеличения данных в машинном обучении для несбалансированных наборов данных. В несбалансированном наборе данных количество экземпляров, принадлежащих одному классу (классу меньшинства), значительно меньше, чем количество экземпляров, принадлежащих другому классу (классу большинства). SMOTE предназначен для решения этой проблемы путем избыточной выборки класса меньшинства для получения более..

Новые материалы

Неправильное представление об «или», «||», «и» и «&&» в Ruby
Насколько нам известно, Ruby довольно удобен для разработчиков. Мы можем делать что угодно несколькими способами. Руби похожа на бабушку и дедушку, которая всегда счастлива и горда, что бы мы ни..

Как использовать аутентификацию субъекта-службы для доступа к OneLake Microsoft Fabric — Сэм Дебрюйн
Для работы этой функции необходимо включить 2 новых параметра на портале администрирования Fabric/Power BI. Оба можно найти в разделе Настройки арендатора . Первый называется Разрешить..

Классный фактор: как украсть стили с помощью машинного обучения, Turi Create и ResNet
Я был взволнован, когда впервые услышал, что Turi Create была приобретена Apple, а затем предоставлен открытый исходный код большему сообществу машинного обучения! Ранее в этом году я писал о..

Топ 5 приложений машинного обучения в здравоохранении
Пять лучших применений машинного обучения в здравоохранении Машинное обучение (МО) — это направление искусственного интеллекта (ИИ), в котором компьютерные системы..

ИИ превращает знаки зодиака в реальных людей
Генераторы изображений с искусственным интеллектом — это новая горячая тенденция, которая в последние месяцы покорила Интернет. Эти генераторы используют сложные алгоритмы машинного обучения..

Худший алгоритм сортировки + бонус!
Если вы разбираетесь в структурах данных и алгоритмах, вы, возможно, знаете, что быстрая сортировка и сортировка слиянием часто считаются самыми эффективными и действенными алгоритмами..

Повышайте продуктивность, создавая лучший код Python
Все приемы, которые я изучил на Python, чтобы писать лучший и быстрый код Представление длинных цифр Очень сложно отследить количество нулей или цифр после определенной длины. А теперь вот..