Хобрук: Ваш путь к мастерству в программировании

Публикации по теме 'dataset'


О несбалансированных наборах данных
О несбалансированных наборах данных Недавно я наткнулся на некоторые интересные результаты, используя classification_report от scikit-learn. precision recall f1-score support 0 0.86 0.52 0.65 83 1 0.88 0.98 0.92 287 accuracy 0.87 370 macro avg 0.87 0.75 0.78 370 weighted avg 0.87 0.87 0.86 370 Confusion..

Обработка несбалансированных наборов данных в машинном обучении
Несбалансированные наборы данных являются распространенной проблемой в машинном обучении, когда количество экземпляров, принадлежащих одному классу, значительно превышает количество экземпляров другого(их). Этот дисбаланс может привести к появлению предвзятых моделей, которые плохо работают в отношении класса меньшинства. В этом посте мы рассмотрим различные методы обработки несбалансированных наборов данных и повышения производительности моделей машинного обучения. Понимание проблемы..

Вопросы по теме 'dataset'

Пропустить обновление строки SQL с пустыми значениями?
У меня есть таблица с несколькими столбцами, которые допускают NULL. Как мне написать SQL-запрос, который позволит мне пропустить этот столбец в обновлении, если значение «пусто». Должен ли я использовать логический флаг, сообщающий запросу об...
26.03.2024

Поместите данные в неравные размеры ячеек
Я новичок в R и хочу использовать его для непосредственной работы со своими данными. Моя конечная цель - сделать гистограмму / гистограмму. Глубина: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 Процент: 0,4, 0,1, 0,5, 0,2, 0,1, 0,3, 0,9, 0,3, 0,2, 0,2,...
15.04.2024

Выборка 10 000 случайных строк из набора данных объемом 200 ГБ
Я пытаюсь выбрать 10000 случайных строк из большого набора данных с ~ 3 миллиардами строк (с заголовками). Я рассматривал возможность использования shuf -n 1000 input.file > output.file , но это кажется довольно медленным (> 2 часа работы с моими...
09.05.2024

Новые материалы

Я собираюсь научить вас Python шаг за шагом
Привет, уважаемый энтузиаст Python! 👋 Готовы погрузиться в мир Python? Сегодня я приготовил для вас кое-что интересное, что сделает ваше путешествие более приятным, чем шарик мороженого в..

Альтернатива шаблону исходящих сообщений для архитектуры микросервисов
Познакомьтесь с двухэтапным сообщением В этой статье предлагается альтернативный шаблон для папки Исходящие : двухэтапное сообщение. Он основан не на очереди сообщений, а на..

React on Rails
Основное приложение Reverb - это всеми любимый монолит Rails. Он отлично обслуживает наш API и уровень просмотра трафика. По мере роста мы добавляли больше интерактивных элементов..

Что такое гибкие методологии разработки программного обеспечения
Что представляют собой гибкие методологии разработки программного обеспечения в 2023 году Agile-методологии разработки программного обеспечения заключаются в следующем: И. Введение A...

Ториго  — революция в игре Го
Наш следующий вызов против ИИ и для ИИ. Сможет ли он победить людей в обновленной игре Го? Обратите внимание, что в следующей статье AI означает искусственный интеллект, а Goban  —..

Простое развертывание моделей с помощью Mlflow — Упаковка классификатора обзоров продуктов NLP от HuggingFace
Как сохранить свои модели машинного обучения в формате с открытым исходным кодом с помощью MLFlow, чтобы позже получить возможность легкого развертывания. Сегодня модели упаковки имеют несколько..

Математика и интуиция - Часть 1
У каждой математической формулы есть доказательство. Часто эти доказательства слишком сложно понять, поскольку многие из них основаны на индукции, некоторые - на очень сложных наблюдениях, а..