Сила конвейеров машинного обучения

Среднестатистический человек, имеющий только аттестат о среднем образовании или GED, за свою жизнь заработает примерно 1,6 миллиона долларов, по сравнению с человеком со степенью бакалавра, который потенциально может заработать ~2,8 миллиона долларов в своей жизни. срок службы. - Карневале и др. (2021) Джорджтаунский университет Расплата за колледж

Это глубокое неравенство в потенциале заработка подчеркивает преобразующую силу высшего образования и подчеркивает важность своевременного выпуска для повышения финансовой безопасности студентов в долгосрочной перспективе.

· Выбор значимого проекта
· Использование конвейера OSEMN
· Попытка остаться СУХОЙ
· Обратите внимание на свою АУДИТОРИЮ
Инсайт 1: Учебные единицы во 2-м семестре имеют значение
Понимание 2: Мониторинг платежей за обучение имеет ключевое значение
Понимание 3: Оценки и оценки имеют решающее значение
· Каковы мои следующие шаги?
· Свяжитесь со мной

Выбор значимого проекта

По мере того, как я продвигаюсь в своем путешествии по данным, одна из вещей, которую я усвоил, заключается в том, что знание предметной области и искренний интерес ИМЕЮТ ЗНАЧЕНИЕ. Постоянная переработка проектов, над которыми работало множество людей, просто не поможет вам развить свой набор навыков. В связи с этим, вот некоторые из практик, которые я собрал на этом пути:

  • Лучше просто. Я истинно верующий. Какой бы язык вы ни использовали, он определяет стиль, функции и навыки в отрасли, которые делают программирование на этом языке читабельным. В настоящее время для моих пользователей Python я использую PEP8, который представляет собой руководство по стилю, которое знакомит пользователей с соглашениями, которые улучшают читаемость и совместную работу.
  • ОставайтесьСУХИМ. Принцип Dне не повторятьYсебя помогает мне избавиться от изнурительной практики переписывания больших блоков кода, которые НИКТО не сделает. читать, использовать или адаптировать.
  • Обратите внимание на свою аудиторию. Выясните, что важно для вашей аудитории. Затем найдите способ показать им то, что их волнует (и что), и что делать с информацией, которой вы поделились (и что теперь).

Я часто опирался на свои знания в области образования. Поэтому, когда я начал проект по использованию машинного обучения для классификации, я выбрал набор данных, который был связан с чем-то близким и дорогим моему сердцу — успехами в учебе. В Калифорнийском университете в Ирвайне есть множество наборов данных здесь, которые вы можете использовать для оттачивания своих знаний в области машинного обучения (немного кристально чистых, но все же довольно полезных), которые я настоятельно рекомендую.

iNИнтерпретировать → Выявлять идеи и создавать визуализацию результатов.

Для этого проекта:

  • Заинтересованная сторона: Политехнический институт Порталегри.
  • Бизнес-кейс. Исследователи из Instituto Politecnico de Portalegre хотят снизить уровень неуспеваемости студентов в высших учебных заведениях.
  • Отзыв ценился выше точности, поскольку я пытался свести к минимуму ложноотрицательные результаты. (Я постулировал, что минимизация количества ложноотрицательных результатов поможет гарантировать, что меньше учащихся, нуждающихся в образовательной помощи, ускользнут и не будут должным образом идентифицированы и поддержаны).

Использование конвейера OSEMN

Я хотел обрабатывать эти данные логично, чтобы они согласовывались с шагами, которые люди в отрасли будут реализовывать при работе над проектами, важными для их заинтересованных сторон. Поэтому я использовал конвейер OSEMN:

Получить → Импортировать данные.

Scrub → Управление типами данных и устранение отсутствующих данных или дубликатов.

Изучать → Выявлять закономерности в отношениях между переменными в данных.

Модель → Создайте набор прогностических моделей.

iNИнтерпретировать → Выявлять идеи и создавать визуализацию результатов.

Попытка остаться СУХОЙ

В моей последней попытке остаться СУХОЙ я начал писать курсы, чтобы, по сути, перестать пытаться изобретать велосипед. Классы помогают с организацией, возможностью повторного использования кода, делают объекты взаимозаменяемыми и делают общую реализацию более отточенной.

Вот два класса, которые я использовал в этом проекте, которые помогли мне изучить такие концепции, как конструкторы (инициализация атрибутов), наследование (свойства могут быть общими между классом и подклассами) и полиморфизм (можно вызывать несколько объектов, если они имеют общий метод).

Класс ObtainData помог мне загрузить данные, хранящиеся в файле .csv, с точкой с запятой в качестве разделителя в определенном пути к данным.

После создания класса ObtainData я создал экземпляр этого класса, чтобы данные передавались по конвейеру. Хотя эти данные довольно чистые, я все же создал классы для очистки, изучения и анализа данных.

Вот некоторые из сюжетов моего исследования:

Посмотрите все мое репо здесь.

Обратите внимание на свою АУДИТОРИЮ

В этом проекте моей аудиторией была группа исследователей, пытающихся выявить студентов, которые рискуют не закончить школу вовремя. Общая идея состоит в том, что если вы можете предсказать характеристики групп риска и обеспечить им своевременные вмешательства, вы можете вернуть их на путь окончания учебы. Поэтому я предоставил им два основных доказательства:

  • важности функций / коэффициенты моделей машинного обучения, которые я обучал на данных, используя разделение 80 (поезд) 20 (тест) и оценивал с использованием оценки отзыва.
  • Выводы из исследования, связанные с ключевыми функциями, которые модели определили как важные.

Понимание 1: Учебные единицы во 2-м семестре имеют значение

  • Студенты с большим количеством одобренных единиц во 2-м семестре имеют более высокие шансы на успех в учебе.
  • Количество зачисленных единиц во 2-м семестре также положительно влияет на академические результаты.
  • Поощрение студентов к прохождению большего количества разделов во 2-м семестре может привести к снижению уровня академической неуспеваемости.

Понимание 2: Мониторинг платежей за обучение имеет ключевое значение

Быть в курсе платы за обучение имеет решающее значение для прогнозирования успехов в учебе. Своевременная оплата обучения коррелирует с лучшими результатами учащихся. Внедрение стратегий, обеспечивающих своевременную оплату обучения, может положительно повлиять на академическую успеваемость и снизить количество отказов.

Инсайт 3: Оценки и оценки имеют решающее значение

Академическая успеваемость в оценках 1-го и 2-го семестров значительно влияет на вероятность успеха студентов. Учащиеся, которые получают более высокие оценки, как правило, имеют более высокие академические результаты в целом. Раннее выявление и вмешательство учащихся, испытывающих трудности с оценками или оценками, может привести к улучшению академической успеваемости и снижению количества отказов.

Как правило, я хочу улучшить свои ремесленные и дизайнерские проекты, чтобы они были проницательными и понятными для аудитории. Я буду и впредь прилагать усилия к тому, чтобы приобретать новые навыки и улучшать применение инструментов анализа данных.

Каковы мои следующие шаги?

Я хочу лучше понять следующее:

  • Как методы НЛП можно применить к проектам, связанным с сферой образования?

В настоящее время я работаю над созданием визуализаций для всех начальных школ округа Самнер в Теннесси, используя инструменты из моего постоянно растущего набора инструментов.

Свяжитесь со мной

Если вы хотите быть в курсе моих последних статей, подписывайтесь на меня на Medium. Вы также можете связаться со мной в LinkedIn или написать мне по адресу [email protected].

ПИСАТЕЛЬ на MLearning.ai // Прогнозирование ЭЭГ ИИ // Animate Midjourney