Сила конвейеров машинного обучения
Среднестатистический человек, имеющий только аттестат о среднем образовании или GED, за свою жизнь заработает примерно 1,6 миллиона долларов, по сравнению с человеком со степенью бакалавра, который потенциально может заработать ~2,8 миллиона долларов в своей жизни. срок службы. - Карневале и др. (2021) Джорджтаунский университет Расплата за колледж
Это глубокое неравенство в потенциале заработка подчеркивает преобразующую силу высшего образования и подчеркивает важность своевременного выпуска для повышения финансовой безопасности студентов в долгосрочной перспективе.
· Выбор значимого проекта
· Использование конвейера OSEMN
· Попытка остаться СУХОЙ
· Обратите внимание на свою АУДИТОРИЮ
∘ Инсайт 1: Учебные единицы во 2-м семестре имеют значение
∘ Понимание 2: Мониторинг платежей за обучение имеет ключевое значение
∘ Понимание 3: Оценки и оценки имеют решающее значение
· Каковы мои следующие шаги?
· Свяжитесь со мной
Выбор значимого проекта
По мере того, как я продвигаюсь в своем путешествии по данным, одна из вещей, которую я усвоил, заключается в том, что знание предметной области и искренний интерес ИМЕЮТ ЗНАЧЕНИЕ. Постоянная переработка проектов, над которыми работало множество людей, просто не поможет вам развить свой набор навыков. В связи с этим, вот некоторые из практик, которые я собрал на этом пути:
- Лучше просто. Я истинно верующий. Какой бы язык вы ни использовали, он определяет стиль, функции и навыки в отрасли, которые делают программирование на этом языке читабельным. В настоящее время для моих пользователей Python я использую PEP8, который представляет собой руководство по стилю, которое знакомит пользователей с соглашениями, которые улучшают читаемость и совместную работу.
- ОставайтесьСУХИМ. Принцип Dне не повторятьYсебя помогает мне избавиться от изнурительной практики переписывания больших блоков кода, которые НИКТО не сделает. читать, использовать или адаптировать.
- Обратите внимание на свою аудиторию. Выясните, что важно для вашей аудитории. Затем найдите способ показать им то, что их волнует (и что), и что делать с информацией, которой вы поделились (и что теперь).
Я часто опирался на свои знания в области образования. Поэтому, когда я начал проект по использованию машинного обучения для классификации, я выбрал набор данных, который был связан с чем-то близким и дорогим моему сердцу — успехами в учебе. В Калифорнийском университете в Ирвайне есть множество наборов данных здесь, которые вы можете использовать для оттачивания своих знаний в области машинного обучения (немного кристально чистых, но все же довольно полезных), которые я настоятельно рекомендую.
iNИнтерпретировать → Выявлять идеи и создавать визуализацию результатов.
Для этого проекта:
- Заинтересованная сторона: Политехнический институт Порталегри.
- Бизнес-кейс. Исследователи из Instituto Politecnico de Portalegre хотят снизить уровень неуспеваемости студентов в высших учебных заведениях.
- Отзыв ценился выше точности, поскольку я пытался свести к минимуму ложноотрицательные результаты. (Я постулировал, что минимизация количества ложноотрицательных результатов поможет гарантировать, что меньше учащихся, нуждающихся в образовательной помощи, ускользнут и не будут должным образом идентифицированы и поддержаны).
Использование конвейера OSEMN
Я хотел обрабатывать эти данные логично, чтобы они согласовывались с шагами, которые люди в отрасли будут реализовывать при работе над проектами, важными для их заинтересованных сторон. Поэтому я использовал конвейер OSEMN:
Получить → Импортировать данные.
Scrub → Управление типами данных и устранение отсутствующих данных или дубликатов.
Изучать → Выявлять закономерности в отношениях между переменными в данных.
Модель → Создайте набор прогностических моделей.
iNИнтерпретировать → Выявлять идеи и создавать визуализацию результатов.
Попытка остаться СУХОЙ
В моей последней попытке остаться СУХОЙ я начал писать курсы, чтобы, по сути, перестать пытаться изобретать велосипед. Классы помогают с организацией, возможностью повторного использования кода, делают объекты взаимозаменяемыми и делают общую реализацию более отточенной.
Вот два класса, которые я использовал в этом проекте, которые помогли мне изучить такие концепции, как конструкторы (инициализация атрибутов), наследование (свойства могут быть общими между классом и подклассами) и полиморфизм (можно вызывать несколько объектов, если они имеют общий метод).
Класс ObtainData помог мне загрузить данные, хранящиеся в файле .csv, с точкой с запятой в качестве разделителя в определенном пути к данным.
После создания класса ObtainData я создал экземпляр этого класса, чтобы данные передавались по конвейеру. Хотя эти данные довольно чистые, я все же создал классы для очистки, изучения и анализа данных.
Вот некоторые из сюжетов моего исследования:
Посмотрите все мое репо здесь.
Обратите внимание на свою АУДИТОРИЮ
В этом проекте моей аудиторией была группа исследователей, пытающихся выявить студентов, которые рискуют не закончить школу вовремя. Общая идея состоит в том, что если вы можете предсказать характеристики групп риска и обеспечить им своевременные вмешательства, вы можете вернуть их на путь окончания учебы. Поэтому я предоставил им два основных доказательства:
- важности функций / коэффициенты моделей машинного обучения, которые я обучал на данных, используя разделение 80 (поезд) 20 (тест) и оценивал с использованием оценки отзыва.
- Выводы из исследования, связанные с ключевыми функциями, которые модели определили как важные.
Понимание 1: Учебные единицы во 2-м семестре имеют значение
- Студенты с большим количеством одобренных единиц во 2-м семестре имеют более высокие шансы на успех в учебе.
- Количество зачисленных единиц во 2-м семестре также положительно влияет на академические результаты.
- Поощрение студентов к прохождению большего количества разделов во 2-м семестре может привести к снижению уровня академической неуспеваемости.
Понимание 2: Мониторинг платежей за обучение имеет ключевое значение
Быть в курсе платы за обучение имеет решающее значение для прогнозирования успехов в учебе. Своевременная оплата обучения коррелирует с лучшими результатами учащихся. Внедрение стратегий, обеспечивающих своевременную оплату обучения, может положительно повлиять на академическую успеваемость и снизить количество отказов.
Инсайт 3: Оценки и оценки имеют решающее значение
Академическая успеваемость в оценках 1-го и 2-го семестров значительно влияет на вероятность успеха студентов. Учащиеся, которые получают более высокие оценки, как правило, имеют более высокие академические результаты в целом. Раннее выявление и вмешательство учащихся, испытывающих трудности с оценками или оценками, может привести к улучшению академической успеваемости и снижению количества отказов.
Как правило, я хочу улучшить свои ремесленные и дизайнерские проекты, чтобы они были проницательными и понятными для аудитории. Я буду и впредь прилагать усилия к тому, чтобы приобретать новые навыки и улучшать применение инструментов анализа данных.
Каковы мои следующие шаги?
Я хочу лучше понять следующее:
- Как методы НЛП можно применить к проектам, связанным с сферой образования?
В настоящее время я работаю над созданием визуализаций для всех начальных школ округа Самнер в Теннесси, используя инструменты из моего постоянно растущего набора инструментов.
Свяжитесь со мной
Если вы хотите быть в курсе моих последних статей, подписывайтесь на меня на Medium. Вы также можете связаться со мной в LinkedIn или написать мне по адресу [email protected].