Независимо от того, являетесь ли вы недавним выпускником или профессионалом, желающим сменить карьеру, область науки о данных и искусственного интеллекта предлагает широкий спектр интересных и прибыльных возможностей. В этой статье я предлагаю вам бесплатное руководство, которое предоставит вам четкий и действенный план развития навыков и знаний, необходимых для достижения успеха в этой быстро развивающейся области. Следуя шагам, изложенным в этой дорожной карте, вы будете на пути к успешной и полезной карьере в области науки о данных и искусственного интеллекта.
Эта дорожная карта выведет вас на средний уровень, и я искренне верю, что вы сможете получить работу и начать свою карьеру после ее завершения. Однако, чтобы перейти на продвинутый уровень, вам нужно будет пройти более углубленные курсы, книги и исследовательские работы. Как вы увидите, большинство курсов будет от Coursera. Причина этого в том, что я считаю, что у них один из самых качественных практических и углубленных курсов, и в то же время вы можете подать заявку на финансовую помощь, если вы не можете платить за курсы, поэтому вы можете пройти их бесплатно. .
Я написал примерное время для каждого из путей обучения. Это время в днях и неделях, и я предполагал, что вы будете учиться 4 дня по пять дней в неделю. Итого 20 часов в неделю. В зависимости от этого вы можете рассчитать время, необходимое для завершения этой дорожной карты, в зависимости от вашего темпа.
Оглавление:
- Методология и грамотность науки о данных
- Настройка учетных записей
- Разработка программного обеспечения
- Математика для машинного обучения и специалистов по данным
- Навыки, связанные с данными
- Основы машинного обучения
- Основы глубокого обучения
- Операции машинного обучения и практическая обработка данных
- Подготовьтесь к интервью
- Заключительные комментарии
10.1. Где учиться?
10.2. Развитие навыков обучения
10.3. Избегайте синдрома самозванца
Если вы хотите бесплатно изучать науку о данных и машинное обучение, ознакомьтесь со следующими ресурсами:
- Бесплатные интерактивные дорожные карты для самостоятельного изучения науки о данных и машинного обучения. Начните здесь: https://aigents.co/learn/roadmaps/intro
- Поисковая система для учебных ресурсов Data Science (БЕСПЛАТНО). Добавляйте в закладки свои любимые ресурсы, отмечайте статьи как завершенные и добавляйте учебные заметки. https://aigents.co/learn
- Хотите изучить науку о данных с нуля при поддержке наставника и учебного сообщества? Присоединяйтесь к этому учебному кружку бесплатно: https://community.aigents.co/spaces/9010170/
Если вы хотите начать карьеру в области науки о данных и искусственного интеллекта, но не знаете, как это сделать. Я предлагаю сеансы наставничества по науке о данных и долгосрочное наставничество по карьере:
- Долгосрочное наставничество: https://lnkd.in/dtdUYBrM
- Менторские сессии: https://lnkd.in/dXeg3KPW
Присоединяйтесь к программе Среднее членство, чтобы продолжать обучение без ограничений. Я получу небольшую часть вашего членского взноса, если вы перейдете по следующей ссылке, без каких-либо дополнительных затрат с вашей стороны.
1. Методология и грамотность науки о данных
Первым шагом в этой дорожной карте является понимание методологии науки о данных и грамотности в отношении данных. На этом этапе вы поймете, что такое наука о данных, как структурировать проект по науке о данных и какие навыки необходимы для достижения успеха в этой области.
Методология науки о данных относится к процессу или шагам, которым следуют специалисты по данным для анализа и извлечения информации из данных. Обычно это включает в себя такие этапы, как исследование и очистка данных, выбор функций, построение и оценка модели, а также развертывание модели. Твердое понимание процесса и методологии науки о данных и того, чего ожидать на каждом этапе, поможет вам правильно структурировать свой проект и идеально пройти его.
Грамотность в области науки о данных относится к способности человека понимать концепции и инструменты науки о данных и работать с ними. Эти навыки включают в себя знание статистики, программирования и машинного обучения, а также способность общаться и представлять информацию на основе данных нетехническим заинтересованным сторонам. Важно иметь широкий взгляд на важные навыки, которые вам необходимо приобрести, чтобы добиться успеха в этой области.
Схема обучения (1 неделя):
- Что такое наука о данных? (1 день)
- Методология Data Science (2 дня)
- Наука о данных для бизнес-инноваций (2 дня)
- Напишите статью, основанную на ваших знаниях
Дополнительные ресурсы:
2. Настройка ваших учетных записей
Прежде чем углубляться в практические и теоретические темы, важно подготовить свои счета. Сюда входят ваши учетные записи LinkedIn, Medium и GitHub.
Как вы увидите на следующих шагах, вам придется использовать упомянутые выше социальные и профессиональные каналы. Им очень важно иметь профессиональную учетную запись в этих социальных сетях, поскольку они будут представлять вашу работу и помогут вам создать собственный бренд и авторитет в этой области.
В дополнение к этому вы сможете наладить очень хорошие связи, а также сможете следить за новостями и тенденциями в этой области от людей в этой области. Наконец, у вас будет профессиональный двусторонний канал связи с другими людьми, независимо от того, свяжутся ли с вами рекрутеры или вы сможете связаться с людьми в этой области, чтобы попросить совета или совета.
Схема обучения (2 дня):
- Как создать отличный профиль на Linkedin — СОВЕТЫ + ПРИМЕРЫ
- Создайте профессиональную учетную запись LinkedIn
- README профиля GitHub следующего уровня (NEW 2022) (шаблон Markdown) | Улучшите свои профили GitHub
- Создайте профессиональную учетную запись GitHub
- Как создать учетную запись Medium [шаг за шагом]
- Создайте профессиональную учетную запись Medium
3. Разработка программного обеспечения
Специалисты по данным — это прежде всего инженеры-программисты. Они могут не кодировать модели машинного обучения или алгоритмы обработки естественного языка на ежедневной основе, но работа, которую они выполняют как специалисты по данным, требует навыков разработки программного обеспечения и программирования, чтобы иметь возможность применять все жизненные циклы проекта по науке о данных на данные.
Специалисты по данным также должны уметь понимать потребности пользователей и разрабатывать решения для этих нужд, что очень важно для любого специалиста по данным, работающего в организации.
Хотя вы можете получить работу и внести огромный вклад, имея только навыки моделирования машинного обучения, ваши возможности трудоустройства увеличатся, если вы сможете написать хорошее программное обеспечение для реализации сложных систем искусственного интеллекта.
Эти навыки включают:
- Основы программирования
- Структуры данных (особенно те, которые относятся к машинному обучению, такие как фреймы данных)
- Алгоритмы (в том числе относящиеся к базам данных и манипулированию данными),
- Дизайн программного обеспечения
- Основные библиотеки Python включают TensorFlow или Pytorch, Scikit-learn, Numpy и Pandas.
- Контроль версий
Схема обучения (1,5 месяца):
- Специализация Python для всех (1 месяц)
- Программная инженерия для специалиста по данным (1 неделя)
- Проект разработки программного обеспечения на Python (1 неделя)
- Загрузите свой проект на GitHub
- Опубликуйте его в своих социальных сетях
Дополнительные ресурсы:
- Дорожная карта Python для науки о данных
- Дорожная карта разработки программного обеспечения для Data Scientist
- Эффективный Python для специалистов по данным
4. Математика для машинного обучения и специалистов по обработке и анализу данных
В области машинного обучения и науки о данных прочная математическая база необходима для понимания и реализации сложных алгоритмов. От линейной алгебры и многомерного исчисления до вероятности и статистики — существует множество различных математических концепций, важных для достижения успеха в этих областях.
Математика является основой алгоритмов машинного обучения и глубокого обучения, поэтому важно иметь сильную математическую подготовку в следующих областях:
- Линейная алгебра (векторы, матрицы и различные манипуляции с ними)
- Вероятность и статистика (включая дискретную и непрерывную вероятность, стандартные распределения вероятностей, основные правила, такие как независимость и правило Байеса, и проверку гипотез).
- Базовое интуитивное понимание исчисления
- Кроме того, исследовательский анализ данных (EDA) — использование визуализаций и других методов для систематического изучения набора данных — является недооцененным навыком.
Математика, необходимая для эффективного машинного обучения, меняется. Например, хотя некоторые задачи требуют исчисления, улучшенное программное обеспечение для автоматического дифференцирования позволяет изобретать и реализовывать новые архитектуры нейронных сетей без каких-либо вычислений. Это было почти невозможно десять лет назад.
Схема обучения: (1 месяц)
Дополнительные ресурсы:
- 6 лучших университетских курсов по изучению математики для машинного обучения и науки о данных
- 6 лучших книг для изучения математики для науки о данных и машинного обучения
5. Навыки работы с данными
Как специалист по данным, вы будете проводить большую часть своего времени, используя данные. Поэтому важно знать, как эффективно его использовать, начиная с того, как его собирать и хранить, как его очищать и исследовать. Таким образом, наличие сильных навыков работы с данными не сделает вас лучшим специалистом по данным, но также значительно облегчит вашу жизнь.
Вот основные навыки работы с данными, которыми вы должны овладеть как специалист по данным:
- Сбор данных
- Очистка данных
- Исследование данных
- Разработка функций
- Визуализация данных
Схема обучения: (2 месяца)
- Сертификат Google Data Analytics Professional (2 месяца)
- Специализация по анализу данных — Египет FWD (2 месяца)
- Очистка данных
- Разработка признаков для машинного обучения (2 недели)
- Проект анализа данных (1 неделя)
- Загрузите проект на GitHub
- Опубликуйте проект в своих социальных сетях
Дополнительные ресурсы:
6. Машинное обучение
Машинное обучение — это разновидность искусственного интеллекта, которая включает в себя обучение моделей для прогнозирования или принятия решений без явного программирования для этого. Специалисты по данным часто используют методы машинного обучения, такие как контролируемое и неконтролируемое обучение, для анализа и прогнозирования данных. Это может включать такие задачи, как классификация, регрессия, кластеризация и обработка естественного языка.
Важно очень хорошо понимать базовые модели и модели машинного обучения, такие как линейная регрессия, логистическая регрессия, нейронные сети, деревья решений, кластеризация и обнаружение аномалий.
Помимо конкретных моделей, еще более важно понимать основные концепции, лежащие в основе того, как и почему работает машинное обучение, такие как систематическая ошибка/дисперсия, функции стоимости, регуляризация, алгоритмы оптимизации и анализ ошибок.
Схема обучения (4 месяца):
- Специализация машинного обучения (2 месяца)
- Временные ряды в Python (2 недели)
- Регрессионный проект (2 недели)
- Классификационный проект (2 недели)
- Кластерный проект (2 недели)
- Загрузите проекты на GitHub
- Публикуйте проекты в своих социальных сетях
Вы можете прочитать больше о том, как создать проект, который поможет вам найти работу, в этой статье:
7. Основы глубокого обучения
Глубокое обучение — это область машинного обучения, которая включает обучение искусственных нейронных сетей с несколькими уровнями для выполнения таких задач, как распознавание изображений и речи, обработка естественного языка и принятие решений.
Ученые, работающие с данными, могут использовать методы глубокого обучения, чтобы повысить производительность своих моделей и делать прогнозы с более высоким уровнем точности. Это может быть особенно полезно при работе с большими и сложными наборами данных, которые сложно анализировать с помощью традиционных методов машинного обучения.
Глубокое обучение стало такой значительной частью машинного обучения, что трудно преуспеть в этой области, не разбираясь в нем! Полезно знать основы нейронных сетей, практические навыки их работы (такие как настройка гиперпараметров), сверточные сети, модели последовательностей и преобразователи.
Схема обучения (5 месяцев):
- Специализация глубокого обучения (2 месяца)
- Профессиональный сертификат разработчика TensorFlow (2 месяца)
- Проект компьютерного зрения (2 недели)
- Проект естественного языка (2 недели)
- Реализация документа по глубокому обучению с нуля (1 неделя)
- Загрузите проекты на GitHub
- Публикуйте проекты в своих социальных сетях
8. Операции машинного обучения и практическая обработка данных
В сегодняшней шумихе вокруг машинного обучения, когда многие организации интегрировали или пытаются интегрировать системы машинного обучения в свои продукты и платформы. При внедрении систем машинного обучения в производство возникает множество проблем, включая создание, интеграцию, тестирование, выпуск, развертывание и управление инфраструктурой.
Поэтому важно следовать передовой практике и знать, как преодолеть эти проблемы. Технологии MLOps — это инструменты и платформы, которые помогают организациям управлять и оптимизировать разработку, развертывание и обслуживание моделей машинного обучения.
MLOps, также известные как операции машинного обучения, — это практика применения принципов DevOps к машинному обучению. Это набор методов, который позволяет специалистам по данным и инженерам по машинному обучению сотрудничать, автоматизировать и управлять сквозным жизненным циклом машинного обучения. Некоторые ключевые практики MLOps для специалистов по данным включают в себя:
- Контроль версий. Использование систем контроля версий, таких как Git, для отслеживания изменений в коде, данных и моделях и совместной работы с другими членами команды.
- Автоматизированное тестирование. Использование автоматизированного тестирования для проверки правильности работы моделей и кода, а также для обнаружения и исправления ошибок на ранних этапах процесса разработки.
- Непрерывная интеграция и развертывание: автоматизация сборки, тестирования и развертывания моделей, чтобы их можно было легко развернуть в рабочей среде.
- Мониторинг и управление. Использование инструментов мониторинга и управления для отслеживания производительности моделей в производственной среде и выявления проблем, которые, возможно, необходимо решить.
- Управление экспериментами: отслеживание и управление экспериментами по машинному обучению, а также возможность воспроизводить результаты для лучшего понимания моделей и их производительности.
Внедряя эти методы, специалисты по данным могут гарантировать, что их модели надежны, надежны и могут быть развернуты в рабочей среде быстро и эффективно.
Схема обучения (3 месяца):
- Специализация «Инженерия машинного обучения для производства (MLOPs) (1 месяц)
- Практическая наука о данных по специализации AWS Cloud (1 месяц)
- Сквозной проект по науке о данных (1 месяц)
- Загрузите проект на GitHub
- Опубликуйте проект в своих социальных сетях
Дополнительные ресурсы:
9. Подготовьтесь к интервью
Теперь, после завершения вашего пути обучения, пришло время начать подавать заявки на должности в области науки о данных. Чтобы преуспеть на этом этапе, вам нужно сосредоточиться на основах, которые включают выдающееся резюме, портфолио, хорошие связи и четкое базовое понимание важных понятий, которые вам должны задать в типичной интервью по науке о данных.
Вот несколько ресурсов, которые помогут вам подготовить свое резюме и портфолио, а также узнать, чего ожидать от собеседования по науке о данных и как подготовиться к каждому из них.
- Чтобы понять, чего ожидать от процесса найма специалиста по обработке и анализу данных, прочитайте эту статью:
2. Чтобы иметь возможность написать выдающееся резюме
3. Как создать выдающееся портфолио
- Как создать портфолио по науке о данных, которое принесет вам работу?
- Советы менеджерам по найму, чтобы найти свою первую работу в области науки о данных
- Управляемые проекты: лучший способ изучить науку о данных
4. Как получить внутреннего реферала:
5. Подготовьтесь к поведенческому интервью по науке о данных:
6. Подготовьтесь к техническому собеседованию:
- Типы вопросов по машинному обучению в интервью по науке о данных и как к ним подготовиться
- Интервью по машинному обучению: вопросы и ответы для специалистов по данным
- Вопросы и ответы на интервью по глубокому обучению для специалистов по данным
- Вопросы и ответы на вероятностных интервью для специалистов по данным
- Вопросы и ответы на собеседованиях по статистике для специалистов по данным
- Вопросы и ответы на интервью по Python для специалистов по данным
- Интервью с SQL и базами данных. Вопросы и ответы для специалистов по данным
10. Заключительные замечания
10.1. Где учиться?
В Интернете много хорошего контента, и теоретически он может сработать. Но когда целью является глубокое понимание, они будут неэффективны, потому что склонны повторять друг друга, использовать непоследовательную терминологию (что замедляет работу), различаться по качеству и оставлять пробелы.
Вот почему хороший курс, в котором материал организован в связную и логическую форму, часто является наиболее эффективным по времени способом овладеть осмысленной совокупностью знаний. Моя рекомендация:
- Солидные учебники
- Курсера и Удасити
- Открытые курсы университета
Когда вы усвоите знания, доступные на курсах, вы можете переключиться на исследовательские работы и более продвинутые ресурсы.
10.2. Развитие навыков обучения
Учитывая, как быстро меняется наша область, у вас нет другого выбора, кроме как продолжать учиться, если вы хотите идти в ногу со временем. Чтобы не отставать от достижений в этой области, необходимо выработать привычку к ежедневному обучению. Эти три правила могут быть полезны:
- Правило двух дней. Над какой бы задачей вы ни хотели работать в своей повседневной системе, никогда не позволяйте себе пропускать более одного дня подряд. Пропуск одного дня не повредит вашему прогрессу, если вы не пропустите следующий день.
- Минимальный возможный прогресс. Никогда не пропускайте ни дня, но любой прогресс будет учитываться. Наличие плана работы над определенной целью, например, 3 часа в день; делать меньше, чем это будет считаться. Итак, золотое правило таково:
- Подход «30 из 30». Если вы хотите улучшить какой-либо навык, очень простой, но эффективный подход — заниматься им по 30 минут в течение 30 дней подряд. 30 дней по 30 минут в день — это в общей сложности 900 минут накопленных усилий, которые дадут очень значительные результаты.
Дополнительную информацию читайте:
- Атомные привычки
- Крошечные привычки
10.3. Избегайте синдрома самозванца
Синдром самозванца может быть обычным явлением для тех, кто работает в области искусственного интеллекта (ИИ) и науки о данных, особенно для тех, кто плохо знаком с этими областями или считает, что у них не так много опыта или знаний, как у их сверстников.
Это может привести к чувству неуверенности в себе и неадекватности, даже если нет никаких доказательств, подтверждающих эти чувства, которые могут повредить вашему карьерному росту и серьезно повлиять на ваше психическое здоровье.
Эти советы включают
- Ища наставничества и руководства,
- Создание прочного фундамента знаний
- Ищите возможности применить свои навыки
- Помнить, что все делают ошибки
- Ищите поддержки у своих сверстников и коллег.
Следуя этим советам, вы повысите свою уверенность и почувствуете себя увереннее в своих силах, если будете заниматься ИИ и наукой о данных.
Подробнее о том, как избежать синдрома самозванца, читайте в этой статье:
Если вы хотите начать карьеру в области науки о данных и искусственного интеллекта, но не знаете, как это сделать. Я предлагаю сеансы наставничества по науке о данных и долгосрочное наставничество по карьере:
- Долгосрочное наставничество: https://lnkd.in/dtdUYBrM
- Менторские сессии: https://lnkd.in/dXeg3KPW
Если вам понравилась статья и вы хотите меня поддержать, обязательно сделайте следующее:
- 👏 Похлопайте в историю (50 хлопков) и следуйте за мной 👉
- 📰 Смотрите больше контента в моем среднем профиле
- 🔔 Подпишитесь на меня: LinkedIn| Средний| Гитхаб | Твиттер
- 🚀👉 Присоединяйтесь к программе Среднее членство, чтобы продолжать обучение без ограничений. Я получу небольшую часть вашего членского взноса, если вы перейдете по следующей ссылке, без каких-либо дополнительных затрат с вашей стороны.