Независимо от того, являетесь ли вы недавним выпускником или профессионалом, желающим сменить карьеру, область науки о данных и искусственного интеллекта предлагает широкий спектр интересных и прибыльных возможностей. В этой статье я предлагаю вам бесплатное руководство, которое предоставит вам четкий и действенный план развития навыков и знаний, необходимых для достижения успеха в этой быстро развивающейся области. Следуя шагам, изложенным в этой дорожной карте, вы будете на пути к успешной и полезной карьере в области науки о данных и искусственного интеллекта.

Эта дорожная карта выведет вас на средний уровень, и я искренне верю, что вы сможете получить работу и начать свою карьеру после ее завершения. Однако, чтобы перейти на продвинутый уровень, вам нужно будет пройти более углубленные курсы, книги и исследовательские работы. Как вы увидите, большинство курсов будет от Coursera. Причина этого в том, что я считаю, что у них один из самых качественных практических и углубленных курсов, и в то же время вы можете подать заявку на финансовую помощь, если вы не можете платить за курсы, поэтому вы можете пройти их бесплатно. .

Я написал примерное время для каждого из путей обучения. Это время в днях и неделях, и я предполагал, что вы будете учиться 4 дня по пять дней в неделю. Итого 20 часов в неделю. В зависимости от этого вы можете рассчитать время, необходимое для завершения этой дорожной карты, в зависимости от вашего темпа.

Оглавление:

  1. Методология и грамотность науки о данных
  2. Настройка учетных записей
  3. Разработка программного обеспечения
  4. Математика для машинного обучения и специалистов по данным
  5. Навыки, связанные с данными
  6. Основы машинного обучения
  7. Основы глубокого обучения
  8. Операции машинного обучения и практическая обработка данных
  9. Подготовьтесь к интервью
  10. Заключительные комментарии
    10.1. Где учиться?
    10.2. Развитие навыков обучения
    10.3. Избегайте синдрома самозванца

Если вы хотите бесплатно изучать науку о данных и машинное обучение, ознакомьтесь со следующими ресурсами:

  • Бесплатные интерактивные дорожные карты для самостоятельного изучения науки о данных и машинного обучения. Начните здесь: https://aigents.co/learn/roadmaps/intro
  • Поисковая система для учебных ресурсов Data Science (БЕСПЛАТНО). Добавляйте в закладки свои любимые ресурсы, отмечайте статьи как завершенные и добавляйте учебные заметки. https://aigents.co/learn
  • Хотите изучить науку о данных с нуля при поддержке наставника и учебного сообщества? Присоединяйтесь к этому учебному кружку бесплатно: https://community.aigents.co/spaces/9010170/

Если вы хотите начать карьеру в области науки о данных и искусственного интеллекта, но не знаете, как это сделать. Я предлагаю сеансы наставничества по науке о данных и долгосрочное наставничество по карьере:

Присоединяйтесь к программе Среднее членство, чтобы продолжать обучение без ограничений. Я получу небольшую часть вашего членского взноса, если вы перейдете по следующей ссылке, без каких-либо дополнительных затрат с вашей стороны.



1. Методология и грамотность науки о данных

Первым шагом в этой дорожной карте является понимание методологии науки о данных и грамотности в отношении данных. На этом этапе вы поймете, что такое наука о данных, как структурировать проект по науке о данных и какие навыки необходимы для достижения успеха в этой области.

Методология науки о данных относится к процессу или шагам, которым следуют специалисты по данным для анализа и извлечения информации из данных. Обычно это включает в себя такие этапы, как исследование и очистка данных, выбор функций, построение и оценка модели, а также развертывание модели. Твердое понимание процесса и методологии науки о данных и того, чего ожидать на каждом этапе, поможет вам правильно структурировать свой проект и идеально пройти его.

Грамотность в области науки о данных относится к способности человека понимать концепции и инструменты науки о данных и работать с ними. Эти навыки включают в себя знание статистики, программирования и машинного обучения, а также способность общаться и представлять информацию на основе данных нетехническим заинтересованным сторонам. Важно иметь широкий взгляд на важные навыки, которые вам необходимо приобрести, чтобы добиться успеха в этой области.

Схема обучения (1 неделя):

Дополнительные ресурсы:

2. Настройка ваших учетных записей

Прежде чем углубляться в практические и теоретические темы, важно подготовить свои счета. Сюда входят ваши учетные записи LinkedIn, Medium и GitHub.

Как вы увидите на следующих шагах, вам придется использовать упомянутые выше социальные и профессиональные каналы. Им очень важно иметь профессиональную учетную запись в этих социальных сетях, поскольку они будут представлять вашу работу и помогут вам создать собственный бренд и авторитет в этой области.

В дополнение к этому вы сможете наладить очень хорошие связи, а также сможете следить за новостями и тенденциями в этой области от людей в этой области. Наконец, у вас будет профессиональный двусторонний канал связи с другими людьми, независимо от того, свяжутся ли с вами рекрутеры или вы сможете связаться с людьми в этой области, чтобы попросить совета или совета.

Схема обучения (2 дня):

3. Разработка программного обеспечения

Специалисты по данным — это прежде всего инженеры-программисты. Они могут не кодировать модели машинного обучения или алгоритмы обработки естественного языка на ежедневной основе, но работа, которую они выполняют как специалисты по данным, требует навыков разработки программного обеспечения и программирования, чтобы иметь возможность применять все жизненные циклы проекта по науке о данных на данные.

Специалисты по данным также должны уметь понимать потребности пользователей и разрабатывать решения для этих нужд, что очень важно для любого специалиста по данным, работающего в организации.

Хотя вы можете получить работу и внести огромный вклад, имея только навыки моделирования машинного обучения, ваши возможности трудоустройства увеличатся, если вы сможете написать хорошее программное обеспечение для реализации сложных систем искусственного интеллекта.

Эти навыки включают:

  • Основы программирования
  • Структуры данных (особенно те, которые относятся к машинному обучению, такие как фреймы данных)
  • Алгоритмы (в том числе относящиеся к базам данных и манипулированию данными),
  • Дизайн программного обеспечения
  • Основные библиотеки Python включают TensorFlow или Pytorch, Scikit-learn, Numpy и Pandas.
  • Контроль версий

Схема обучения (1,5 месяца):

Дополнительные ресурсы:

4. Математика для машинного обучения и специалистов по обработке и анализу данных

В области машинного обучения и науки о данных прочная математическая база необходима для понимания и реализации сложных алгоритмов. От линейной алгебры и многомерного исчисления до вероятности и статистики — существует множество различных математических концепций, важных для достижения успеха в этих областях.

Математика является основой алгоритмов машинного обучения и глубокого обучения, поэтому важно иметь сильную математическую подготовку в следующих областях:

  • Линейная алгебра (векторы, матрицы и различные манипуляции с ними)
  • Вероятность и статистика (включая дискретную и непрерывную вероятность, стандартные распределения вероятностей, основные правила, такие как независимость и правило Байеса, и проверку гипотез).
  • Базовое интуитивное понимание исчисления
  • Кроме того, исследовательский анализ данных (EDA) — использование визуализаций и других методов для систематического изучения набора данных — является недооцененным навыком.

Математика, необходимая для эффективного машинного обучения, меняется. Например, хотя некоторые задачи требуют исчисления, улучшенное программное обеспечение для автоматического дифференцирования позволяет изобретать и реализовывать новые архитектуры нейронных сетей без каких-либо вычислений. Это было почти невозможно десять лет назад.

Схема обучения: (1 месяц)

Дополнительные ресурсы:

5. Навыки работы с данными

Как специалист по данным, вы будете проводить большую часть своего времени, используя данные. Поэтому важно знать, как эффективно его использовать, начиная с того, как его собирать и хранить, как его очищать и исследовать. Таким образом, наличие сильных навыков работы с данными не сделает вас лучшим специалистом по данным, но также значительно облегчит вашу жизнь.

Вот основные навыки работы с данными, которыми вы должны овладеть как специалист по данным:

  • Сбор данных
  • Очистка данных
  • Исследование данных
  • Разработка функций
  • Визуализация данных

Схема обучения: (2 месяца)

Дополнительные ресурсы:

6. Машинное обучение

Машинное обучение — это разновидность искусственного интеллекта, которая включает в себя обучение моделей для прогнозирования или принятия решений без явного программирования для этого. Специалисты по данным часто используют методы машинного обучения, такие как контролируемое и неконтролируемое обучение, для анализа и прогнозирования данных. Это может включать такие задачи, как классификация, регрессия, кластеризация и обработка естественного языка.

Важно очень хорошо понимать базовые модели и модели машинного обучения, такие как линейная регрессия, логистическая регрессия, нейронные сети, деревья решений, кластеризация и обнаружение аномалий.

Помимо конкретных моделей, еще более важно понимать основные концепции, лежащие в основе того, как и почему работает машинное обучение, такие как систематическая ошибка/дисперсия, функции стоимости, регуляризация, алгоритмы оптимизации и анализ ошибок.

Схема обучения (4 месяца):

Вы можете прочитать больше о том, как создать проект, который поможет вам найти работу, в этой статье:

7. Основы глубокого обучения

Глубокое обучение — это область машинного обучения, которая включает обучение искусственных нейронных сетей с несколькими уровнями для выполнения таких задач, как распознавание изображений и речи, обработка естественного языка и принятие решений.

Ученые, работающие с данными, могут использовать методы глубокого обучения, чтобы повысить производительность своих моделей и делать прогнозы с более высоким уровнем точности. Это может быть особенно полезно при работе с большими и сложными наборами данных, которые сложно анализировать с помощью традиционных методов машинного обучения.

Глубокое обучение стало такой значительной частью машинного обучения, что трудно преуспеть в этой области, не разбираясь в нем! Полезно знать основы нейронных сетей, практические навыки их работы (такие как настройка гиперпараметров), сверточные сети, модели последовательностей и преобразователи.

Схема обучения (5 месяцев):

8. Операции машинного обучения и практическая обработка данных

В сегодняшней шумихе вокруг машинного обучения, когда многие организации интегрировали или пытаются интегрировать системы машинного обучения в свои продукты и платформы. При внедрении систем машинного обучения в производство возникает множество проблем, включая создание, интеграцию, тестирование, выпуск, развертывание и управление инфраструктурой.

Поэтому важно следовать передовой практике и знать, как преодолеть эти проблемы. Технологии MLOps — это инструменты и платформы, которые помогают организациям управлять и оптимизировать разработку, развертывание и обслуживание моделей машинного обучения.

MLOps, также известные как операции машинного обучения, — это практика применения принципов DevOps к машинному обучению. Это набор методов, который позволяет специалистам по данным и инженерам по машинному обучению сотрудничать, автоматизировать и управлять сквозным жизненным циклом машинного обучения. Некоторые ключевые практики MLOps для специалистов по данным включают в себя:

  1. Контроль версий. Использование систем контроля версий, таких как Git, для отслеживания изменений в коде, данных и моделях и совместной работы с другими членами команды.
  2. Автоматизированное тестирование. Использование автоматизированного тестирования для проверки правильности работы моделей и кода, а также для обнаружения и исправления ошибок на ранних этапах процесса разработки.
  3. Непрерывная интеграция и развертывание: автоматизация сборки, тестирования и развертывания моделей, чтобы их можно было легко развернуть в рабочей среде.
  4. Мониторинг и управление. Использование инструментов мониторинга и управления для отслеживания производительности моделей в производственной среде и выявления проблем, которые, возможно, необходимо решить.
  5. Управление экспериментами: отслеживание и управление экспериментами по машинному обучению, а также возможность воспроизводить результаты для лучшего понимания моделей и их производительности.

Внедряя эти методы, специалисты по данным могут гарантировать, что их модели надежны, надежны и могут быть развернуты в рабочей среде быстро и эффективно.

Схема обучения (3 месяца):

Дополнительные ресурсы:

9. Подготовьтесь к интервью

Теперь, после завершения вашего пути обучения, пришло время начать подавать заявки на должности в области науки о данных. Чтобы преуспеть на этом этапе, вам нужно сосредоточиться на основах, которые включают выдающееся резюме, портфолио, хорошие связи и четкое базовое понимание важных понятий, которые вам должны задать в типичной интервью по науке о данных.

Вот несколько ресурсов, которые помогут вам подготовить свое резюме и портфолио, а также узнать, чего ожидать от собеседования по науке о данных и как подготовиться к каждому из них.

  1. Чтобы понять, чего ожидать от процесса найма специалиста по обработке и анализу данных, прочитайте эту статью:

2. Чтобы иметь возможность написать выдающееся резюме

3. Как создать выдающееся портфолио

4. Как получить внутреннего реферала:

5. Подготовьтесь к поведенческому интервью по науке о данных:

6. Подготовьтесь к техническому собеседованию:

10. Заключительные замечания

10.1. Где учиться?

В Интернете много хорошего контента, и теоретически он может сработать. Но когда целью является глубокое понимание, они будут неэффективны, потому что склонны повторять друг друга, использовать непоследовательную терминологию (что замедляет работу), различаться по качеству и оставлять пробелы.

Вот почему хороший курс, в котором материал организован в связную и логическую форму, часто является наиболее эффективным по времени способом овладеть осмысленной совокупностью знаний. Моя рекомендация:

  • Солидные учебники
  • Курсера и Удасити
  • Открытые курсы университета

Когда вы усвоите знания, доступные на курсах, вы можете переключиться на исследовательские работы и более продвинутые ресурсы.

10.2. Развитие навыков обучения

Учитывая, как быстро меняется наша область, у вас нет другого выбора, кроме как продолжать учиться, если вы хотите идти в ногу со временем. Чтобы не отставать от достижений в этой области, необходимо выработать привычку к ежедневному обучению. Эти три правила могут быть полезны:

  • Правило двух дней. Над какой бы задачей вы ни хотели работать в своей повседневной системе, никогда не позволяйте себе пропускать более одного дня подряд. Пропуск одного дня не повредит вашему прогрессу, если вы не пропустите следующий день.
  • Минимальный возможный прогресс. Никогда не пропускайте ни дня, но любой прогресс будет учитываться. Наличие плана работы над определенной целью, например, 3 часа в день; делать меньше, чем это будет считаться. Итак, золотое правило таково:
  • Подход «30 из 30». Если вы хотите улучшить какой-либо навык, очень простой, но эффективный подход — заниматься им по 30 минут в течение 30 дней подряд. 30 дней по 30 минут в день — это в общей сложности 900 минут накопленных усилий, которые дадут очень значительные результаты.

Дополнительную информацию читайте:

  • Атомные привычки
  • Крошечные привычки

10.3. Избегайте синдрома самозванца

Синдром самозванца может быть обычным явлением для тех, кто работает в области искусственного интеллекта (ИИ) и науки о данных, особенно для тех, кто плохо знаком с этими областями или считает, что у них не так много опыта или знаний, как у их сверстников.

Это может привести к чувству неуверенности в себе и неадекватности, даже если нет никаких доказательств, подтверждающих эти чувства, которые могут повредить вашему карьерному росту и серьезно повлиять на ваше психическое здоровье.

Эти советы включают

  • Ища наставничества и руководства,
  • Создание прочного фундамента знаний
  • Ищите возможности применить свои навыки
  • Помнить, что все делают ошибки
  • Ищите поддержки у своих сверстников и коллег.

Следуя этим советам, вы повысите свою уверенность и почувствуете себя увереннее в своих силах, если будете заниматься ИИ и наукой о данных.

Подробнее о том, как избежать синдрома самозванца, читайте в этой статье:



Если вы хотите начать карьеру в области науки о данных и искусственного интеллекта, но не знаете, как это сделать. Я предлагаю сеансы наставничества по науке о данных и долгосрочное наставничество по карьере:

Если вам понравилась статья и вы хотите меня поддержать, обязательно сделайте следующее:

  • 👏 Похлопайте в историю (50 хлопков) и следуйте за мной 👉
  • 📰 Смотрите больше контента в моем среднем профиле
  • 🔔 Подпишитесь на меня: LinkedIn| Средний| Гитхаб | Твиттер
  • 🚀👉 Присоединяйтесь к программе Среднее членство, чтобы продолжать обучение без ограничений. Я получу небольшую часть вашего членского взноса, если вы перейдете по следующей ссылке, без каких-либо дополнительных затрат с вашей стороны.