Новый страх, возникающий в области науки о данных, заключается в том, что специалисты по данным в конечном итоге автоматизируют себя со своих позиций.

Новый страх, возникающий в области науки о данных, заключается в том, что специалисты по данным в конечном итоге автоматизируют себя со своих позиций.

Gartner недавно заявила, что к 2020 году будет автоматизировано 40% задач по науке о данных, а сейчас мы живем в 2022 году, так что представьте себе процент задач по науке о данных, которые были автоматизированы. В предыдущие годы мы видели, как компании, использующие данные (будь то внутренние данные или из внешних источников), преуспели в повышении рентабельности инвестиций. Компании, которые оставались непреклонными и сомневались в потенциале данных, полагаясь при этом на свои традиционные способы предоставления решений, столкнулись с резким падением своей прибыли.

Осознав потенциал данных, многие компании начали создавать команды по анализу данных. Но бизнес-менеджеры также начали осознавать огромные затраты, которые им приходится нести за создание лучших команд по обработке и анализу данных. На самом деле создание надежной команды специалистов по данным обходится дороже, чем создание любой другой команды в большинстве компаний.

В результате многие организации пытаются искать альтернативные механизмы. AutoML кажется их верным спасителем.

Что такое AutoML?

Автоматизированное машинное обучение (AutoML) — это процесс применения моделей машинного обучения (ML) к реальным проблемам путем предоставления только начальных команд, а остальные конвейеры выполняются самой программой. В частности, он автоматизирует выбор, композицию и параметризацию моделей машинного обучения. Внутри он создает разные конвейеры, выбирая разные гиперпараметры и выбирая тот конвейер, который обеспечивает максимальную точность для нашего набора данных.

Автоматизация в науке о данных, безусловно, сметет с ног некоторые роли в науке о данных, но было бы абсолютно преждевременно говорить, что AutoML полностью вытеснит специалистов по данным с их позиций. Разумеется, системы искусственного интеллекта могут продуктивно работать с низкоуровневыми мощностями.

Есть две области, которые системам ИИ будет очень сложно полностью автоматизировать:

  • Получение структурированных данных
  • Базовые знания

Получение данных структуры

За все эти последние несколько лет наука о данных стала модным словом из-за ее способности работать с беспорядочными данными, объединяя человеческий интеллект с системами. Данные никогда не были чистыми. Определенно будет одна или две вещи, которые нужно убрать или добавить к имеющимся данным. Это требует, чтобы человеческий разум делал такой выбор, исходя из нескольких соответствующих обстоятельств. Даже модели, построенные с использованием предварительно обученных моделей, настраиваются для релевантности.

Данные, которые мы собираемся получить в ближайшие несколько лет, будут еще более беспорядочными (если такое слово вообще существует). Но я пытаюсь сказать, что с развитием технологий искусственного интеллекта и их неправомерным использованием повсеместно данные будут подавлять людей, а системы будут задыхаться от того, что делать дальше. Только специалист по данным, обладающий проницательной изобретательностью в области данных, сможет их использовать и успешно переваривать. Машины предложат помощь, но в ограниченных пределах.

Базовые знания

Автоматизированные конвейеры, которыми может похвастаться AutoML, требуют человеческого суждения для преобразования необработанных данных во что-то, что может быть передано в эти конвейеры, а также для преобразования результатов в идеи, которые предвещают хорошие результаты для компании, и учитывают все сложности компании.

Подавать данные в системы ИИ легко, но заставить их работать для конкретной организации — большая проблема. Вот когда нужны специалисты по данным. Компании, у которых нет групп по анализу данных или хороших групп по анализу данных, если быть либеральным, рискуют или в лучшем случае слепо используют инструменты AutoML. Такие организации в конечном итоге потратят тысячи долларов без каких-либо результатов или с минимальными результатами.

Чтобы системы искусственного интеллекта работали в вашей организации, вам нужно больше, чем просто модели. Вам нужны системы: человеческие системы, а также системы ИИ. Один не может хорошо работать без высочайшего вклада другого.

Заключение

AutoML будет продолжать расти. Определенные задачи наверняка будут автоматизированы, а определенные роли наверняка убраны. Однако в ближайшие десятилетия AutoML будет выступать в качестве дополнительного инструмента, который упростит задачи по обработке и анализу данных и сделает их более эффективными.

— — — -

Если вам понравилась эта статья, пожалуйста, поставьте лайк. Заранее спасибо.

Если вы хотите написать в этом информационном бюллетене, пожалуйста, свяжитесь с нами через Whatsapp: +919467891831

Вы можете проверить: Full Stack Data Scientist A-Z™ BootCamp