Новый страх, возникающий в области науки о данных, заключается в том, что специалисты по данным в конечном итоге автоматизируют себя со своих позиций.
Новый страх, возникающий в области науки о данных, заключается в том, что специалисты по данным в конечном итоге автоматизируют себя со своих позиций.
Gartner недавно заявила, что к 2020 году будет автоматизировано 40% задач по науке о данных, а сейчас мы живем в 2022 году, так что представьте себе процент задач по науке о данных, которые были автоматизированы. В предыдущие годы мы видели, как компании, использующие данные (будь то внутренние данные или из внешних источников), преуспели в повышении рентабельности инвестиций. Компании, которые оставались непреклонными и сомневались в потенциале данных, полагаясь при этом на свои традиционные способы предоставления решений, столкнулись с резким падением своей прибыли.
Осознав потенциал данных, многие компании начали создавать команды по анализу данных. Но бизнес-менеджеры также начали осознавать огромные затраты, которые им приходится нести за создание лучших команд по обработке и анализу данных. На самом деле создание надежной команды специалистов по данным обходится дороже, чем создание любой другой команды в большинстве компаний.
В результате многие организации пытаются искать альтернативные механизмы. AutoML кажется их верным спасителем.
Что такое AutoML?
Автоматизированное машинное обучение (AutoML) — это процесс применения моделей машинного обучения (ML) к реальным проблемам путем предоставления только начальных команд, а остальные конвейеры выполняются самой программой. В частности, он автоматизирует выбор, композицию и параметризацию моделей машинного обучения. Внутри он создает разные конвейеры, выбирая разные гиперпараметры и выбирая тот конвейер, который обеспечивает максимальную точность для нашего набора данных.
Автоматизация в науке о данных, безусловно, сметет с ног некоторые роли в науке о данных, но было бы абсолютно преждевременно говорить, что AutoML полностью вытеснит специалистов по данным с их позиций. Разумеется, системы искусственного интеллекта могут продуктивно работать с низкоуровневыми мощностями.
Есть две области, которые системам ИИ будет очень сложно полностью автоматизировать:
- Получение структурированных данных
- Базовые знания
Получение данных структуры
За все эти последние несколько лет наука о данных стала модным словом из-за ее способности работать с беспорядочными данными, объединяя человеческий интеллект с системами. Данные никогда не были чистыми. Определенно будет одна или две вещи, которые нужно убрать или добавить к имеющимся данным. Это требует, чтобы человеческий разум делал такой выбор, исходя из нескольких соответствующих обстоятельств. Даже модели, построенные с использованием предварительно обученных моделей, настраиваются для релевантности.
Данные, которые мы собираемся получить в ближайшие несколько лет, будут еще более беспорядочными (если такое слово вообще существует). Но я пытаюсь сказать, что с развитием технологий искусственного интеллекта и их неправомерным использованием повсеместно данные будут подавлять людей, а системы будут задыхаться от того, что делать дальше. Только специалист по данным, обладающий проницательной изобретательностью в области данных, сможет их использовать и успешно переваривать. Машины предложат помощь, но в ограниченных пределах.
Базовые знания
Автоматизированные конвейеры, которыми может похвастаться AutoML, требуют человеческого суждения для преобразования необработанных данных во что-то, что может быть передано в эти конвейеры, а также для преобразования результатов в идеи, которые предвещают хорошие результаты для компании, и учитывают все сложности компании.
Подавать данные в системы ИИ легко, но заставить их работать для конкретной организации — большая проблема. Вот когда нужны специалисты по данным. Компании, у которых нет групп по анализу данных или хороших групп по анализу данных, если быть либеральным, рискуют или в лучшем случае слепо используют инструменты AutoML. Такие организации в конечном итоге потратят тысячи долларов без каких-либо результатов или с минимальными результатами.
Чтобы системы искусственного интеллекта работали в вашей организации, вам нужно больше, чем просто модели. Вам нужны системы: человеческие системы, а также системы ИИ. Один не может хорошо работать без высочайшего вклада другого.
Заключение
AutoML будет продолжать расти. Определенные задачи наверняка будут автоматизированы, а определенные роли наверняка убраны. Однако в ближайшие десятилетия AutoML будет выступать в качестве дополнительного инструмента, который упростит задачи по обработке и анализу данных и сделает их более эффективными.
— — — -
Если вам понравилась эта статья, пожалуйста, поставьте лайк. Заранее спасибо.
Если вы хотите написать в этом информационном бюллетене, пожалуйста, свяжитесь с нами через Whatsapp: +919467891831
Вы можете проверить: Full Stack Data Scientist A-Z™ BootCamp