У управления продуктами ML есть проблема с переводом

Записки из промышленности

У управления продуктами ML есть проблема с переводом

Местная проблема перевода, обнаруженная в продуктах Data/ML

Создавать продукты машинного обучения сложно.

Я испытал трудности роста с обеих сторон проблемы — как Data Scientist и как Product Manager.

Часто цитируемая цифра (настолько распространенная в рекламе ML/MLOPs, что кажется клише) заключается в том, что 85% проектов ИИ не приносят ожидаемых результатов для бизнеса.

Слоан отмечает, что даже при наличии правильных данных, талантов и корпоративной стратегии только 20% компаний добиваются финансовой окупаемости инвестиций от инициатив ИИ.

Несмотря на этот низкий показатель успеха, проекты AI/ML никуда не денутся — 91,5% компаний постоянно инвестируют в AI.

Причин провала проекта машинного обучения множество: от проблем с исходными данными до плохого мониторинга. В этой серии статей я расскажу о трех основных проблемах, с которыми сталкиваются продукты машинного обучения, с которыми я сталкивался на своем опыте. Наслаждаться!

Проблема перевода. Часто существует явное несоответствие между потребностями бизнеса и решениями для обработки данных.

Проблема перевода в дикой природе:

Вот два преувеличенных, но удивительно распространенных сценария, в которых компании пытаются или не могут запустить инициативы ML. Надеюсь, они не попали слишком близко к цели:

1. «Сделайте поиск лучше»

Приа, менеджер по продукту, проводит месяц или около того, опрашивая клиентов в поисках способов улучшить мобильное приложение своей компании. Проанализировав все свои разговоры, она приходит к выводу, что людям не нравится функция поиска, потому что они не могут найти новый и интересный контент для просмотра.

Приа заметила, что обычное поведение заключается в том, что клиенты посещают поиск, становятся недовольными результатами и закрывают приложение. На самом деле, некоторые люди даже перешли на приложение конкурента из-за того, насколько плохим был опыт.

У Прии есть момент озарения: Может быть, новый специалист по данным сможет улучшить поиск!

Приа быстро запланировала встречу с командой Data Science и поделилась своей идеей — «используйте Data Science и машинное обучение, чтобы сделать поиск лучше». Приа не имеет технического образования и не знает точно, чем может помочь DS/ML, но предполагает, что у них есть какие-то хитрости в рукаве.

Дейв, специалист по данным, очень рад получить проблему, ориентированную на клиента! Следующие несколько недель он проводит за чтением новых статей о рекомендательных системах, внедрением нескольких из них, которые кажутся многообещающими, и тестированием их в автономном режиме. Он использует лучшие 5 рекомендаций в качестве своей метрики и считает, что передовая модель глубокого обучения работает лучше всего. После нескольких спринтов он представляет свои результаты Приа…

…и быстро понимает, что это не то, чего хотела Прия.

В следующем A/B-тесте, сравнивающем модель Дейва с текущей системой, клиенты действительно чаще нажимают на рекомендации из модели Дейва… но уходят почти с той же скоростью.

Это приводит Дэйва в восторг, потому что его алгоритм рекомендаций явно превосходит существующий статус-кво с точки зрения рейтинга кликов, а Прию разочаровывает, потому что он не решает фактическую основную проблему удержания.

Это гипотетический сценарий, но модель Дейва может быть более эффективной с точки зрения CTR, но с более низким уровнем удержания, поскольку она рекомендует только наиболее популярный контент. эти рекомендации разочаровывают

Это может показаться проблемой, связанной с недопониманием (и так оно и есть), но распространенность продуктовых/бизнес-инициатив, не согласующихся с конечными результатами науки о данных, ясно говорит о том, что здесь происходит что-то большее.

Бизнес-цели и потребности часто неправильно преобразуются в показатели Data Science.

2. Ориентированность на данные и клиентоориентированность

Вышеупомянутое несоответствие не обязательно должно происходить из конвейера от продукта к науке о данных; это также может исходить от увлеченного (но наивного) стратегического руководства, пытающегося внедрить машинное обучение в каждое предприятие. Если ты слышишь вопрос,

«Какие проекты машинного обучения мы можем реализовать с имеющимися данными?»

Ваша команда скрывается в опасной близости от территории рассогласования.

Существует бесчисленное количество проектов, связанных с машинным обучением, которые специалист по данным может придумать с помощью надежного набора данных… но на сколько из этих проектов можно положиться, чтобы обеспечить рентабельность инвестиций? Сколько из этих проектов могут оказать прямое и положительное влияние на текущие проблемы клиентов?

Меньше, чем вы можете себе представить.

Проекты по науке о данных без четкой структуры или связи с конкретной проблемой клиента часто не приносят пользы для бизнеса.

Определение проблемы

Постановка задачи. Как команда по разработке продукта, мы хотим, чтобы все в команде были на одной волне, чтобы мы могли быстро двигаться и правильно создавать наш продукт. Однако часто существует разрыв между бизнес-языком и языком данных. Нам нужно вместе решить,«какую именно проблему мы изучаем и пытаемся решить?» и «можем ли мы количественно определить критерии успеха?»

Это нигде не задокументировано и вызывает огромную боль со стороны Data Science, поскольку DS часто приходится делать большие скачки и делать предположения, чтобы добраться до бизнеса.
Это может быть неявно из-за того, какие карты JIRA выдвигаются

Масштабируемые решения

Наиболее важной частью решения проблемы перевода является ее признание и подготовка к ней.

Ниже приведены 2 прикладные стратегии, которые сработали для меня в прошлом. Не думайте, что это единственные пути продвижения вперед, а скорее предложения, которые могут вписаться в текущий процесс поиска продукта вашей командой.

1. Сервировка стола

Сервировка стола просто означает убедиться, что с самого начала достигнуто полное согласие. Многие из них кажутся очевидными, но наличие четкого письменного документа, в котором излагаются ответы на следующие важные вопросы и который получит одобрение со стороны как технических специалистов, так и заинтересованных сторон, связанных с продуктом, значительно повысит ваши шансы на создание ценности.

Несколько основных вопросов, на которые нужно ответить вместе:

Какую проблему клиента мы решаем? Размещение этого в верхней части документа гарантирует, что все предположения/решения, сделанные группой обработки данных, направлены на решение этой конкретной проблемы, а не на множество другие возможные проблемы там.

Как оценить успех эксперимента офлайн? Количественная оценка успеха продукта или потребности бизнеса — нетривиальная задача. Честно говоря, это основной навык сильного Data Scientist. Но сделать это правильно и добиться того, чтобы все с этим согласились, — основа повышения ценности продуктов машинного обучения.

Как количественно оценить успех онлайн-эксперимента? То же, что и выше, но это относится к тому, что мы ищем в A/B-тестировании — каким должен быть результат нашей системы? Некоторые показатели, такие как удержание клиентов, нельзя зафиксировать в офлайн-экспериментах.

Есть ли какие-либо блокираторы данных или моделей для решения этой проблемы клиента? Ожидается, что этот раздел будет часто обновляться на протяжении всего процесса обнаружения, а не только в начале. Наука о данных — это итеративный процесс. И команда данных столкнется с проблемами данных — это неизбежно. Наличие места для их документирования может раскрепостить как специалистов по данным, так и продуктовых групп, поскольку делает причины задержек приемлемыми, а уроки, извлеченные из неудач, очевидными. (Подробнее об этом в следующей записи блога!)

Все это можно упаковать во что-то вроде этого:

Это не обязательно делать на собрании, но это, безусловно, совместный опыт.

Хотя эта структура полезна, когда менеджер по продукту знает, как может помочь наука о данных (например, в сценарии № 1), мы можем расширить ее, чтобы она также поддерживала решения, основанные на данных (например, сценарий № 2).

Это может быть просто предоставление команде по науке о данных ранжированного списка (таблица Excel или что-то еще) со всеми выявленными проблемами клиентов и способами их решения. Это дает команде данных четкую основу для начала исследования данных и POC, а также гарантирует, что все разговоры связаны с проблемами клиентов.

Вы даже можете создать пространство, где люди могут добавлять комментарии, блокираторы и предложения POC под проблемами клиентов, обеспечивая более полную ясность по этим вопросам:

2. Детские шаги

Это может показаться небольшим изменением, но оно очень важно: ML не должен быть первой версией, которую вы тестируете, даже если ML — это именно та технология, которая вам нужна.

ML — это мощный инструмент, но с этой силой приходит сложность. Сохраняйте его как можно более простым как можно дольше.

В качестве менеджера по продукту: Попробуйте версию Волшебника страны Оз с реальными людьми, дающими ответы, чтобы увидеть, реагируют ли ваши клиенты на более персонализированный/кураторский ответ. Если они это сделают, обратитесь к машинному обучению, чтобы масштабировать свой эксперимент с Волшебником страны Оз. Если WOZ не обсуждается, посмотрите, может ли подход, основанный на правилах, быть достаточным, или, по крайней мере, посмотрите, насколько он эффективен.

Как специалист по данным: Всегда начинайте с фиктивной модели в качестве основы и убедитесь, что команда разработчиков продукта согласна со схемой проверки автономного эксперимента. Чрезвычайно полезно для вас и вашей команды контекстуализировать оценку точности по сравнению с простой для понимания моделью. Если ваша модель имеет точность тестирования 89 %, каждый может понять, что это впечатляющий прирост по сравнению с фиктивным достижением. Точность 51%… и не так уж впечатляет по сравнению с манекеном, достигающим точности 87%.

Мне, как специалисту по данным, трудно принять этот совет: Не используйте причудливую передовую модель машинного обучения с глубоким обучением, если у вас нет других вариантов. Они могут быть неинтересными, но регрессионные модели помогут вам решить 80% практически любой бизнес-проблемы. Только после того, как вы сделали несколько успешных итераций в продакшене, вы можете даже подумать о более глубокой архитектуре.

Заключение

Если вы испытываете эту боль, как PM или DS, я глубоко сочувствую и сожалею о вашей борьбе. Эта боль была настолько острой, что я руководил ML в старом проекте, и я даже думал о создании программного обеспечения, которое лучше всего справится с этой проблемой (отсюда скриншот Figma ранее в этом посте).

Я понял, что это не проблема технологии, а проблема организации и процесса, которую очень сложно решить с помощью новой технологии.

Вашей компании нужен кто-то (читай: ВЫ), который занял бы внутреннюю позицию по проблеме перевода и начал знакомить вашу группу по исследованию продукта с обновленным процессом.

В противном случае ваша команда останется с остальными 85% компаний, которые изо всех сил пытаются извлечь выгоду из машинного обучения.

Надеюсь, это было информативно и полезно!

Новые материалы

Как свинг-трейдеры могут использовать ИИ для больших выигрышей

По мере того как все больше и больше профессиональных трейдеров и активных розничных трейдеров узнают о возможностях, которые предоставляет искусственный интеллект и машинное обучение для улучшения..

Как построить любой стол

Я разработчик программного обеспечения. Я люблю делать вещи и всегда любил. Для меня программирование всегда было способом создавать вещи, используя только компьютер и мое воображение...

Обзор: Машинное обучение: классификация

Только что закончил третий курс курса 4 часть специализации по машинному обучению . Как и второй курс, он был посвящен низкоуровневой работе алгоритмов машинного обучения. Что касается..

Разработка расширений Qlik Sense с qExt

Использование современных инструментов веб-разработки для разработки крутых расширений Вы когда-нибудь хотели кнопку для установки переменной в приложении Qlik Sense? Когда-нибудь просили..

React Hooks: основы деструктуризации массива

Kent C. Dodds написал классный пост о том, как грядущая функция React под названием Hooks работает на капоте. Предстоящий хук React useState основан на деструктурировании массива, давайте..

Пакеты R, используемые в Tesla

Добро пожаловать обратно! R — очень популярный язык программирования, используемый множеством компаний, включая Tesla! Итак, давайте взглянем на некоторые пакеты R, которые использует Tesla...

Сокращение и слияние токенов для эффективных моделей VL: обзор

Часто в задачах, связанных с компьютерным зрением и НЛП, вычислительно затратная и требующая большого объема памяти обработка становится препятствием для более быстрого логического вывода модели, а..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Typescript Data Java NLP Front End Development Algorithms Computer Science Learning Programming Languages ChatGPT Tech Tutorial Reactjs Angular React Native Productivity Cybersecurity Python Programming Javascript Development Neural Networks Learning To Code Developer CSS Swift

У управления продуктами ML есть проблема с переводом