Записки из промышленности

У управления продуктами ML есть проблема с переводом

Местная проблема перевода, обнаруженная в продуктах Data/ML

Создавать продукты машинного обучения сложно.

Я испытал трудности роста с обеих сторон проблемы — как Data Scientist и как Product Manager.

Часто цитируемая цифра (настолько распространенная в рекламе ML/MLOPs, что кажется клише) заключается в том, что 85% проектов ИИ не приносят ожидаемых результатов для бизнеса.

Слоан отмечает, что даже при наличии правильных данных, талантов и корпоративной стратегии только 20% компаний добиваются финансовой окупаемости инвестиций от инициатив ИИ.

Несмотря на этот низкий показатель успеха, проекты AI/ML никуда не денутся — 91,5% компаний постоянно инвестируют в AI.

Причин провала проекта машинного обучения множество: от проблем с исходными данными до плохого мониторинга. В этой серии статей я расскажу о трех основных проблемах, с которыми сталкиваются продукты машинного обучения, с которыми я сталкивался на своем опыте. Наслаждаться!

Проблема перевода. Часто существует явное несоответствие между потребностями бизнеса и решениями для обработки данных.

Проблема перевода в дикой природе:

Вот два преувеличенных, но удивительно распространенных сценария, в которых компании пытаются или не могут запустить инициативы ML. Надеюсь, они не попали слишком близко к цели:

1. «Сделайте поиск лучше»

Приа, менеджер по продукту, проводит месяц или около того, опрашивая клиентов в поисках способов улучшить мобильное приложение своей компании. Проанализировав все свои разговоры, она приходит к выводу, что людям не нравится функция поиска, потому что они не могут найти новый и интересный контент для просмотра.

Приа заметила, что обычное поведение заключается в том, что клиенты посещают поиск, становятся недовольными результатами и закрывают приложение. На самом деле, некоторые люди даже перешли на приложение конкурента из-за того, насколько плохим был опыт.

У Прии есть момент озарения: Может быть, новый специалист по данным сможет улучшить поиск!

Приа быстро запланировала встречу с командой Data Science и поделилась своей идеей — «используйте Data Science и машинное обучение, чтобы сделать поиск лучше». Приа не имеет технического образования и не знает точно, чем может помочь DS/ML, но предполагает, что у них есть какие-то хитрости в рукаве.

Дейв, специалист по данным, очень рад получить проблему, ориентированную на клиента! Следующие несколько недель он проводит за чтением новых статей о рекомендательных системах, внедрением нескольких из них, которые кажутся многообещающими, и тестированием их в автономном режиме. Он использует лучшие 5 рекомендаций в качестве своей метрики и считает, что передовая модель глубокого обучения работает лучше всего. После нескольких спринтов он представляет свои результаты Приа…

…и быстро понимает, что это не то, чего хотела Прия.

В следующем A/B-тесте, сравнивающем модель Дейва с текущей системой, клиенты действительно чаще нажимают на рекомендации из модели Дейва… но уходят почти с той же скоростью.

Это приводит Дэйва в восторг, потому что его алгоритм рекомендаций явно превосходит существующий статус-кво с точки зрения рейтинга кликов, а Прию разочаровывает, потому что он не решает фактическую основную проблему удержания.

Это гипотетический сценарий, но модель Дейва может быть более эффективной с точки зрения CTR, но с более низким уровнем удержания, поскольку она рекомендует только наиболее популярный контент. эти рекомендации разочаровывают

Это может показаться проблемой, связанной с недопониманием (и так оно и есть), но распространенность продуктовых/бизнес-инициатив, не согласующихся с конечными результатами науки о данных, ясно говорит о том, что здесь происходит что-то большее.

Бизнес-цели и потребности часто неправильно преобразуются в показатели Data Science.

2. Ориентированность на данные и клиентоориентированность

Вышеупомянутое несоответствие не обязательно должно происходить из конвейера от продукта к науке о данных; это также может исходить от увлеченного (но наивного) стратегического руководства, пытающегося внедрить машинное обучение в каждое предприятие. Если ты слышишь вопрос,

«Какие проекты машинного обучения мы можем реализовать с имеющимися данными?»

Ваша команда скрывается в опасной близости от территории рассогласования.

Существует бесчисленное количество проектов, связанных с машинным обучением, которые специалист по данным может придумать с помощью надежного набора данных… но на сколько из этих проектов можно положиться, чтобы обеспечить рентабельность инвестиций? Сколько из этих проектов могут оказать прямое и положительное влияние на текущие проблемы клиентов?

Меньше, чем вы можете себе представить.

Проекты по науке о данных без четкой структуры или связи с конкретной проблемой клиента часто не приносят пользы для бизнеса.

Определение проблемы

Постановка задачи. Как команда по разработке продукта, мы хотим, чтобы все в команде были на одной волне, чтобы мы могли быстро двигаться и правильно создавать наш продукт. Однако часто существует разрыв между бизнес-языком и языком данных. Нам нужно вместе решить,«какую именно проблему мы изучаем и пытаемся решить?» и «можем ли мы количественно определить критерии успеха?»

  • Это нигде не задокументировано и вызывает огромную боль со стороны Data Science, поскольку DS часто приходится делать большие скачки и делать предположения, чтобы добраться до бизнеса.
  • Это может быть неявно из-за того, какие карты JIRA выдвигаются

Масштабируемые решения

Наиболее важной частью решения проблемы перевода является ее признание и подготовка к ней.

Ниже приведены 2 прикладные стратегии, которые сработали для меня в прошлом. Не думайте, что это единственные пути продвижения вперед, а скорее предложения, которые могут вписаться в текущий процесс поиска продукта вашей командой.

1. Сервировка стола

Сервировка стола просто означает убедиться, что с самого начала достигнуто полное согласие. Многие из них кажутся очевидными, но наличие четкого письменного документа, в котором излагаются ответы на следующие важные вопросы и который получит одобрение со стороны как технических специалистов, так и заинтересованных сторон, связанных с продуктом, значительно повысит ваши шансы на создание ценности.

Несколько основных вопросов, на которые нужно ответить вместе:

Какую проблему клиента мы решаем? Размещение этого в верхней части документа гарантирует, что все предположения/решения, сделанные группой обработки данных, направлены на решение этой конкретной проблемы, а не на множество другие возможные проблемы там.

Как оценить успех эксперимента офлайн? Количественная оценка успеха продукта или потребности бизнеса — нетривиальная задача. Честно говоря, это основной навык сильного Data Scientist. Но сделать это правильно и добиться того, чтобы все с этим согласились, — основа повышения ценности продуктов машинного обучения.

Как количественно оценить успех онлайн-эксперимента? То же, что и выше, но это относится к тому, что мы ищем в A/B-тестировании — каким должен быть результат нашей системы? Некоторые показатели, такие как удержание клиентов, нельзя зафиксировать в офлайн-экспериментах.

Есть ли какие-либо блокираторы данных или моделей для решения этой проблемы клиента? Ожидается, что этот раздел будет часто обновляться на протяжении всего процесса обнаружения, а не только в начале. Наука о данных — это итеративный процесс. И команда данных столкнется с проблемами данных — это неизбежно. Наличие места для их документирования может раскрепостить как специалистов по данным, так и продуктовых групп, поскольку делает причины задержек приемлемыми, а уроки, извлеченные из неудач, очевидными. (Подробнее об этом в следующей записи блога!)

Все это можно упаковать во что-то вроде этого:

Это не обязательно делать на собрании, но это, безусловно, совместный опыт.

Хотя эта структура полезна, когда менеджер по продукту знает, как может помочь наука о данных (например, в сценарии № 1), мы можем расширить ее, чтобы она также поддерживала решения, основанные на данных (например, сценарий № 2).

Это может быть просто предоставление команде по науке о данных ранжированного списка (таблица Excel или что-то еще) со всеми выявленными проблемами клиентов и способами их решения. Это дает команде данных четкую основу для начала исследования данных и POC, а также гарантирует, что все разговоры связаны с проблемами клиентов.

Вы даже можете создать пространство, где люди могут добавлять комментарии, блокираторы и предложения POC под проблемами клиентов, обеспечивая более полную ясность по этим вопросам:

2. Детские шаги

Это может показаться небольшим изменением, но оно очень важно: ML не должен быть первой версией, которую вы тестируете, даже если ML — это именно та технология, которая вам нужна.

ML — это мощный инструмент, но с этой силой приходит сложность. Сохраняйте его как можно более простым как можно дольше.

В качестве менеджера по продукту: Попробуйте версию Волшебника страны Оз с реальными людьми, дающими ответы, чтобы увидеть, реагируют ли ваши клиенты на более персонализированный/кураторский ответ. Если они это сделают, обратитесь к машинному обучению, чтобы масштабировать свой эксперимент с Волшебником страны Оз. Если WOZ не обсуждается, посмотрите, может ли подход, основанный на правилах, быть достаточным, или, по крайней мере, посмотрите, насколько он эффективен.

Как специалист по данным: Всегда начинайте с фиктивной модели в качестве основы и убедитесь, что команда разработчиков продукта согласна со схемой проверки автономного эксперимента. Чрезвычайно полезно для вас и вашей команды контекстуализировать оценку точности по сравнению с простой для понимания моделью. Если ваша модель имеет точность тестирования 89 %, каждый может понять, что это впечатляющий прирост по сравнению с фиктивным достижением. Точность 51%… и не так уж впечатляет по сравнению с манекеном, достигающим точности 87%.

Мне, как специалисту по данным, трудно принять этот совет: Не используйте причудливую передовую модель машинного обучения с глубоким обучением, если у вас нет других вариантов. Они могут быть неинтересными, но регрессионные модели помогут вам решить 80% практически любой бизнес-проблемы. Только после того, как вы сделали несколько успешных итераций в продакшене, вы можете даже подумать о более глубокой архитектуре.

Заключение

Если вы испытываете эту боль, как PM или DS, я глубоко сочувствую и сожалею о вашей борьбе. Эта боль была настолько острой, что я руководил ML в старом проекте, и я даже думал о создании программного обеспечения, которое лучше всего справится с этой проблемой (отсюда скриншот Figma ранее в этом посте).

Я понял, что это не проблема технологии, а проблема организации и процесса, которую очень сложно решить с помощью новой технологии.

Вашей компании нужен кто-то (читай: ВЫ), который занял бы внутреннюю позицию по проблеме перевода и начал знакомить вашу группу по исследованию продукта с обновленным процессом.

В противном случае ваша команда останется с остальными 85% компаний, которые изо всех сил пытаются извлечь выгоду из машинного обучения.

Надеюсь, это было информативно и полезно!