В последнее время я увлекаюсь машинным обучением, и вот некоторые из моих мыслей о жизненном цикле продукта, включающего ML. Моя команда и я недавно создали инструмент, который позволяет нам определять продукты, которые наши клиенты должны разрабатывать на основе продуктов своих конкурентов. Мы использовали Google Vision API и Product Search, чтобы справиться с этой проблемой.

У всего есть домен

Когда вы работаете над проектом, вы работаете в определенной области. Этот домен несет в себе уникальные характеристики и причуды, которые иногда требуют, чтобы кто-то с «опытом» успешно ориентировался в сообществе, культуре, инструментах и ​​​​истории.

Возьмем, к примеру, генное секвенирование. Моя хорошая подруга только что закончила магистратуру по экологии. Ее исследования касались как области изучения окружающей среды, так и геномики. Она собирала пробы воды до и после крупных пожаров. Она хотела понять связь между биологическими последовательностями, присутствующими в воде, и последствиями для здоровья экосистемы (я уверен, что ошибся). Давайте подумаем о некоторых вещах, необходимых для участия в этом проекте:

  • Технология отбора проб воды (коллекция)
  • Технология секвенирования генов (обработка)
  • Программное обеспечение для анализа последовательности генов (анализ)

Каждый из них представляет собой шаг на пути к сбору, обработке и подготовке данных для анализа, а также к анализу данных, специфичных для предметной области. Размышляя о фактических данных, стоящих за каждым из этих шагов, становится совершенно очевидным, что вы можете напортачить без каких-либо знаний в этой области.

  • Если ваша коллекция не стандартизирована и не разнообразна, вы можете легко прийти к неверным выводам, а также создать очень предвзятый набор данных.
  • Если ваша технология секвенирования генов настроена неправильно, вы можете получить плохое представление образцов.
  • Если вы используете программное обеспечение для анализа без каких-либо знаний предметной области, вы можете прийти к неверным выводам.

Все это говорит о том, что работа в определенной области требует определенного уровня знаний в этой области. Понимание передового опыта в отношении вашего конкретного набора данных и знания о том, как правильно организовать и подготовить эти данные, приходят со временем, проведенным в отрасли.

Модели машинного обучения действуют внутри системы:

Модели машинного обучения не служат цели, пока они не будут запущены в мир, чтобы что-то делать. Как правило, то, что они делают, влияет на что-то еще, что происходит в более крупной системе. Модель машинного обучения может быть основной функциональностью бизнеса, но она по-прежнему должна быть окружена интерфейсом, работать на рабочем столе, в Интернете или за API. Когда другие сервисы могут взаимодействовать и связываться с ним, появляется потенциал для высокой ценности.

Все, что происходит в Интернете, состоит из общения, выборов и действий. Люди, разрабатывающие машинное обучение, должны сознательно окружать себя людьми, которые могут построить полезную основу вокруг модели, чтобы сделать ее полезной.

Обратная связь, итерация, обратная связь, итерация:

Внедрение модели в реальный мир, решение реальных проблем и предоставление отзывов об эффективности этой модели должно быть одним из самых эффективных действий, которые любой может сделать, пытаясь построить модели машинного обучения.

Модели машинного обучения — это продукты; они являются частью продуктов. Продукты должны стать лучше. Их нужно улучшать и находить ценность. Единственный способ сделать это — пройти испытание.

Заключение:

Машинное обучение — это еще один инструмент в арсенале любого производителя продуктов. Чтобы создавать эффективные продукты, вам необходимо знание предметной области. Медицинскую технику не построить без юридических, медицинских, технологических знаний. Продукты — это сложные системы, и машинное обучение — лишь малая их часть. При создании машинного обучения необходимо учитывать UX/UI, дизайн, API, маркетинговую, финансовую и другие части продукта. Это всего лишь кусочек головоломки. И, наконец, итерация и обратная связь всегда будут лучшими инструментами для создания потрясающих продуктов.