В последнее время я увлекаюсь машинным обучением, и вот некоторые из моих мыслей о жизненном цикле продукта, включающего ML. Моя команда и я недавно создали инструмент, который позволяет нам определять продукты, которые наши клиенты должны разрабатывать на основе продуктов своих конкурентов. Мы использовали Google Vision API и Product Search, чтобы справиться с этой проблемой.
У всего есть домен
Когда вы работаете над проектом, вы работаете в определенной области. Этот домен несет в себе уникальные характеристики и причуды, которые иногда требуют, чтобы кто-то с «опытом» успешно ориентировался в сообществе, культуре, инструментах и истории.
Возьмем, к примеру, генное секвенирование. Моя хорошая подруга только что закончила магистратуру по экологии. Ее исследования касались как области изучения окружающей среды, так и геномики. Она собирала пробы воды до и после крупных пожаров. Она хотела понять связь между биологическими последовательностями, присутствующими в воде, и последствиями для здоровья экосистемы (я уверен, что ошибся). Давайте подумаем о некоторых вещах, необходимых для участия в этом проекте:
- Технология отбора проб воды (коллекция)
- Технология секвенирования генов (обработка)
- Программное обеспечение для анализа последовательности генов (анализ)
Каждый из них представляет собой шаг на пути к сбору, обработке и подготовке данных для анализа, а также к анализу данных, специфичных для предметной области. Размышляя о фактических данных, стоящих за каждым из этих шагов, становится совершенно очевидным, что вы можете напортачить без каких-либо знаний в этой области.
- Если ваша коллекция не стандартизирована и не разнообразна, вы можете легко прийти к неверным выводам, а также создать очень предвзятый набор данных.
- Если ваша технология секвенирования генов настроена неправильно, вы можете получить плохое представление образцов.
- Если вы используете программное обеспечение для анализа без каких-либо знаний предметной области, вы можете прийти к неверным выводам.
Все это говорит о том, что работа в определенной области требует определенного уровня знаний в этой области. Понимание передового опыта в отношении вашего конкретного набора данных и знания о том, как правильно организовать и подготовить эти данные, приходят со временем, проведенным в отрасли.
Модели машинного обучения действуют внутри системы:
Модели машинного обучения не служат цели, пока они не будут запущены в мир, чтобы что-то делать. Как правило, то, что они делают, влияет на что-то еще, что происходит в более крупной системе. Модель машинного обучения может быть основной функциональностью бизнеса, но она по-прежнему должна быть окружена интерфейсом, работать на рабочем столе, в Интернете или за API. Когда другие сервисы могут взаимодействовать и связываться с ним, появляется потенциал для высокой ценности.
Все, что происходит в Интернете, состоит из общения, выборов и действий. Люди, разрабатывающие машинное обучение, должны сознательно окружать себя людьми, которые могут построить полезную основу вокруг модели, чтобы сделать ее полезной.
Обратная связь, итерация, обратная связь, итерация:
Внедрение модели в реальный мир, решение реальных проблем и предоставление отзывов об эффективности этой модели должно быть одним из самых эффективных действий, которые любой может сделать, пытаясь построить модели машинного обучения.
Модели машинного обучения — это продукты; они являются частью продуктов. Продукты должны стать лучше. Их нужно улучшать и находить ценность. Единственный способ сделать это — пройти испытание.
Заключение:
Машинное обучение — это еще один инструмент в арсенале любого производителя продуктов. Чтобы создавать эффективные продукты, вам необходимо знание предметной области. Медицинскую технику не построить без юридических, медицинских, технологических знаний. Продукты — это сложные системы, и машинное обучение — лишь малая их часть. При создании машинного обучения необходимо учитывать UX/UI, дизайн, API, маркетинговую, финансовую и другие части продукта. Это всего лишь кусочек головоломки. И, наконец, итерация и обратная связь всегда будут лучшими инструментами для создания потрясающих продуктов.