Хобрук: Ваш путь к мастерству в программировании

профилирование пользователей и обнаружение выбросов

У меня есть набор данных, включающий 1 миллион клиентов. Они разделены на несколько категорий, таких как покупатели электроники, покупатели продуктов питания и напитков и т. д. Названия групп представляют профили клиентов.

у каждого клиента разное поведение. Например, предположим, что электронный покупатель покупает хотя бы одно электронное устройство, когда он ходит по магазинам. Эта транзакция повторяется случайным образом или постоянно. Так что каждую транзакцию я представляю числовыми кодами.

(Стоимость транзакции, объем транзакции, тип транзакции и т. д.) = (100,200,1)

для каждой транзакции у меня есть этот вектор выше. Это означает, что у каждого клиента свое торговое поведение.

Я хочу узнать, есть ли у каждого клиента шаблон? Есть ли у нас выбросы?

это проблема профилирования в основном.

какой анализ посоветуете?

21.03.2014

Ответы:


1

Можете быть более конкретными? Что именно вы пытаетесь получить от анализа? Модели покупок, исключительные клиенты, необычные покупки?

Если вы хотите определить, какие товары покупаются вместе, сгруппируйте транзакции вместе, просто перечислив товары, купленные одновременно, и проведите анализ корзины покупок, используя априорный алгоритм или аналогичный.

Если вы хотите найти похожих клиентов, используйте k ближайших соседей или k означает против вектора, представляющего шаблоны покупок клиента (возможно, только купленные товары). Вы можете сделать это для отдельных транзакций, а также для сравнения транзакций.

Чтобы определить выбросы, вы можете использовать алгоритм кластеризации на основе плотности (например, DBSCAN), чтобы сгруппировать клиентов, которые находятся рядом друг с другом, и посмотреть на тех клиентов, которые не входят в кластеры, чтобы также определить выбросы.

21.03.2014
  • Спасибо за ваш ответ. Я утверждаю, что у каждого клиента есть особый шаблон, и каждый вектор устанавливает этот шаблон. Если у вас есть ненормальная транзакция среди ваших тысяч транзакций, это влияет на ваше торговое поведение. И мы называем это выбросом. Это подозрительная картина. Нужно ли мне проверять, коррелируют ли векторы друг с другом? 21.03.2014
  • Новые материалы

    Основы принципов S.O.L.I.D, Javascript, Git и NoSQL
    каковы принципы S.O.L.I.D? Принципы SOLID призваны помочь разработчикам создавать надежные, удобные в сопровождении приложения. мы видим пять ключевых принципов. Принципы SOLID были разработаны..

    Как настроить Selenium в проекте Angular
    Угловой | Селен Как настроить Selenium в проекте Angular Держите свое приложение Angular и тесты Selenium в одной рабочей области и запускайте их с помощью Mocha. В этой статье мы..

    Аргументы прогрессивного улучшения почти всегда упускают суть
    В наши дни в кругах веб-разработчиков много болтают о Progressive Enhancement — PE, но на самом деле почти все аргументы с обеих сторон упускают самую фундаментальную причину, по которой PE..

    Введение в Джанго Фреймворк
    Схема «работать умно, а не усердно» В этой и последующих статьях я познакомлю вас с тем, что такое фреймворк Django и как создать свое первое приложение с помощью простых и понятных шагов, а..

    Настольный ПК как «одно кольцо, чтобы править всеми» домашних компьютеров
    Вид после 9 месяцев использования С настольных компьютеров все началось, но в какой-то момент они стали «серверами», и мы все перешли на ноутбуки. В прошлом году я столкнулся с идеей настольных..

    Расширенные методы безопасности для VueJS: реализация аутентификации без пароля
    Руководство, которое поможет вам создавать безопасные приложения в долгосрочной перспективе Безопасность приложений часто упускается из виду в процессе разработки, потому что основная..

    стройный-i18следующий
    Представляем стройную оболочку для i18next. Эта библиотека, основанная на i18next, заключает экземпляр i18next в хранилище svelte и отслеживает события i18next, такие как languageChanged,..