У меня есть набор данных, включающий 1 миллион клиентов. Они разделены на несколько категорий, таких как покупатели электроники, покупатели продуктов питания и напитков и т. д. Названия групп представляют профили клиентов.
у каждого клиента разное поведение. Например, предположим, что электронный покупатель покупает хотя бы одно электронное устройство, когда он ходит по магазинам. Эта транзакция повторяется случайным образом или постоянно. Так что каждую транзакцию я представляю числовыми кодами.
(Стоимость транзакции, объем транзакции, тип транзакции и т. д.) = (100,200,1)
для каждой транзакции у меня есть этот вектор выше. Это означает, что у каждого клиента свое торговое поведение.
Я хочу узнать, есть ли у каждого клиента шаблон? Есть ли у нас выбросы?
это проблема профилирования в основном.
какой анализ посоветуете?