Я работаю над приложением электронной коммерции. Большинство продуктов, которые у меня есть, содержат атрибут категории, а некоторые нет (около 70-30%). Я пытался использовать Weka для определения категории, но атрибуты, которые у меня есть являются строками (name, brand, price, description, category)
, поэтому все классификаторы не работают, поскольку атрибуты должны быть числовыми, номинальными или двоичными.
Кто-нибудь сталкивался с такой проблемой раньше?