Вот мой набор данных:
https://app.box.com/s/yotsy58ud2k9yk7vs7sj8ksc0favhevv
Я пытаюсь создать частотную таблицу тегов из одного столбца со следующей структурой:
Я пробовал использовать qdap
для простоты, но результат неверный
library(qdap)
tags_df <- read.csv(file.choose())
freq_terms(tags_df$tags)
Решение
Просто улучшая (создавая фрейм данных и сортируя) решение, данное Руи:
sp <- unlist(strsplit(as.character(unlist(tags_df$tags)),'^c\\(|,|"|\\)'))
inx <- sapply(sp, function(y) nchar(trimws(y)) > 0 & !is.na(y))
data <- as_data_frame(table(tolower(sp[inx])))
data <- data[with(data,order(-n)),]
data <- data[1:10,]
sort
. См. страницу справкиhelp("sort")
. 25.01.2018