следуя совету из темы Как применить pos_tag_sents() для эффективного кадра данных pandas Я запускаю код, чтобы определить разные позиции для текста в одной из моих переменных.
Теперь, когда мне удалось создать интересующий столбец — sub['POS'] — как мне извлечь соответствующую информацию — все NN — и создать столбец для каждого из них?
print(sub['POS'])
5 [(e-mail, JJ), (new, JJ), (delhi, NN), ((, (),...
4 [(bangladesh, JJ), (garment, NN), (unions, NNS...
41 [(listen, VB), (blaze, NN), (wrecks, NNS), (te...
10 [(11:49, CD), (am, VBP), (,, ,), (september, V...
17 [(listen, JJ), (two, CD), (events, NNS), (plan...
в качестве вывода мне нужен новый столбец (здесь как «NN»), который содержит все NN для каждой строки.
df = pd.DataFrame(["delhi",
"garment" ,
"blaze",
NaN], columns=['NN'])