Хобрук: Ваш путь к мастерству в программировании

NLTK RegEx Chunker — подстановочный знак соответствует любому тегу POS?

Я использую RegexpParser NLTK для получения фраз из слов с POS-тегами. Например:

grammar = """
        FOUND:{<NNP>+<CD>+<,>+<CD>}
        ...
        """

pos_tagged_words = [('February', 'NNP'), ('14', 'CD'), (',', ','), ('1993', 'CD')]

result = nltk.RegexpParser(grammar).parse(pos_tagged_words)

Есть ли способ сопоставить тег подстановочного знака? Если бы это сработало, я бы искал что-то вроде этого:

FOUND:{<NNP>?<.>*<VBZ>}

Где ‹.> — подстановочный знак.

РЕДАКТИРОВАТЬ:
Нашел довольно плохой способ сделать это, который на самом деле не включает все символы. Все равно был бы признателен за специальный подстановочный знак.

FOUND:{<NNP>?<[A-Z]+|[:punct:]+>*<VBZ>}
10.09.2014

  • Нельзя ли заменить <[A-Z]+|[:punct:]+>* на <.*?> или что-то подобное? . обычно обозначает символы, отличные от новой строки, но я не уверен в RegexpParser NLTK. 10.09.2014

Ответы:


1

Попробуй это:

{<NNP>?<.*>*<VBZ>}
11.09.2014
Новые материалы

Создание кнопочного меню с использованием HTML, CSS и JavaScript
Вы будете создавать кнопочное меню, которое имеет состояние наведения, а также позволяет вам выбирать кнопку при нажатии на нее. Финальный проект можно увидеть в этом Codepen . Шаг 1..

Внедрите OAuth в свои веб-приложения для повышения безопасности
OAuth — это широко распространенный стандарт авторизации, который позволяет приложениям получать доступ к ресурсам от имени пользователя, не раскрывая его пароль. Это позволяет пользователям..

Классы в JavaScript
class является образцом java Script Object. Конструкция «class» позволяет определять классы на основе прототипов с чистым, красивым синтаксисом. // define class Human class Human {..

Как свинг-трейдеры могут использовать ИИ для больших выигрышей
По мере того как все больше и больше профессиональных трейдеров и активных розничных трейдеров узнают о возможностях, которые предоставляет искусственный интеллект и машинное обучение для улучшения..

Как построить любой стол
Я разработчик программного обеспечения. Я люблю делать вещи и всегда любил. Для меня программирование всегда было способом создавать вещи, используя только компьютер и мое воображение...

Обзор: Машинное обучение: классификация
Только что закончил третий курс курса 4 часть специализации по машинному обучению . Как и второй курс, он был посвящен низкоуровневой работе алгоритмов машинного обучения. Что касается..

Разработка расширений Qlik Sense с qExt
Использование современных инструментов веб-разработки для разработки крутых расширений Вы когда-нибудь хотели кнопку для установки переменной в приложении Qlik Sense? Когда-нибудь просили..