Я пытаюсь получить элементы в HTML-документе, содержащие следующий образец текста: # \ S {11}
<h2> this is cool #12345678901 </h2>
Итак, предыдущее будет соответствовать, используя:
soup('h2',text=re.compile(r' #\S{11}'))
И результаты будут примерно такими:
[u'blahblah #223409823523', u'thisisinteresting #293845023984']
Я могу получить весь соответствующий текст (см. Строку выше). Но я хочу, чтобы родительский элемент текста совпадал, поэтому я могу использовать его в качестве отправной точки для обхода дерева документа. В этом случае я бы хотел, чтобы возвращались все элементы h2, а не совпадение текста.
Идеи?
.parent
было потрясающе! Я никогда не думал об этом. Спасибо @nosklo. +1 25.10.2014.parent
. Пришлось использовать отладчик PyCharm, чтобы понять, что это не простая строка. 08.05.2018