Я столкнулся с проблемой при извлечении тегов 'a' из https://www.symantec.com/index.jsp< /а>.
Ниже приведен код, который дает мне пустой набор «ссылок».
from bs4 import BeautifulSoup
import urllib2
response = urllib2.urlopen('https://www.symantec.com/index.jsp').read()
soup = BeautifulSoup(response, 'html.parser')
links = soup.find_all('a')
print(links)
Для других URL-адресов код работает, но не работает для этого. Это из-за того, что index.jsp является динамическим? Какое может быть разрешение?
Я использую питон 2.7.
SoupStrainer
и передать его в качестве аргументаparse_only
для экономии времени и памяти. 27.12.2015