Я пытаюсь очистить ссылки на источники изображений, используя красивый суп с Amazon, но не получаю правильного результата, ссылка, откуда я очищаю: https://www.amazon.in/s?bbn=1389401031&rh=n%3A1389401031%2Cp_36%3A1318505031&dc&qid=1622460176&rnid=1318502031&ref=lp_1389401031_nr_p_36_2
ниже приведен код:
base_url = requests.get("https://www.amazon.in/mobile-phones/b/?ie=UTF8&node=1389401031&ref_=nav_cs_mobiles_9292c6cb7b394d30b2467b8f631090a7")
base_url
soup = BeautifulSoup(base_url.content,'html.parser')
search_url = soup.find_all("span",class_="a-list-item")
search_url
urls = []
abz = []
for i in search_url:
for j in i.find_all("a"):
urls.append(j["href"])
urls
lst = [x for x in urls if "%E2%82%" in x]
links_to_scrap = lst[2:4]
links_to_scrap
img_links = []
for url in links_to_scrap:
pname = requests.get("https://www.amazon.in/mobile-phones/b/ie=UTF8&node=1389401031&ref_=nav_cs_mobiles_9292c6cb7b394d30b2467b8f631090a7"+url)
soupp = BeautifulSoup(pname.content,'html.parser')
image = soupp.find_all("div",class_="a-section aok-relative s-image-wide-3-2-aspect")
for i in image:
for j in i.find_all("img"):
img_links.append(j["src"])
img_links