Хобрук: Ваш путь к мастерству в программировании

Очистить URL-адрес изображения

Я пытаюсь очистить ссылки на источники изображений, используя красивый суп с Amazon, но не получаю правильного результата, ссылка, откуда я очищаю: https://www.amazon.in/s?bbn=1389401031&rh=n%3A1389401031%2Cp_36%3A1318505031&dc&qid=1622460176&rnid=1318502031&ref=lp_1389401031_nr_p_36_2

ниже приведен код:

base_url = requests.get("https://www.amazon.in/mobile-phones/b/?ie=UTF8&node=1389401031&ref_=nav_cs_mobiles_9292c6cb7b394d30b2467b8f631090a7")  

base_url

soup = BeautifulSoup(base_url.content,'html.parser')

search_url = soup.find_all("span",class_="a-list-item")

search_url

urls = []

abz = []

for i in search_url:

    for j in i.find_all("a"):

        urls.append(j["href"])


urls

lst = [x for x in urls if "%E2%82%" in x]

links_to_scrap = lst[2:4]

links_to_scrap

img_links = []


for url in links_to_scrap:

    pname = requests.get("https://www.amazon.in/mobile-phones/b/ie=UTF8&node=1389401031&ref_=nav_cs_mobiles_9292c6cb7b394d30b2467b8f631090a7"+url)

    soupp = BeautifulSoup(pname.content,'html.parser')

    image = soupp.find_all("div",class_="a-section aok-relative s-image-wide-3-2-aspect")

    for i in image:

        for j in i.find_all("img"):

            img_links.append(j["src"])
img_links

  • Какой результат вы получаете, есть ли какие-либо ошибки? Пожалуйста, упомяните об этом. 31.05.2021
  • К вашему сведению, это очистка и очистка, а не лом или лом. 31.05.2021

Ответы:


1

Чтобы получить URL-адреса изображений с этой страницы Amazon, вы можете использовать этот пример:

import requests
from bs4 import BeautifulSoup


url = "https://www.amazon.in/s?bbn=1389401031&rh=n%3A1389401031%2Cp_36%3A1318505031&dc&qid=1622460176&rnid=1318502031&ref=lp_1389401031_nr_p_36_2"
headers = {
    "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:88.0) Gecko/20100101 Firefox/88.0"
}

soup = BeautifulSoup(requests.get(url, headers=headers).content, "html.parser")

for img in soup.select(".s-image"):
    print(img["src"])

Отпечатки:

https://m.media-amazon.com/images/I/71hEzQGO5qL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71A9Vo1BatL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71jG5HwkQQS._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71hEzQGO5qL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71GQUxuSpnS._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/710jkZNub3S._AC_UL320_.jpg
https://m.media-amazon.com/images/I/716nHhG9SWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71hEzQGO5qL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/713asoeJn7S._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71jG5HwkQQS._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/618MEYCaUQL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71A9Vo1BatL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71hEzQGO5qL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71sxlhYhKWL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/51UUJpcldDL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/81WVehzY2+L._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71nrZHQMZ7L._AC_UL320_.jpg
https://m.media-amazon.com/images/I/71U2SiHgbiL._AC_UL320_.jpg
https://m.media-amazon.com/images/I/41QsvcpKaZL._AC_UL320_.jpg
31.05.2021
Новые материалы

Учебные заметки JavaScript Object Oriented Labs
Вот моя седьмая неделя обучения программированию. После ruby ​​и его фреймворка rails я начал изучать самый популярный язык интерфейса — javascript. В отличие от ruby, javascript — это более..

Разбор строк запроса в vue.js
Иногда вам нужно получить данные из строк запроса, в этой статье показано, как это сделать. В жизни каждого дизайнера/разработчика наступает момент, когда им необходимо беспрепятственно..

Предсказание моей следующей любимой книги 📚 Благодаря данным Goodreads и машинному обучению 👨‍💻
«Если вы не любите читать, значит, вы не нашли нужную книгу». - J.K. Роулинг Эта статья сильно отличается от тех, к которым вы, возможно, привыкли . Мне очень понравилось поработать над..

Основы принципов S.O.L.I.D, Javascript, Git и NoSQL
каковы принципы S.O.L.I.D? Принципы SOLID призваны помочь разработчикам создавать надежные, удобные в сопровождении приложения. мы видим пять ключевых принципов. Принципы SOLID были разработаны..

Как настроить Selenium в проекте Angular
Угловой | Селен Как настроить Selenium в проекте Angular Держите свое приложение Angular и тесты Selenium в одной рабочей области и запускайте их с помощью Mocha. В этой статье мы..

Аргументы прогрессивного улучшения почти всегда упускают суть
В наши дни в кругах веб-разработчиков много болтают о Progressive Enhancement — PE, но на самом деле почти все аргументы с обеих сторон упускают самую фундаментальную причину, по которой PE..

Введение в Джанго Фреймворк
Схема «работать умно, а не усердно» В этой и последующих статьях я познакомлю вас с тем, что такое фреймворк Django и как создать свое первое приложение с помощью простых и понятных шагов, а..