Python:Примеры/Парсинг изображений с сайта: различия между версиями
Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску
Myagkij (обсуждение | вклад) (Новая страница: «{{Python/Панель перехода}} {{Myagkij-редактор}} =Парсинг изображений с сайта= =Код= <syntaxhighlight lang="python" line="GESHI_NORMAL_LINE_NUMBERS|GESHI_FANCY_LINE_NUMBERS"> import os import requests from bs4 import BeautifulSoup # URL страницы, на которой нужно найти изображения в классе "carousel-item" url = 'https://www.retrohandheldgames.com/bandai/black-rx-...») |
Myagkij (обсуждение | вклад) Нет описания правки |
||
Строка 3: | Строка 3: | ||
=Парсинг изображений с сайта= | =Парсинг изображений с сайта= | ||
Пример парсинга изображений с страницы https://www.retrohandheldgames.com/bandai/black-rx-3235. | |||
=Код= | =Код= |
Версия от 11:04, 18 июня 2023
Проверка/Оформление/Редактирование: Мякишев Е.А.
Парсинг изображений с сайта
Пример парсинга изображений с страницы https://www.retrohandheldgames.com/bandai/black-rx-3235.
Код
import os
import requests
from bs4 import BeautifulSoup
# URL страницы, на которой нужно найти изображения в классе "carousel-item"
url = 'https://www.retrohandheldgames.com/bandai/black-rx-3235'
# Создаем директорию для сохранения изображений
if not os.path.exists('images'):
os.makedirs('images')
# Отправляем GET-запрос на страницу
response = requests.get(url)
# Получаем HTML-код страницы
html = response.content
# Создаем объект BeautifulSoup для парсинга HTML
soup = BeautifulSoup(html, 'html.parser')
# Находим все элементы с классом "carousel-item"
carousel_items = soup.find_all(class_='carousel-item')
# Проходим по каждому элементу карусели
for item in carousel_items:
# Находим все изображения в текущем элементе карусели
images = item.find_all('img')
# Проходим по каждому изображению
for image in images:
# Получаем URL-адрес изображения
image_url = image['src']
# Формируем имя файла для сохранения
filename = os.path.join('images', os.path.basename(image_url))
# Отправляем GET-запрос на URL изображения и сохраняем файл
with open(filename, 'wb') as f:
response = requests.get(image_url)
f.write(response.content)
# Выводим сообщение о сохранении файла
print(f"Файл {filename} успешно сохранен")
См.также
Внешние ссылки