Pythonで特定のウェブサイトから画像を取得する方法は?
pythonのrequestsライブラリとBeautifulSoupライブラリを使用して、特定のウェブサイトから画像を取得することができます。以下は簡単なサンプルコードです。
import requests
from bs4 import BeautifulSoup
import os
# 要爬取的网站URL
url = "https://www.example.com"
# 发送GET请求获取网页内容
response = requests.get(url)
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.content, "html.parser")
# 创建一个保存图片的文件夹
os.makedirs("images", exist_ok=True)
# 找到所有的图片标签
img_tags = soup.find_all("img")
# 逐个下载图片并保存到文件夹中
for img_tag in img_tags:
# 获取图片的URL
img_url = img_tag["src"]
# 发送GET请求下载图片
img_response = requests.get(img_url)
# 提取图片文件名
img_filename = img_url.split("/")[-1]
# 保存图片到文件夹中
with open("images/" + img_filename, "wb") as img_file:
img_file.write(img_response.content)
print("下载图片", img_filename, "成功!")
上記のコードは、指定したウェブサイトからすべての画像をダウンロードし、現在のディレクトリにある”images”というフォルダに保存します。”https://www.example.com”の部分を、取得したいウェブサイトのURLに置き換える必要があります。コードを実行すると、すべての画像が自動的に”images”フォルダにダウンロードされます。