Pythonでウェブページの情報を取得する方法は何ですか。

2年 ago

光, 明

1 minute

Pythonを使用してウェブページの情報をクロールするには、以下の手順を使用できます：

import requests
from bs4 import BeautifulSoup

url = "https://example.com"
response = requests.get(url)
content = response.text

soup = BeautifulSoup(content, "html.parser")

# 以提取所有<a>标签的链接为例
links = soup.find_all("a")
for link in links:
    print(link.get("href"))

Webページの情報を取得する際は、サイトの規則や法律を守ることが重要です。過度なリクエストやプライバシー規定の違反は避けましょう。また、一部のサイトはスクレイピングを防ぐ仕組みを導入している可能性がありますので、他のテクニックを使って回避する必要があります。