Pythonでウェブページのコンテンツを取得して保存の方法

Pythonでウェブサイトのコンテンツをスクレイピングして保存するには、requestsライブラリを使用してHTTPリクエストを送信し、ウェブサイトのコンテンツを取得し、次にopen()関数を使用してコンテンツをローカルファイルに保存します。

ここでは、Webページのコンテンツをクローリングしてファイルに保存するために役立つ簡単なサンプルコードを以下に示します。

import requests

url = "https://example.com"  # 要抓取的网页地址

# 发送GET请求获取网页内容
response = requests.get(url)
content = response.text

# 将内容保存到文件
with open("output.html", "w", encoding="utf-8") as file:
    file.write(content)

print("内容已保存到output.html文件中。")

リクエストの送信、テキスト化、ファイルへの書き込み、保存成功の表示を行う

上記サンプルコードのファイル名は「output.html」になっていますので、必要に応じて保存したいファイル名に変更してください。また、取得した内容については必要に応じて解析や処理を行うことができます。

bannerAds