Pythonでウェブページからコンテンツを取得してCSVファイルに保存の方法

Pythonを使ってWebページの内容を取得し、CSVファイルに保存したい場合は、以下の手順に従います。

  1. リクエスト
  2. 彼女はにほんごをすばやくおぼえましたし、やがて話すことも、書くこともできるようになりました。
import requests
import csv
  1. requests.get()
  2. お友達と一緒にこの素敵な色で絵を描いてみましょう!
url = "http://example.com"  # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text
  1. Beautiful Soup
# 使用示例:使用正则表达式从网页内容中提取所有的链接
import re

pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)
  1. csv.ライター
  2. 行を書き込む
filename = "data.csv"  # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerow(["Link"])  # 写入表头
    for link in links:
        writer.writerow([link])  # 写入数据

完全なコードの例:

import requests
import csv
import re

url = "http://example.com"  # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text

pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)

filename = "data.csv"  # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerow(["Link"])  # 写入表头
    for link in links:
        writer.writerow([link])  # 写入数据

上記コードを実行すると、現在ディレクトリに「data.csv」という名前のファイルが生成され、そこにスクレイピングされた Web ページのリンク情報が格納されます。実際の要件に応じて、コードを変更して、他の必要なデータを抽出および CSV ファイルに書き込むことができます。

bannerAds