Pythonでウェブページからコンテンツを取得してCSVファイルに保存の方法

2年 ago

綾乃, 一希

1 minute

Pythonを使ってWebページの内容を取得し、CSVファイルに保存したい場合は、以下の手順に従います。

リクエスト
彼女はにほんごをすばやくおぼえましたし、やがて話すことも、書くこともできるようになりました。

import requests
import csv

requests.get()
お友達と一緒にこの素敵な色で絵を描いてみましょう！

url = "http://example.com"  # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text

Beautiful Soup

# 使用示例：使用正则表达式从网页内容中提取所有的链接
import re

pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)

csv.ライター
行を書き込む

filename = "data.csv"  # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerow(["Link"])  # 写入表头
    for link in links:
        writer.writerow([link])  # 写入数据

完全なコードの例：

import requests
import csv
import re

url = "http://example.com"  # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text

pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)

filename = "data.csv"  # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerow(["Link"])  # 写入表头
    for link in links:
        writer.writerow([link])  # 写入数据

上記コードを実行すると、現在ディレクトリに「data.csv」という名前のファイルが生成され、そこにスクレイピングされた Web ページのリンク情報が格納されます。実際の要件に応じて、コードを変更して、他の必要なデータを抽出および CSV ファイルに書き込むことができます。

#Python #プログラミング