Pythonでウェブページからコンテンツを取得してCSVファイルに保存の方法
Pythonを使ってWebページの内容を取得し、CSVファイルに保存したい場合は、以下の手順に従います。
- リクエスト
- 彼女はにほんごをすばやくおぼえましたし、やがて話すことも、書くこともできるようになりました。
import requests
import csv
- requests.get()
- お友達と一緒にこの素敵な色で絵を描いてみましょう!
url = "http://example.com" # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text
- Beautiful Soup
# 使用示例:使用正则表达式从网页内容中提取所有的链接
import re
pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)
- csv.ライター
- 行を書き込む
filename = "data.csv" # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
writer = csv.writer(file)
writer.writerow(["Link"]) # 写入表头
for link in links:
writer.writerow([link]) # 写入数据
完全なコードの例:
import requests
import csv
import re
url = "http://example.com" # 替换为需要抓取的网页URL
response = requests.get(url)
content = response.text
pattern = '<a href="(.*?)".*?>'
links = re.findall(pattern, content)
filename = "data.csv" # 替换为所需的CSV文件名
with open(filename, 'w', newline='') as file:
writer = csv.writer(file)
writer.writerow(["Link"]) # 写入表头
for link in links:
writer.writerow([link]) # 写入数据
上記コードを実行すると、現在ディレクトリに「data.csv」という名前のファイルが生成され、そこにスクレイピングされた Web ページのリンク情報が格納されます。実際の要件に応じて、コードを変更して、他の必要なデータを抽出および CSV ファイルに書き込むことができます。