Pythonでラベル属性値を取得する方法

Pythonでは、BeautifulSoupライブラリを使用して、HTMLドキュメントをパースし、タグの属性値を取得できます。

BeautifulSoupライブラリをインストールするには、まず、ターミナルで以下のコマンドを実行します。

pip install beautifulsoup4

そして、以下のコードを使用してラベルの属性値を取得できます。

from bs4 import BeautifulSoup

# 创建BeautifulSoup对象
html = """
<html>
<head>
<title>标题</title>
</head>
<body>
<a href="https://www.example.com">链接</a>
<img src="image.jpg" alt="图片">
</body>
</html>
"""

soup = BeautifulSoup(html, 'html.parser')

# 获取a标签的href属性值
a_tag = soup.find('a')
href = a_tag.get('href')
print(href)

# 获取img标签的src和alt属性值
img_tag = soup.find('img')
src = img_tag.get('src')
alt = img_tag.get('alt')
print(src, alt)

上記コードを実行すると、以下の結果が出力されます。

https://www.example.com
image.jpg 图片

BeautifulSoupオブジェクトを作成してHTMLドキュメントをパースしています。その後、 findメソッドを使用して対応するタグを探しています。最後に、 getメソッドを使用してタグの属性値を取得しています。

注意:タグに指定の属性がない場合は、get メソッドは None を返します。存在しない属性のデフォルト値を取得する場合は、get メソッドの 2 番目の引数(例:get(‘alt’, ‘デフォルト値’))を使用できます。

bannerAds