PythonでHTMLを解析する際にXPathを使用する方法は？

2年 ago

綾乃, 一希

1 minute

HTMLを解析するためにXPathを使用するために、Pythonのlxmlライブラリを使用することができます。以下は簡単な例です：

pip install lxml

import requests
from lxml import etree

url = 'https://example.com'  # 要解析的网页URL
response = requests.get(url)
html = response.text

tree = etree.HTML(html)

# 例如，获取所有的标题元素
titles = tree.xpath('//h1')

# 例如，提取所有标题的文本内容
for title in titles:
    print(title.text)

上記の手順を経ることで、XPathを使用してHTMLを解析し、必要なコンテンツを抽出できます。XPath式の中で、タグ名、属性、階層関係など、要素を選択するためのさまざまな構文を使用できます。具体的なXPathの構文については、XPathチュートリアルを参照してください。