Pythonでliタグを取得するには、どのようにXPathを使用しますか?
Pythonでは、HTMLやXMLドキュメント内のliタグを取得するためにXPathを使用することができます。最初に、関連するライブラリ(例:lxmlライブラリ)をインポートする必要があります。
以下は、liタグをXPathで取得するサンプルコードです。
from lxml import etree
# HTML或XML文档的示例字符串
html = """
<html>
<body>
<ul>
<li>Item 1</li>
<li>Item 2</li>
<li>Item 3</li>
</ul>
</body>
</html>
"""
# 创建一个XPath解析器
parser = etree.HTMLParser()
# 将字符串解析为一个XPath可解析的对象
tree = etree.fromstring(html, parser)
# 使用XPath表达式获取li标签
li_tags = tree.xpath('//li')
# 遍历获取到的li标签
for li in li_tags:
print(li.text)
以上のコードを実行すると、出力される内容は次のとおりです。
Item 1
Item 2
Item 3
XPath表現式’//li’では、//はドキュメント内のすべてのliタグを選択し、liはliタグを選択することを意味します。したがって、tree.xpath(‘//li’)はすべてのliタグを含むリストを返します。次に、このリストを反復処理して各liタグの内容を取得できます。