Pythonでliタグを取得するには、どのようにXPathを使用しますか？

2年 ago

芽依, 雨夜

1 minute

Pythonでは、HTMLやXMLドキュメント内のliタグを取得するためにXPathを使用することができます。最初に、関連するライブラリ（例：lxmlライブラリ）をインポートする必要があります。

以下は、liタグをXPathで取得するサンプルコードです。

from lxml import etree

# HTML或XML文档的示例字符串
html = """
<html>
  <body>
    <ul>
      <li>Item 1</li>
      <li>Item 2</li>
      <li>Item 3</li>
    </ul>
  </body>
</html>
"""

# 创建一个XPath解析器
parser = etree.HTMLParser()

# 将字符串解析为一个XPath可解析的对象
tree = etree.fromstring(html, parser)

# 使用XPath表达式获取li标签
li_tags = tree.xpath('//li')

# 遍历获取到的li标签
for li in li_tags:
    print(li.text)

以上のコードを実行すると、出力される内容は次のとおりです。

Item 1
Item 2
Item 3

XPath表現式’//li’では、//はドキュメント内のすべてのliタグを選択し、liはliタグを選択することを意味します。したがって、tree.xpath(‘//li’)はすべてのliタグを含むリストを返します。次に、このリストを反復処理して各liタグの内容を取得できます。

#Python #プログラミング