如何用Python的querylist库提取HTML中p标签的数据？

花韻仙語 2024-11-29 00:00:00 次阅读

html 中读取

标签数据

想要读取 html 中

标签中的数据，可以使用专业的框架，如 querylist。

querylist 是一个简单易用的 python 库，可以轻松地从 html 文档中提取数据。使用 querylist，你可以：

将 html 文档加载到一个 querylist 对象中。
使用 css 选择器找到所需的
标签。
获取每个
标签中包含的内容。

以下示例代码演示了如何使用 querylist 从 html 文档中提取

标签数据：

from querylist import QueryList

html = """
第四章 医学微生物学（助理不考）
第一节 微生物的基本概念
"""

ql = QueryList(html)
p_tags = ql.find('p')

data = []
for p in p_tags:
    data.append(p.text)

print(data)
# 输出：
# ['第四章 医学微生物学（助理不考）', '第一节 微生物的基本概念']