如何用Python的querylist库提取HTML中p标签的数据?

html 中读取

标签数据

想要读取 html 中

标签中的数据,可以使用专业的框架,如 querylist。

querylist 是一个简单易用的 python 库,可以轻松地从 html 文档中提取数据。使用 querylist,你可以:

  1. 将 html 文档加载到一个 querylist 对象中。
  2. 使用 css 选择器找到所需的

    标签。

  3. 获取每个

    标签中包含的内容。

以下示例代码演示了如何使用 querylist 从 html 文档中提取

标签数据:

from querylist import Query

List html = """

第四章 医学微生物学(助理不考)

第一节 微生物的基本概念

""" ql = QueryList(html) p_tags = ql.find('p') data = [] for p in p_tags: data.append(p.text) print(data) # 输出: # ['第四章 医学微生物学(助理不考)', '第一节 微生物的基本概念']

通过使用 querylist,你可以轻松地从 html 文档中提取

标签数据,并根据标签对其进行分组。