网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

利用BeautifulSoup4怎么对XML文件进行解析-创新互联

利用BeautifulSoup4怎么对XML文件进行解析?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

创新互联建站拥有10年成都网站建设工作经验,为各大企业提供成都做网站、网站制作服务,对于网页设计、PC网站建设(电脑版网站建设)、成都APP应用开发、wap网站建设(手机版网站建设)、程序开发、网站优化(SEO优化)、微网站、国际域名空间等,凭借多年来在互联网的打拼,我们在互联网网站建设行业积累了很多网站制作、网站设计、网络营销经验,集策划、开发、设计、营销、管理等网站化运作于一体,具备承接各种规模类型的网站建设项目的能力。

Beautiful Soup 是一个用来从HTML或XML文件中提取数据的Python库,它利用大家所喜欢的解析器提供了许多惯用方法用来对文档树进行导航、查找和修改。

以下是电影《爱丽丝梦游仙境》中的一段HTML内容:


利用BeautifulSoup4怎么对XML文件进行解析

我们以此为例,对如何使用BeautifulSoup解析HTML页面内容进行简单入门示例:

from bs4 import BeautifulSoup
 
# 《爱丽丝梦游仙境》故事片段
html_doc = """

The Dormouse's story

The Dormouse's story

Once upon a time there were three little sisters; and their names were Elsie, Lacie and Tillie; and they lived at the bottom of a well.

...

""" # 构造解析树 soup = BeautifulSoup(html_doc, "html.parser") # 美化输出 #soup.prettify()) # 获取第一个 title 标签 soup.title # The Dormouse's story # 获取第一个 title 标签的名称 soup.title.name # title # 获取第一个 title 标签的文本内容 soup.title.string # The Dormouse's story # 获取第一个 title 标签的父标签的名称 soup.title.parent.name # head # 获取第一个 p 标签 soup.p #

The Dormouse's story

# 获取第一个 p 标签的 class 属性 soup.p['class'] # ['title'] # 获取第一个 a 标签 soup.a # Elsie # 查找所有的 a 标签 soup.find_all('a') # [Elsie, # Lacie, # Tillie] # 获取所有的 a 标签的 href 属性 for link in soup.find_all('a'): print(link.get('href')) # http://example.com/elsie # http://example.com/lacie # http://example.com/tillie # 查找 id = link3 的 a 标签 soup.find(id="link3") # Tillie # 获取解析树的文本内容 print(soup.get_text()) # The Dormouse's story # # The Dormouse's story # Once upon a time there were three little sisters; and their names were # Elsie, # Lacie and # Tillie; # and they lived at the bottom of a well. # ...

名称栏目:利用BeautifulSoup4怎么对XML文件进行解析-创新互联
文章分享:http://bjjierui.cn/article/ipjeh.html

其他资讯