网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

python怎么抓取糗事百科的内容

这篇文章主要讲解了“python怎么抓取糗事百科的内容”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python怎么抓取糗事百科的内容”吧!

创新互联公司是一家专注于成都做网站、网站建设、外贸营销网站建设与策划设计,青川网站建设哪家好?创新互联公司做网站,专注于网站建设10多年,网设计领域的专业建站公司;建站业务涵盖:青川等地区。青川做网站价格咨询:13518219792

# 抓取糗事百科的内容
import requests
from lxml import etree
class Qiushi() :
	def __init__(self) : 
		self.url = 'http://www.qiushibaike.com/8hr/page/{}';
		self.headers = {
			"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1 Trident/5.0;"
		};

	def parse_url(self , url) : 
		response = requests.get(url , timeout = 10 , headers = self.headers)
		assert response.status_code == 200
		print(url)
		return etree.HTML(response.text)

	def parse_content(self , html) : 
		item = html.xpath('//div[@class="recommend-article"]/ul/li')
		print(item)
		for i in item : 
			# 内容 
			print(i.xpath('./div/a[@class="recmd-content"]/text()'));
			# 好笑数
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[1]/text()'))
			# 评论数
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/div/span[4]/text()'))
			# 用户名
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/span/text()'))
			# 头像地址
			print(i.xpath('./div/div[@class="recmd-detail clearfix"]/a/img/@src'))


	def run(self) : 
		url = self.url.format(1);
		html = self.parse_url(url);
		self.parse_content(html);

if __name__ == '__main__': 
	qiu = Qiushi();
	qiu.run();

感谢各位的阅读,以上就是“python怎么抓取糗事百科的内容”的内容了,经过本文的学习后,相信大家对python怎么抓取糗事百科的内容这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!


当前题目:python怎么抓取糗事百科的内容
本文路径:http://bjjierui.cn/article/phddpi.html

其他资讯