网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

如何爬取美团的店铺评论数据-创新互联

创新互联www.cdcxhl.cn八线动态BGP香港云服务器提供商,新人活动买多久送多久,划算不套路!

创新互联专注于企业全网营销推广、网站重做改版、临汾网站定制设计、自适应品牌网站建设、H5网站设计电子商务商城网站建设、集团公司官网建设、成都外贸网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为临汾等各大城市提供网站开发制作服务。

这篇文章主要介绍如何爬取美团的店铺评论数据,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

店铺评论数据

在重庆火锅的文章中,我们一共爬取了每个店铺基本信息与对应评价两种数据,那么较为简单的就是评论数据,我们进入一个店铺的详情页,F12查找数据包就能轻松找到对应的评论数据

 如何爬取美团的店铺评论数据

所以想拿下这一页的评论只要将headers中一些参数加进去使用Requests.get请求即可,注意Cookie是必须要添加的

如何爬取美团的店铺评论数据

那么返回的json数据无论直接提取数据还是使用正则查找数据都不是困难的,提取之后使用Pandas保存即可,此处就不在赘述,如果需要爬取多页评论怎么办,先手动加载多页评论发现URL中仅有offset参数变了,每页增加10

如何爬取美团的店铺评论数据

所以只要写个简单的循环生成多页URL就能拿下指定页数的评论,OK这仅是一家店铺的评论爬取办法,那怎么获得多家店铺的评论呢?如果我们多找几家店铺的评论数据查看会发现,不同店铺对应的Request URL其实变化的只有店铺的ID

如何爬取美团的店铺评论数据

所以下面的问题就转换为如何拿到多家店铺的ID,而这些ID都在搜索页面下的店铺基本数据中。

店铺基本数据

为了找到店铺ID,让我们回到搜索页面中(美团首页—美食—火锅)

如何爬取美团的店铺评论数据

上面的页面中就是重庆火锅的第一页,还是F12刷新很容易就能找到包含店铺ID、均价等相关信息的数据包

所以也能轻松的获取Request URL

如何爬取美团的店铺评论数据

修改对应的headers信息再使用requests请求即可,然后将店铺基本信息存下来用于分析,再将ID单独存储用于组合评论页URL

如何爬取美团的店铺评论数据

当然这只是第一页的url的返回数据,只要修改其中的page参数就能生成多页URL从而获取多页数据

如何爬取美团的店铺评论数据

以为这就结束了?并不是,评论页的URL是不变的但是这里的URL过几分钟就会变一下,也就是说如果你一次性生成10页或更多的URL去循环请求很有可能在中间这个URL就挂掉了,所以你直接在浏览器中打开这个URL提示请求被拒绝,而不是显示对应的json值,就说明URL换了,解决办法只有在URL更换的时候重新手动获取最新的URL并重新组合剩下需要爬取的页面,有点蠢但是因为更换的部分并没啥规律所以好像也没什么更好的办法......

以上是如何爬取美团的店铺评论数据的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注创新互联-成都网站建设公司行业资讯频道!


分享名称:如何爬取美团的店铺评论数据-创新互联
标题网址:http://bjjierui.cn/article/ccedee.html

其他资讯