网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

程序员用Python分析中国演员排名,票房最高的是意料之中的他-创新互联

项目背景

目前成都创新互联公司已为上千余家的企业提供了网站建设、域名、网页空间、网站托管运营、企业网站设计、葫芦岛网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。

一个同学开了间影视投资公司,出于对创业人员的仰慕和影视投资行业的好奇,我就跟他寒暄了几句,聊天当中他提及到国庆节有部《攀登者》即将上映,预计票房会大好,因为吴京是这部片的主演。然后我就想,目前吴京在国内演员中位列几何呢?正好之前爬了猫眼电影数据,基于Python数据分析的方式,分析中国演员排名情况。

数据导入

导入之前爬取到的猫眼数据,由于爬取过程不是本文的主要内容,所以简单描述下数据情况:20110101至20191019年在中国上映,并且有用户评分和票房的影片,总共是2923部。

import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
# 加载数据
def load_data():
 # 加载电影票房
 open_filepath = 'D:\pythondata\\3、猫眼电影\\box_result.csv'
 movie_box = pd.read_csv(open_filepath)
 movie_box = movie_box[['电影id', '电影名称','首映日期','总票房']].drop_duplicates()
 # 加载电影信息
 open_filepath = 'D:\pythondata\\3、猫眼电影\\maoyan_movie.xlsx'
 movie_message = pd.read_excel(open_filepath,sheet_name='maoyan_movie')
 movie_message.columns = ['电影url','电影名称','电影题材','国家','上映时间','用户评分','电影简介','导演/演员/编剧']
 movie_message = movie_message[['电影url','电影题材','国家','用户评分','导演/演员/编剧']].copy()
 movie_message.drop_duplicates(inplace=True)
 movie_message['电影id'] = movie_message.apply(lambda x:x['电影url'].replace('https://maoyan.com/films/',''),axis=1)
 movie_message[['电影id']] = movie_message[['电影id']].apply(pd.to_numeric)
 # 合并电影信息和票房
 data = pd.merge(movie_box,movie_message,how='inner',on=['电影id'])
 return data
程序员用 Python 分析中国演员排名,票房最高的是意料之中的他
文章题目:程序员用Python分析中国演员排名,票房最高的是意料之中的他-创新互联
文章位置:http://bjjierui.cn/article/cssidh.html

其他资讯