知行编程网知行编程网  2022-03-24 02:00 知行编程网 隐藏边栏 |   抢沙发  0 
文章评分 0 次,平均分 0.0

2018年中国电影票房突破600亿大关标志着国内电影事业进入新纪元,2019年春节档更是出现14部大片竞相角逐的场面,其中《疯狂的外星人》、《飞驰人生》、《神探蒲松龄》、《新喜剧之王》、《廉政风云》、《流浪地球》6部电影预售成绩最好,但是高票房不等于高评分,众多影片之中究竟哪一部最值得观看,今天我们就一起来预测一下。



口碑预测

要作评分预测最简单的模型就是线性回归,这里我们稍微使用一点机器学习的基本算法。

1).数据预处理

在上述选定的特征中,除电影时长是数值型以外,其他特征值都是字符型数据,不便于直接进行分析,因此需要先进行one-hot编码转换,pandas库中有专门的函数进行one-hot编码转换,使用起来也非常方便;另外,为了避免个别特征对数据预测产生过大影响,还需要对数据进行归一化处理,相关代码如下:

春节14部电影齐上映,谁将是口碑之王?

转换后的数据样式如下:

春节14部电影齐上映,谁将是口碑之王?


2).评分预测

处理完数据,我们就可以利用sklearn的线性回归函数预测电影评分了,首先以2018年及以前的春节档电影数据作为训练集计算回归系数矩阵,然后以2019年春节档6部电影特征值为依据来计算评分,代码如下:

春节14部电影齐上映,谁将是口碑之王?

预测出的各电影评分如下:

从预测结果来看,这6部电影预计评分都在5分以上,根据经验都是值得观看的,其中《疯狂的外星人》和《流浪地球》两部影片预测分值最高,按照我们的算法2019春节档中的最佳口碑将会在这两部影片中诞生。客观来说,此次预测比较“简陋”,至于准与不准,就等电影上映后再来看吧。


其实我个人更看好“神探蒲松龄”!


往期精彩:

菜鸟学Python年度抽奖,连续抽奖7天

学Python还是Java, 8张漫画带你全面分析

本篇文章来源于: 菜鸟学Python

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享