知行编程网知行编程网  2022-03-25 08:39 知行编程网 隐藏边栏 |   抢沙发  28 
文章评分 0 次,平均分 0.0

情人节来了,什么甜言蜜语最好!我用Python分析几千条情话告诉你答案

情人节马上就要到了,对于情侣们来说,刚过完年又迎来了情人的节日,一定非常的开心,而对于有追求目标的有志人士来说,情人节也是“下手”的绝佳机会,情人节自然少不了甜言蜜语的问候,今天我就带领大家爬取上千条的情人节甜言蜜语,并做一下统计分析,看看用什么样的词,多长的句子,来制造我们浪漫的情人节专属情话


3.词频统计


接下来,是对于词频的统计,我们将jieba分词后的数据进行清洗,利用collections库的Counter函数进行词频统计,并利用pyecharts库进行词频的柱状图展示。如下图所示:

情人节来了,什么甜言蜜语最好!我用Python分析几千条情话告诉你答案


从上图的高频词汇,我们可以看出,利用哪一些词语来制造情话。有了关键词,接下来是对于句长的分析,因为句子太短,显得不真诚,句子太长,又显得啰嗦,抓不到重点(是不是瞬间感觉不想找对象了)。所以对于句长的拿捏要得当。


由于我们将文本存储时,是分行存储的,所以我们只需要按行进行读取,将每句话的句长进行统计即可,句长统计完成后,我们利用pandas库对句长进行离散化的处理,并利用pyecharts库进行饼图的句长分析,如下图所示:

情人节来了,什么甜言蜜语最好!我用Python分析几千条情话告诉你答案

由上图可以看出,句长在40-60之间是最为合适的,其次是60-80之间。

部分源码如下:

情人节来了,什么甜言蜜语最好!我用Python分析几千条情话告诉你答案


有了关键词,还有了合适的句长分析,相信你脑海中已经想到了属于自己的情话了,下面这句话就是我写的专属情话:

因为爱情,我们走到了一起;

因为爱情,让我们选择相伴到永远;

因为爱情,即便是对你的思念,也是一种幸福。

所以大家趁着情人节,抓紧行动吧!



获取源码,扫上面的二维码,然后输入:【情人节】


近期热门:

没有网络竟然能溜溜地刷抖音?因为有这个Python神器

我是如何一步一步拿下Google offer的


本篇文章来源于: 菜鸟学Python

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享