知行编程网知行编程网  2022-12-09 07:00 知行编程网 隐藏边栏  2 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python特征生成是什么?的相关知识,希望可以帮到处于编程学习途中的小伙伴


什么是 python 特征生成?

业内常说,数据决定模型效果的上限,而机器学习算法通过数据特征进行预测,良好的特征可以显着提升模型效果。这意味着通过特征生成(即从数据设计中加工模型的可用特征)是特征工程中的重要一步。



一、特征生成作用


1、增加特征的表达能力,提升模型效果;

(例如,体重除以身高是表达健康状况的重要特征,单纯看身高或体重对健康状况的表达有限。)

2. 可以融入业务理解的设计特征,增加模型的可解释性。



二、特征生成方法



1、聚合方式

对于一对多的字段,将对应的多条记录进行分组聚合,统计平均值、计数、值等数据特征。

# 自定义分组聚合统计函数
def x2_sum(group):
    return sum(group**2)

df.groupby('cust_no').C1.apply(x2_sum)



2、转换方式

字段之间通过加、减、乘、除等运算生成数据特征的过程,对于不同的字段类型有不同的转换方式。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享