知行编程网知行编程网  2022-02-23 11:00 知行编程网 隐藏边栏 |   抢沙发  4 
文章评分 0 次,平均分 0.0

点击关注公众号,Python干货及时送达30个Pandas高频使用技巧

PyCharm操作手册,点击获取

本文主要是介绍的自己在平时使用Pandas处理数据过程中接触到的高频技巧。欢迎阅读。

30个Pandas高频使用技巧

高频技巧

使用的技巧主要是下图涉及到的:

30个Pandas高频使用技巧

导入文件

Pandas能够读取很多文件:Excel、CSV、数据库、TXT,甚至是在线的文件都是OK的

30个Pandas高频使用技巧

创建DataFrame

在以前的文章中介绍过10种DataFrame的方法

30个Pandas高频使用技巧

查看头尾数据

头尾都是默认5行数据,可以指定行数

# df2.tail()  默认尾部5行
df2.tail(2)  # 指定尾部2行

显示全部列名

30个Pandas高频使用技巧

显示索引

30个Pandas高频使用技巧

查看列的数据类型

30个Pandas高频使用技巧

查看行列数

30个Pandas高频使用技巧

查看数据大小

30个Pandas高频使用技巧

查看缺失值

30个Pandas高频使用技巧

修改列名

两种方式:使用rename函数和直接使用columns属性

30个Pandas高频使用技巧
30个Pandas高频使用技巧

统计元素

统计每个元素的个数

30个Pandas高频使用技巧

转成列表数据

30个Pandas高频使用技巧

提取列中数据

30个Pandas高频使用技巧

提取文本数据

30个Pandas高频使用技巧

数值范围数据提取

30个Pandas高频使用技巧

提取整列数据

30个Pandas高频使用技巧
30个Pandas高频使用技巧

缺失值填充

  • 指定填充的值
  • 用计算值
  • 用其他值
30个Pandas高频使用技巧

数据去重

30个Pandas高频使用技巧

计算统计值

计算统计值,比如最值和均值等

30个Pandas高频使用技巧

计算中位数

30个Pandas高频使用技巧

提取最值所在的行

30个Pandas高频使用技巧

Pandas切片

30个Pandas高频使用技巧

大小排序

30个Pandas高频使用技巧

分组聚合

使用groupby分组之后,对不同的字段可以使用不同的聚合函数

30个Pandas高频使用技巧

索引重排

注意和上面例子的比较。使用的是reset_index函数

30个Pandas高频使用技巧

去掉原索引

使用索引重排之后我们需要去掉原来的索引;比较上下两个结果的区别。通过drop=True来实现

30个Pandas高频使用技巧
 

apply函数

30个Pandas高频使用技巧

两个列相加

30个Pandas高频使用技巧
30个Pandas高频使用技巧

DataFrame合并

1、先看看两个原始数据

30个Pandas高频使用技巧

2、默认情况:求的两个DF的交集

30个Pandas高频使用技巧

3、保留左边全部数据

30个Pandas高频使用技巧

4、保留右边全部数据

30个Pandas高频使用技巧

how="inner"其实就是默认情况:

30个Pandas高频使用技巧

导出数据

导出数据的时候通常是不需要索引的

30个Pandas高频使用技巧

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享