当前位置:首页 > 技术分析 > 正文内容

「Python数据分析」Pandas进阶,使用groupby分组聚合数据(二)

ruisui882个月前 (04-09)技术分析13

在实际的数据分析过程中,我们把原始数据集,进行分组处理之后,往往需要对分组结果中的,各个小组的数据进行不同的操作。这就需要对我们的分组结果对象,通过循环迭代的方式,访问和操作不同组内部的数据元素。

在组中迭代

我们先来生成原始模拟数据集

然后对A列进行分组,并且循环访问分组中的数据

我们可以看到,通过for循环语句,我们分别可以拿到子分组名称name,和子分组数据group,这个过程是循环自动进行的。如果我们要对子分组进行操作的话,则需要在for循环中,编写操作代码。如果我们要访问子分组中的数据元素,则需要在for循环语句中,再嵌套一个for循环,才能访问到子分组中的数据元素。

我们还可以通过get_group函数,选择某一个单一的子分组,这样可以单独对子分组进行操作处理。

分组的聚合操作

在对原始数据完成分组处理后,我们经常需要查看各个子分组的汇总数据,平均数据等等情况,这个过程,就是分组数据的聚合操作。

我们重新生成一个数据集

然后通过kind列,对数据进行分组,并且对各个子分组进行求和操作。

这样,就得到了各个子组的,另外两列的汇总数据。

这里,默认是使用kind分组列,作为汇总数据集的数据标签索引列。

我们也可以重新生成索引,如下所示

只需要设置as_index属性为false即可,这样可以让数据更加整洁美观,并且有序。

类似于sum这样的聚合函数,还有很多。我整理了一个表格,大家可以参照着使用。

比如说,我们要查看均值和方差的话,就需要用到mean和var函数。

通过以上聚合函数,可以让我们对分组数据,进行一些简单的统计分析,得出各个子分组的相关统计项。

我们还可以通过describe函数,对各个子分组,进行描述性数据展示,可以计算各个子分组的各项统计数据。

aggregate()聚合函数方法

为了让分组数据的聚合操作更加直观,更加通俗易懂,我们可以使用aggregate()函数,对分组后的数据进行聚合操作。

上述代码,就是先对A列进行分组,然后通过aggregate()函数,对分组后的数据进行sum的汇总聚合操作。

注意,这里聚合的列是C和D两列。

以下是更加简易的聚合方法

重新生成数据标签索引

也可以使用reset_index函数,重新生成索引

可以看出,重新生成索引之后,聚合后的结果数据集,更加整理,美观。

以上就是我们groupby第二部分的内容。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/3388.html

分享给朋友:

“「Python数据分析」Pandas进阶,使用groupby分组聚合数据(二)” 的相关文章

首个支持苹果 M1 Mac 的 Linux 发行版发布,面向用户开放下载

IT之家 3 月 20 日消息,Asahi Linux 是研究 Linux for Apple Silicon macs 的组织群体,3 月 18 日,Asahi Linux 宣布成功在 M1 MacBook Air 笔记本电脑上运行,并开放了 Asahi Linux 的下载安装。Asahi Lin...

微软的Linux发行版终于加入了对XFS根文件系统的支持

当许多Linux发行版在评估新的根文件系统选项或甚至像OpenZFS这样的特性,微软内部Linux发行版到本月才开始支持XFS作为根文件系统选项。随着这个月对微软内部Linux发行版CBL-Mariner的更新,他们现在支持XFS作为根文件系统。到目前为止,这个用于微软内部各种目的的Linux发行版...

代码管理-9-gitlab的使用和设置

gitlab使用1、外观设置完成后保存,返回登录页面查看关于注册,有些公司是不允许打开的,,有些人数非常多的公司就需要打开注册的功能,让人员自己注册,我们来给他特定的权限就可以,毕竟人非常多的时候还由我们来给她们注册就非常不现实了,工作量会很大2、自动注册3、组&用户&项目创建组设置组名称、描述等创...

程序员开发必会之git常用命令,git配置、拉取、提交、分支管理

整理日常开发过程中经常使用的git命令![送心]git配置SSH刚进入项目开发中,我们首先需要配置git的config、配置SSH方式拉取代码,以后就免输入账号密码了!# 按顺序执行 git config --global user.name "自己的账号" git config -...

VIM配置整理

一、基本配色set number set showcmd set incsearch set expandtab set showcmd set history=400 set autoread set ffs=unix,mac,dos set hlsearch set shiftwidth=2 s...

再来一波黑科技工具,低调使用

静读天下静读天下是一个特别优秀的电子书阅读器。它上面有多个在线书库,像古登堡计划,很多种优秀的书杂志,都可以下载来阅读。它还能智能识别章节功能,还支持外置的语音阅读功能。它支持多种文本格式,比如说txt,pdf,epub,mobi等等。为了便于阅读它还有10 种配色方式,还有夜间模式。不过免费版有广...