pandas groupby
pandas中groupby用法详解是什么呢?不知道的小伙伴来看看小编今天的分享吧!
在Pandas中,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等主要运用groupby完成。
Groupby的基本原理:
在pandas中,实现分组操作的代码很简单,仅需一行代码,在这里,将上面的数据集按照company字段进行划分:
In [5]: group = data.groupby("company")
将上述代码输入ipython后,会得到一个DataFrameGroupBy对象
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那这个生成的DataFrameGroupBy是啥呢?对data进行了groupby后发生了什么?ipython所返回的结果是其内存地址,并不利于直观地理解,为了看看group内部究竟是什么,这里把group转换成list的形式来看:
In [8]: list(group)
Out[8]:
[('A', company salary age
3 A 20 22
6 A 23 33),
('B', company salary age
4 B 10 17
5 B 21 40
8 B 8 30),
('C', company salary age
0 C 43 35
1 C 17 25
2 C 8 30
7 C 49 19)]
转换成列表的形式后,可以看到,列表由三个元组组成,每个元组中,第一个元素是组别(这里是按照company进行分组,所以最后分为了A,B,C),第二个元素的是对应组别下的DataFrame,整个过程可以图解如下:
总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame。所以说,在groupby之后的一系列操作(如agg、apply等),均是基于子DataFrame的操作。
-
自己动手包的粽子说说
1、粽子终于包好了,自己动手丰衣足食,虽然过程比较“艰难”。2、吃过软糯香甜的蜜枣粽子,吃过金黄流油的蛋黄粽子,也吃过咸淡适宜香喷喷的肉粽子,生于北方的我却从来没有亲手包过粽子...
说说查看全文>> -
丰田雷凌空调按钮图解,雷凌空调除雾和暖风开启方法
丰田雷凌采用的是机械按键,空调除雾以及暖风可以通过按键直接开启。1、除雾前、后风挡除雾功能分别设定有按钮,按下对应按钮开启风挡玻璃的除雾功能。2、暖风使用旋钮旋转至高温指示区域...
问答查看全文>> -
吉利app如何关联车辆?吉利gnetlink使用教程
吉利app关联车辆的方法可以使用两种方式,一种是可以使用蓝牙+数据线连接,另一种是蓝牙+WIFI连接。蓝牙的连接主要是传输语音数据,而数据线或WIFI是负责其他的数据传输。可以...
问答查看全文>>
推荐
- 1湖红工夫是什么茶 湖红工夫产于哪里385
- 2最新爱情说说短语100
- 3冠道大灯开关在什么位置147
- 4iPhone12海军蓝新配色你会入手吗?看看真机图香不香!310
- 5桑塔纳转向盘可以打几圈?208
- 6新车异地年检怎么办理流程?447
- 7p0319故障码解释和消除方法,P0319故障码怎么解决?384
- 8小车5万公里需要做哪些保养?125