pandas groupby
pandas中groupby用法详解是什么呢?不知道的小伙伴来看看小编今天的分享吧!
在Pandas中,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等主要运用groupby完成。
Groupby的基本原理:
在pandas中,实现分组操作的代码很简单,仅需一行代码,在这里,将上面的数据集按照company字段进行划分:
In [5]: group = data.groupby("company")
将上述代码输入ipython后,会得到一个DataFrameGroupBy对象
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那这个生成的DataFrameGroupBy是啥呢?对data进行了groupby后发生了什么?ipython所返回的结果是其内存地址,并不利于直观地理解,为了看看group内部究竟是什么,这里把group转换成list的形式来看:
In [8]: list(group)
Out[8]:
[('A', company salary age
3 A 20 22
6 A 23 33),
('B', company salary age
4 B 10 17
5 B 21 40
8 B 8 30),
('C', company salary age
0 C 43 35
1 C 17 25
2 C 8 30
7 C 49 19)]
转换成列表的形式后,可以看到,列表由三个元组组成,每个元组中,第一个元素是组别(这里是按照company进行分组,所以最后分为了A,B,C),第二个元素的是对应组别下的DataFrame,整个过程可以图解如下:
总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame。所以说,在groupby之后的一系列操作(如agg、apply等),均是基于子DataFrame的操作。
-
骐菱 2008款 1.6L 手动标准型怎么样,好不好
优点:一台挺时尚的MPV,比较喜欢坐得多人的车子缺点:车子里面的塑料包裹率非常的高,基本上都是塑料做的外观:外形还可以,MPV的长轴距比较喜欢 内饰:内饰挺实用的,必过用料就比...
问答查看全文>> -
表达自己伤心难过的话 心里难过该怎么办
1、时间会淡化一个人的记忆,却永远没有办法消磨一个人的悲痛。2、夜深了,让我站在心碎的地方,轻轻打一个结,一种缝补,阻止伤痛再流出。3、不论有多少的委屈,多么的难受,最终能治愈...
句子查看全文>> -
伤感的句子看了都想流眼泪
1、在这世上珍贵的东西总是罕有,所以这世上只有一个。2、你不曾给我一次回眸,我却始终在对你微笑。3、我喜欢你,很久了,等你,也很久了,现在,我要离开,比很久很久还要久。4、一个...
句子查看全文>> -
座右铭真诚 座右铭简短霸气
1、我要求别人诚实,我自己就得诚实。2、你要宣扬你的一切,不必用你的言语,要用你的本来面目。3、实话可能令人伤心,但胜过诺言。5、固然我有某些优点,而我自己最重视的优点,却是我...
座右铭查看全文>> -
西门子SJ636X04JC值得买吗 西门子SJ636X04JC怎么样
西门子SJ636X04JC是一款家用全自动洗碗机嵌入式消毒除菌,那么西门子SJ636X04JC怎么样?西门子SJ636X04JC值得买吗?下面小编将为你带来西门子SJ636X0...
品牌查看全文>>
推荐
- 1奇瑞汽车瑞虎3和远景X3怎么选 哪个更值得入手?394
- 2关于古风伤感的句子 十字古风伤感短句328
- 3打灯笼走铁道歇后语188
- 4一个人孤单无聊的句子 无聊的个性签名199
- 5关于爱情的失望的句子339
- 6发动机启停怎么彻底关闭458
- 7安全生产警句458
- 8男人女人的经典话362