本文介绍: Pythongroupby函数详解(非常容易懂)

一、groupby 能做什么

groupby函数主要的作用是进行数据的分组以及分组后地组内运算

数据分组分组运算主要是指groupby函数应用,具体函数规则如下

df[](输出数据结果属性名称).groupby([df[属性],df[属性])(分类属性数据的限定定语,可以多个).mean()(对于数据的计算方式——函数名称)

例如下:

print(df["评分"].groupby([df["地区"],df["类型"]]).mean())

上面语句功能输出表格所有数据中不同地区不同类型评分数据平均值

二、单类分组

2.1 创建数据集

lst1 = [['小红', '女', 1, 160], ['大红', '女', 2, 161], ['小明', '男', 1, 180], ['大明', '男', 1, 180], ['小亮', '男', 2, 170]]
lst2 = [['姓名', '性别', '班级', '身高']]
data = pd.DataFrame(lst1, columns = lst2)
data

在这里插入图片描述

data.groupby("性别")

结果为:

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000018CD0F0AB90>

首先,我们一个变量data数据类型是DataFrame

想要按照【性别】进行分组

得到的结果一个groupby对象,还没有进行任何的运算

我们可以描述组内数据的基本统计量:

data.groupby('性别').describe()

在这里插入图片描述

只有数字类型的列数据才会计算统计

示例里面数字类型的数据有两列 【班级】和【身高】;

但是,我们并不需要统计班级均值信息,只需要【身高】,所以做一下小的改动:

data.groupby('性别')['身高'].describe()

在这里插入图片描述

三、多类分组

data.groupby(['班级', '性别'])

在这里插入图片描述

data.groupby(['班级', '性别']).mean()

在这里插入图片描述
单独用groupby,我们得到的还是一个 Groupby对象

我们还可以一次运用多个函数计算:

import numpy as np
data.groupby( ["班级","性别"]).agg([np.sum, np.mean, np.std])

在这里插入图片描述

原文地址:https://blog.csdn.net/wzk4869/article/details/128375321

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_22174.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注