一个数据汇总统计的问题

已经用 pandas 从几张销售大表中把数据汇总到一张表中了，如图，(目前只有这个水平，噗)，我目的是要及时跟进包材，品牌很多，每个品牌 10kg 到 15kg 共用一种包材，各品牌不通用，0.7 到 1kg 到共用同一种包材，各品牌通用。图上已经手工处理了数据。我现在想用 python 完成这个统计工作，感觉无从下手，请各位前辈指教。开始我想做一张包含所有规格的表，一一比对，但感觉太蠢了，见笑😜

MTMT

2022-03-23 23:44:14 +08:00

```python
def get_type(row):
if row['规格'].between(0.7,1):
return '小包材'
else:
reutrn row['品牌名']+'_大包材'

d['分类'] = d.apply(lambda get_type, axis=1)

output = d[['分类', '数量']].groupby('分类').sum()
```

MTMT

2022-03-23 23:47:27 +08:00

不知道 v2 支不支持 markdown ，上面缩紧都乱了，有一行改一下，凑合看吧

d['分类'] = d.apply(get_type, axis=1)

gengchun

2022-03-24 17:50:20 +08:00

@skysuhey 现在有 qgrid 还有 plotly dash 这种交互式的，其实还可以。

excel 太复杂的，其实也有不少问题。

skysuhey

2022-03-24 22:34:35 +08:00

@gengchun 学到了，不过对于 op 这种就一个 vlookup 分下类再 sum 求和就行了，感觉还是 Excel 简单点

imn1

2022-03-25 17:30:44 +08:00

分牌子 dataframe.groupby(['牌子'])
分规格 dataframe.groupby(['规格'])
分牌子及规格 dataframe.groupby(['牌子', '规格']) #注意有序

groupby 可以简单看作一个把字段当成 index 的 dataframe ，然后操作，当然这个理解不严谨，详细请查阅手册关于 groupby 章节

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/842480

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.