一个数据汇总统计的问题

2022-03-23 23:02:51 +08:00
 nbjbsjb

已经用 pandas 从几张销售大表中把数据汇总到一张表中了,如图,(目前只有这个水平,噗),我目的是要及时跟进包材,品牌很多,每个品牌 10kg 到 15kg 共用一种包材,各品牌不通用,0.7 到 1kg 到共用同一种包材,各品牌通用。图上已经手工处理了数据。 我现在想用 python 完成这个统计工作,感觉无从下手,请各位前辈指教。 开始我想做一张包含所有规格的表,一一比对,但感觉太蠢了,见笑😜

2065 次点击
所在节点    Python
8 条回复
skysuhey
2022-03-23 23:08:28 +08:00
处理这种数据没必要用 Python ,Excel 不是更加直观便捷吗
dlsflh
2022-03-23 23:41:14 +08:00
想起了那个黑板上画 office 讲课的非洲老师。
MTMT
2022-03-23 23:44:14 +08:00
```python
def get_type(row):
if row['规格'].between(0.7,1):
return '小包材'
else:
reutrn row['品牌名']+'_大包材'

d['分类'] = d.apply(lambda get_type, axis=1)

output = d[['分类', '数量']].groupby('分类').sum()
```
MTMT
2022-03-23 23:47:27 +08:00
不知道 v2 支不支持 markdown ,上面缩紧都乱了,有一行改一下,凑合看吧

d['分类'] = d.apply(get_type, axis=1)
nbjbsjb
2022-03-24 07:24:29 +08:00
@MTMT 谢谢,我研究一下
gengchun
2022-03-24 17:50:20 +08:00
@skysuhey 现在有 qgrid 还有 plotly dash 这种交互式的,其实还可以。

excel 太复杂的,其实也有不少问题。
skysuhey
2022-03-24 22:34:35 +08:00
@gengchun 学到了,不过对于 op 这种就一个 vlookup 分下类再 sum 求和就行了,感觉还是 Excel 简单点
imn1
2022-03-25 17:30:44 +08:00
分牌子 dataframe.groupby(['牌子'])
分规格 dataframe.groupby(['规格'])
分牌子及规格 dataframe.groupby(['牌子', '规格']) #注意有序

groupby 可以简单看作一个把字段当成 index 的 dataframe ,然后操作,当然这个理解不严谨,详细请查阅手册关于 groupby 章节

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/842480

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX