cassidyhere 最近的时间轴更新
cassidyhere

cassidyhere

V2EX 第 304034 号会员,加入于 2018-03-28 13:24:51 +08:00
今日活跃度排名 6477
网页版 bi 接口问题
程序员  •  cassidyhere  •  55 天前  •  最后回复来自 SmiteChow
3
耗时请求的网络协议选择请教
程序员  •  cassidyhere  •  205 天前  •  最后回复来自 dongtingyue
6
bi 大量 parquet 小文件存储方案求助
程序员  •  cassidyhere  •  263 天前  •  最后回复来自 levelworm
1
如何管理历史悠久,几经易手的代码?
程序员  •  cassidyhere  •  265 天前  •  最后回复来自 gaoyadianta
33
一个浏览器登录两个账号的冲突问题
程序员  •  cassidyhere  •  2019-12-05 16:13:46 PM  •  最后回复来自 wangyzj
18
spark 怎样处理后台需要被频繁更新的数据?
程序员  •  cassidyhere  •  2018-10-21 03:25:45 AM  •  最后回复来自 piggybox
1
cassidyhere 最近回复了
87 天前
回复了 SIGEV13 创建的主题 美酒与美食 求消耗大量西红柿的菜谱
家里搞个西班牙番茄节
178 天前
回复了 ZoeYn 创建的主题 Python 有没有比较优雅的合并两个列表的方法?
from itertools import product
product(a, b)
196 天前
回复了 suchbear 创建的主题 职场话题 关于大厂这个概念
大厂就是在那工作过,以后投简历就不会简历关不过的地方
200 天前
回复了 SelectLanguage 创建的主题 Java 一个非常复杂的需求,如何设计表结构
能用 nosql 吗
221 天前
回复了 yaleyu 创建的主题 Python 又来求教 pandas 大拿了
如果 A/B 没规律的话,可以用自定义 window rolling
from pandas.api.indexers import BaseIndexer
window_size = df.C.groupby((df.C != df.C.shift(1)).cumsum()).agg('sum').max() # 最大连续次数
class CustomIndexer(BaseIndexer):
def get_window_bounds(self, num_values, min_periods, center, closed):
start = np.empty(num_values, dtype=np.int64)
end = np.empty(num_values, dtype=np.int64)
for i in range(num_values):
end[i] = i + 1
j = i
while j > 0 and self.use_expanding[j]:
j -= 1
start[i] = j
return start, end
indexer = CustomIndexer(window_size=window_size, use_expanding=df.C)
res = df.B.rolling(indexer, min_periods=2).sum().fillna(0)
标准库 functools.lru_cache 把它当双向链表用
摘部分代码:
PREV, NEXT, KEY, RESULT = 0, 1, 2, 3 # names for the link fields
root = [] # root of the circular doubly linked list
root[:] = [root, root, None, None] # initialize by pointing to self

# Use the old root to store the new key and result.
oldroot = root
oldroot[KEY] = key
oldroot[RESULT] = result
# Empty the oldest link and make it the new root.
# Keep a reference to the old key and old result to
# prevent their ref counts from going to zero during the
# update. That will prevent potentially arbitrary object
# clean-up code (i.e. __del__) from running while we're
# still adjusting the links.
root = oldroot[NEXT]
oldkey = root[KEY]
oldresult = root[RESULT]
root[KEY] = root[RESULT] = None
各位想复杂了,pandas.read_csv 有现成的 chunksize 参数
关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3089 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 05:18 · PVG 13:18 · LAX 22:18 · JFK 01:18
♥ Do have faith in what you're doing.