V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  necomancer  ›  全部回复第 14 页 / 共 32 页
回复总数  634
1 ... 10  11  12  13  14  15  16  17  18  19 ... 32  
2020-01-10 18:59:43 +08:00
回复了 night277278 创建的主题 程序员 怎么给普通人讲“迭代器”“生成器”,“继承”
性感(划掉)荷官在线发牌
遗传
2019-12-11 23:03:30 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
numpy 去官方文档看看那个入门了解一下各种数组的操作就可以了。你要是处理数据尤其是简单统计一类的比较多的话,多看看 pandas。有些像 dataframe.diff 不那么好用的场景毕竟还可以用 numpy.diff (prepend,append 和 axis ),毕竟数据应该是一样的。
2019-12-11 23:00:15 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
@JCZ2MkKb5S8ZX9pq numpy 是基础。我是做物理的所以很少处理非数字的数据,pandas 除了 read_csv 啥的没咋用过。
但 pandas 的 dataframe 的底层似乎就是 numpy.ndarray,比如 df.values 会返回 numpy.ndarray ; numpy 的函数也更数学化。但 pandas 的 dataframe 针对各种复杂的数据似更友好一些。
2019-12-11 22:46:27 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
或者直接 df['volume'] = numpy.diff(df['volume'], prepend=0)
2019-12-11 22:45:37 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
@JCZ2MkKb5S8ZX9pq 这样啊,谢谢。不过我看求 diff 的时候 pd 好像没有 numpy.diff 里的 prepend 功能,所以无论如何少一个。按你的要求是第一个值不变,原始数据应该在头一个加一个['---', 0] 进去吧~
2019-12-11 22:26:35 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
@JCZ2MkKb5S8ZX9pq pandas 我用得不多。pandas 倒是支持时间作差,但必须是 pandas 的 datetime 类型,字符串直接带入会报错。
2019-12-11 22:24:52 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
@ClericPy nums[i]这样会引入一个 O(N) 操作的。
2019-12-11 22:19:40 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
是……我脑残了……
[data[0]] + list(map(lambda x: [x[1][0],x[1][1]-x[0][1]], zip(data[:-1],data[1:])))
2019-12-11 22:08:13 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
再 sorry,没看清题……
In [3]: [data[0]] + list(map(lambda x, y: [y[0],y[1]-x[1]], *zip(data[:-1],data[1:])))
Out[3]: [['20:00', 100], ['20:10', 30], ['20:20', 60]]
2019-12-11 22:00:58 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
sorry

[data[0]] + list(map(lambda x, y: [x[0],y[1]-x[1]], *zip(data[:-1],data[1:])))
2019-12-11 21:54:10 +08:00
回复了 JCZ2MkKb5S8ZX9pq 创建的主题 Python Python 快速计算增量的方法
In [1]: [data[0], list(map(lambda x, y: [x[0],y[1]-x[1]], *zip(data[:-1],data[1:])))]
Out[1]: [['20:00', 100], [['20:00', 30], ['20:10', 60]]]
2019-12-11 15:48:53 +08:00
回复了 sunhk25 创建的主题 Python numpy 二位数组过滤掉指定条件元素
用稀疏矩阵。稀疏矩阵 0 不占内存。操作基本和 numpy array 一致。你想要的结果只能用列表生成式了
[_[_>=4] for _ in t]
In [2]: [_[_>=4] for _ in t]
Out[2]: [array([4]), array([], dtype=int64), array([4]), array([4, 5, 6])]

In [3]: np.array([_[_>=4] for _ in t])
Out[3]:
array([array([4]), array([], dtype=int64), array([4]), array([4, 5, 6])],
dtype=object)
得到一个 object array
2019-12-11 08:44:32 +08:00
回复了 smartG 创建的主题 Python Python 处理 excel 表格的问题
刚搜了一下,excel 也有人做逻辑回归。只要把你需要处理的信息文本提取特征,也就是转成一堆数字就行。这个得去网上找点啥类似 word2vec, 结巴分词啥的,貌似 pip install jieba word2vec 就能装,调用也挺简单,随便找个博客看看应该简单用起来没啥问题。
2019-12-11 08:35:05 +08:00
回复了 smartG 创建的主题 Python Python 处理 excel 表格的问题
@smartG 逻辑回归是个统计学习方法,sckipy, sklearn 都有现成的库。不熟悉 python 的话,其他很多语言比如 R, matlab, mathematica 啥的也都有实现。
2019-12-09 00:31:13 +08:00
回复了 smartG 创建的主题 Python Python 处理 excel 表格的问题
1. 先用正则表达式去掉包含非法字符的。
2. 自己找出来一二百条垃圾信息,一二百条好信息,做个分类器。
简单的流程是先做特征提取,再做个逻辑回归,或者支持向量机分类。文本特征提取的方法百度一下有很多。只是在学习的时候做过英文的垃圾邮件过滤器。中文不知道具体该咋弄……但应该有很多现成的工具吧,去 github 找找~~
2019-12-08 16:25:54 +08:00
回复了 pite 创建的主题 Android 黑五在谷歌商店 pixel4 被砍单
SOLI 国内不 root 似乎没法用
2019-11-21 00:13:42 +08:00
回复了 sunhk25 创建的主题 Python Python 正则分割字符串保留分隔符
一楼答案没毛病啊
In [1]: re.findall(r"\d+[A-Z]+", s)
Out[1]: ['123AA', '456B', '789AAA']
2019-11-20 01:37:33 +08:00
回复了 yeyu1989 创建的主题 Python Python 怎么绘制多维饼图?
2019-11-20 01:20:57 +08:00
回复了 Bugrun 创建的主题 程序员 大哥们学习都是看视频还是直接撸文档
如果文档有 tutorial 或者 for beginner's guide 就直接撸文档,没有的话会去找个概述类的视频先看个开头,剩下撸文档。
1 ... 10  11  12  13  14  15  16  17  18  19 ... 32  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3352 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 10:39 · PVG 18:39 · LAX 03:39 · JFK 06:39
Developed with CodeLauncher
♥ Do have faith in what you're doing.