V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ytmsdy  ›  全部回复第 81 页 / 共 82 页
回复总数  1623
1 ... 73  74  75  76  77  78  79  80  81  82  
2016-04-19 10:23:44 +08:00
回复了 hxndg 创建的主题 Python 一面结束,总结爬虫的一些小问题,抛砖引玉
对 HASH 的问题比较有疑惑,碰到这样的问题,直接鸵鸟就好了。按照 HASH 的算法,碰撞的概率也是很小很小的。就算真的碰到了,直接忽略掉就好了。比如说在 1 亿条数据里面,万一碰到个十条八条的碰撞,这样的差错概率也是可以忍受的。
2016-04-19 10:10:38 +08:00
回复了 cdwyd 创建的主题 Python 分享大量数据去重的方法,顺便问下 python 内存占用问题
先把这 11G 的文本导入到数据库,然后再在数据库里面做去重复的操作。你这么一边插入,一边查询效率很低的。
取消支付关联,注意流量。。。
我记得是一个月 2T 的流量啊。。
2016-04-15 11:16:43 +08:00
回复了 vvaaiinn 创建的主题 Python 微信公众号内容的抓取、大家有什么好的建议吗
目前我也在填这个坑,现在在尝试抓微信的包,但是一些参数怎么生成的还是无法确定。比较头疼。
2016-04-13 14:18:05 +08:00
回复了 RqPS6rhmP3Nyn3Tm 创建的主题 问与答 又被 CC 了,有啥切实有效的预防方法?
直接挂一个百度的 cdn 加速。效果杠杠的。。。。。
可以远程么?
2016-04-07 19:25:39 +08:00
回复了 Andrman 创建的主题 Python 新手该怎么自学 python 啊!
写爬虫,爬 1024 ,很有动力的。。
2016-04-07 19:24:27 +08:00
回复了 puyaraimondii 创建的主题 程序员 小白求助,关于搭建服务器
不要求助了,有钱的话直接请个程序员帮你做吧。目测等你把这些东西吃透来,能做出东西。估计人家都毕业来。
所有,干脆请人吧。。。来个 1k ,程序的部署, nginx , python , mysql 都帮你搞定!
2016-04-06 14:13:22 +08:00
回复了 ytmsdy 创建的主题 云计算 阿里云的青岛节点开始打折出售了。。。。
@GKLuke Soga.....
2016-04-05 16:57:55 +08:00
回复了 omg21 创建的主题 Python 求教关于抓取内容的思路
BeautifulSoup
2016-04-05 14:24:46 +08:00
回复了 xiaoz 创建的主题 云计算 阿里云数据中心选择哪个好?
青岛的幺蛾子最多。。。直接选杭州吧。。
2016-04-05 14:03:11 +08:00
回复了 qling 创建的主题 职场话题 三四线城市 1500/月能招到什么样的建站人才呢
网吧的网管现在都 2800 一个月啦!!
2016-04-05 10:32:57 +08:00
回复了 sisyphus60 创建的主题 奇思妙想 关于股票指数数据建模的问题
@lixuda https://github.com/vnpy/vnpy 已经有好多人用这套轮子在股指期货上面割韭菜了。。
2016-04-05 09:33:08 +08:00
回复了 sisyphus60 创建的主题 奇思妙想 关于股票指数数据建模的问题
https://www.joinquant.com
直接去这里吧,用 python 直接写策略就好了。
2016-03-31 16:56:41 +08:00
回复了 Totato5749 创建的主题 git 国内哪家 Git 服务比较靠谱?
@ericyl 胖子 SB , Sb 胖子。。。哈哈哈哈发现你了。。
2016-02-18 16:57:00 +08:00
回复了 zhuziyi 创建的主题 问与答 做了一个 H5 页面,仅在朋友圈转发了一条,日访问量已破 2w
@zhuziyi 这样要留有适当的距离,要不然会被判诱导点击。会被 K 的。
2016-02-18 10:13:55 +08:00
回复了 xiaxue 创建的主题 魅族 我做了一个 魅族维权论坛: meizu315
你应该做一个小米维权论坛才对!
2016-02-17 15:42:35 +08:00
回复了 shsfoolish 创建的主题 Python Python 怎么优雅地中文注释
#coding:utf-8
加上去就好了。。
2016-02-06 10:58:09 +08:00
回复了 lenovo 创建的主题 Python 8 年时间还不够消灭 python2 么?
现在主要是有一部分 lib 不支持 python3 ,就算是支持的 python3 的坑也比较多。
稳定的开发者都不愿意去填这个坑吧。
2016-02-05 11:13:13 +08:00
回复了 prozhong 创建的主题 云计算 新浪云海外 http 线路挂了多久了?
之前也收到邮件,所以估计是提前收到了风声。所以给我们发邮件有个心理准备
1 ... 73  74  75  76  77  78  79  80  81  82  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2836 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 44ms · UTC 03:46 · PVG 11:46 · LAX 19:46 · JFK 22:46
Developed with CodeLauncher
♥ Do have faith in what you're doing.