V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  est  ›  全部回复第 320 页 / 共 614 页
回复总数  12270
1 ... 316  317  318  319  320  321  322  323  324  325 ... 614  
2016-02-29 11:15:29 +08:00
回复了 senza 创建的主题 奇思妙想 一篇关于“蜜罐”安全技术的科普文章,脑洞大开
@lvye 之前一个做 actionscript 的大牛的博客,名字忘记了,好像被 wordpress 公司雇过。。

他的博客的一个图片被一个门户网站盗链了。。。然后反复投诉都无效

于是乎。就把他博客的图片重定向到了坦克侠。。。。
2016-02-28 20:52:31 +08:00
回复了 ElegantOfKing 创建的主题 Python Python 变量控制问题
再立一个 is_sent 的 flag 就行了。
@myang 离婚数有啥意义?这个难道不是跟各省人口有关系的?
Charge Information:
Charge Remaining (mAh): 5767
Fully Charged: Yes
Charging: No
Full Charge Capacity (mAh): 5965
Health Information:
Cycle Count: 86

感觉弱爆了。
@hgyhyx
@Perry

所以这里算的是 “离结率” 。
2016-02-28 12:52:24 +08:00
回复了 incantation 创建的主题 Apple iPhone 5se 值得期待吗?
觉得不值得买的人一定没见过手小的妹子。
直播结束,结局是前列腺爆了。
2016-02-28 10:27:39 +08:00
回复了 onice 创建的主题 数据库 Mysql 怎么去重啊?
新建表,然后把数据 insert ignore 过去
2016-02-27 19:07:12 +08:00
回复了 est 创建的主题 分享发现 当年神一样崇拜的 《超级解霸》 原来也是偷 GPL 的黑历史啊
@d7101120120 大哥。看我链接的原文了么?
2016-02-27 16:40:07 +08:00
回复了 est 创建的主题 分享发现 当年神一样崇拜的 《超级解霸》 原来也是偷 GPL 的黑历史啊
2016-02-27 14:50:21 +08:00
回复了 maguowei 创建的主题 分享创造 从拉勾上扒的互联网公司基本信息数据
人数

$ python -c "for l in __import__('csv').reader(open('1.csv')): print l[5]" | sort | uniq -c | sort -nr

32769 15-50 人
19616 50-150 人
14808 少于 15 人
10870 150-500 人
4640 500-2000 人
3633 2000 人以上

看来是小微企业为主。
2016-02-27 14:49:09 +08:00
回复了 maguowei 创建的主题 分享创造 从拉勾上扒的互联网公司基本信息数据
资金情况


~/lq_dev/gist/lagou-stats[master*]$ python -c "for l in __import__('csv').reader(open('1.csv')): print l[6]" | sort | uniq -c | sort -nr

33994 未融资
18825 不需要融资
15187 天使轮
8297 A 轮
5033 上市公司
2615 B 轮
1355 D 轮及以上
1031 C 轮
2016-02-27 14:47:31 +08:00
回复了 maguowei 创建的主题 分享创造 从拉勾上扒的互联网公司基本信息数据
行业分布

$ python -c "for l in __import__('csv').reader(open('1.csv')): print '\n'.join(x.strip() for x in l[4].split(','))" | sort | uniq -c | sort -nr


41923 移动互联网
19409 电子商务
9790 O2O
9185 金融
9123 企业服务
6912 其他
5085 数据服务
4845 教育
4781 文化娱乐
3876 硬件
3515 生活服务
3421 医疗健康
3277 广告营销
3228 游戏
2498 社交网络
1418 旅游
1165 信息安全
2016-02-27 14:45:58 +08:00
回复了 maguowei 创建的主题 分享创造 从拉勾上扒的互联网公司基本信息数据
粗略统计了一下:


$ python -c "for l in __import__('csv').reader(open('1.csv')): print l[3].decode('utf8', 'ignore')[:2].encode('utf8')" | sort | uniq -c | sort -nr

27568 北京
14449 上海
10772 深圳
6847 广州
5065 杭州
2986 成都
1770 武汉
1677 南京
1120 厦门
1068 西安
1022 长沙
971 苏州
828 郑州
805 重庆
763 天津
600 青岛


北上深广杭 你们赢了
2016-02-27 14:26:46 +08:00
回复了 maguowei 创建的主题 分享创造 从拉勾上扒的互联网公司基本信息数据
@maguowei 我之前提到过这个。的确太损了。

有意思。 11M 的 csv 收了。多谢。
2016-02-27 00:34:12 +08:00
回复了 zjxubinbin 创建的主题 云计算 阿里云真渣
@aliyunservice V2EX 第 160650 号会员,加入于 2016-02-26 11:41:45 +08:00 ,今日活跃度排名 2127

你们爬虫很叼啊。随时都可以召唤到。
2016-02-26 19:48:51 +08:00
回复了 godteemo 创建的主题 分享创造 写了一本 InfluxDB 简明手册 教程,给有需要的同学!
@zts1993
@godteemo

其实不可靠。出现过 1 次丢数据。

就用来打一些不太重要的事件标记吧。
2016-02-26 14:54:19 +08:00
回复了 ninjadq 创建的主题 Python 为什么开源的 Django 项目,都与官方推荐的代码组织方式不同?
@sudoz 理由嘛就是老项目不能直接复制过来做新项目。要改许久 settings.py
2016-02-26 14:21:42 +08:00
回复了 zjxubinbin 创建的主题 云计算 阿里云真渣
LZ 你去买一个 1CPU 1G 内存的机器编译 MySQL 会一样得出机器很渣的结论。
2016-02-26 14:21:04 +08:00
回复了 ninjadq 创建的主题 Python 为什么开源的 Django 项目,都与官方推荐的代码组织方式不同?
django 官方结构不适合流水线生产产品。我一般都是 startproject 一个名字叫 src 的项目。
1 ... 316  317  318  319  320  321  322  323  324  325 ... 614  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5396 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 895ms · UTC 03:29 · PVG 11:29 · LAX 20:29 · JFK 23:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.