V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Morriaty  ›  全部回复第 20 页 / 共 30 页
回复总数  600
1 ... 16  17  18  19  20  21  22  23  24  25 ... 30  
2018-01-11 14:02:55 +08:00
回复了 domino 创建的主题 剧集 硅谷 Silicon Valley - Back on HBO Mar. 25
感觉更新好快啊,究竟是美剧节奏快,还是时间过得快了
2018-01-10 13:46:03 +08:00
回复了 DongDongXie 创建的主题 程序员 怎么把一个大数据集切出一小部分来做实验
如果是和数据分布无关的操作,就随机抽呗,比如 Python 就是 generator 每隔一万行 yield 一个。

如果是和数据分布有关,比如 1T 文件的排序,那你要有采样的过程。
2018-01-07 00:34:21 +08:00
回复了 owenliang 创建的主题 Elasticsearch 搜索引擎的召回问题
ES 检索的过程相当于一个 map reduce 的过程,在各个 shard 里分别检索,最后再有 coordinator 整合。所以大数据量的计算是被分配到集群的各个 shard 上去了。

而且如果真的一个 query 召回了太多的 doc,那基本可以认为该 query 是个 stopword。
2018-01-06 21:21:43 +08:00
回复了 v2dead 创建的主题 全球工单系统 某宝的宝贝相似度算法是怎么处理的?
目测是因为程序员里的女装大佬越来越多了,由协同过滤推荐产生的。
@cctvsmg 你这是典型的技术人员的思维了,难道要让其他人接受一个事物,就必须扣到代码细节?

我一直认为好的产品 or 工具,一定是足够的抽象化的,比如你和被人介绍什么是计算机,只要告诉他有哪些输入模块(键盘、鼠标),有哪些输出模块(显示屏,音响),而不是跟他讲 CPU 指令、总线通信
2017-12-26 10:04:27 +08:00
回复了 Morriaty 创建的主题 程序员 可以访问 ipv6.g 和谐 gle.com,但访问不了北邮人
@SNALDHOI 只是关闭了 v4 通道吧
2017-12-25 14:37:55 +08:00
回复了 anasplrt34 创建的主题 程序员 现在主流的给爬取到的内容进行评分的技术是什么
你是指
1. 垃圾新闻 or 正常新闻
2. 科技新闻 or 娱乐新闻 or 社会新闻 or ...
哪种?
2017-12-25 14:14:53 +08:00
回复了 Morriaty 创建的主题 程序员 可以访问 ipv6.g 和谐 gle.com,但访问不了北邮人
@senghoo 主要是好奇试试,也没想着要下载什么,毕竟 DO 一个月也就 1T 流量,放在高清资源上根本不够看.....

@reechang 为什么这么说?
2017-12-25 14:13:11 +08:00
回复了 Morriaty 创建的主题 程序员 可以访问 ipv6.g 和谐 gle.com,但访问不了北邮人
@jimzhong 经你提醒,找到原因了,$$客户端开的 PAC 模式,访问北邮人的时候没走代理。谢谢!
2017-12-25 13:59:36 +08:00
回复了 Morriaty 创建的主题 程序员 可以访问 ipv6.g 和谐 gle.com,但访问不了北邮人
@jimzhong $$所在的服务器上是 ping 的通的
```
ping6 2001:da8:215:4078:250:56ff:fe97:654d
PING 2001:da8:215:4078:250:56ff:fe97:654d(2001:da8:215:4078:250:56ff:fe97:654d) 56 data bytes
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=1 ttl=46 time=247 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=2 ttl=46 time=236 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=3 ttl=46 time=249 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=4 ttl=46 time=238 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=5 ttl=46 time=237 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=6 ttl=46 time=243 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=7 ttl=46 time=232 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=8 ttl=46 time=237 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=9 ttl=46 time=243 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=10 ttl=46 time=220 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=11 ttl=46 time=220 ms
64 bytes from 2001:da8:215:4078:250:56ff:fe97:654d: icmp_seq=12 ttl=46 time=243 ms
```
我还是坚持认为需要什么再学什么,而不是人云亦云的学习。

比如你在使用 docker 的过程中,遇到了一些 UNdocumented feature,这时候你可能真的需要去源码里看一眼,那就该去看一眼 go 和虚拟化技术了。

再比如 java、流处理之于 storm ; scala、分布式理论之于 spark,etc.
饿了么不加班......敢问是什么部门.....
2017-12-21 09:14:18 +08:00
回复了 Anonym0u5 创建的主题 杭州 工资达到多少的时候,你坦然会住自如租房 2k 单间。
税后 15K,依然胆战心惊的住着 1500 的隔板间。

心疼。
@joey0904 创建成功还是太少数了,不能算是这批人的“出路”啊。
@zachguo 然后美帝这批转房产中介又碰到了 08 年次贷危机,岂不是惨上加惨?
2017-12-19 14:24:32 +08:00
回复了 sgissb1 创建的主题 问与答 Python 、mongodb 菜鸡的几个疑问
1. 可以考虑用 motor,前提是对有异步有足够的理解
2. pypy 也是有 GIL 的
3. pyc 只是提升模块的加载速度,而不是运行速度
4. IO 密集型用多进程或异步,计算密集型请换语言
2017-12-15 10:30:51 +08:00
回复了 billows 创建的主题 macOS 你们的 macOS 复制粘贴功能 100%成功吗?
感觉是快捷键冲突之类的
2017-12-13 21:17:25 +08:00
回复了 Morriaty 创建的主题 程序员 隔壁 [AI 邪乎] 帖有感,不得不说说“预期管理”的事
@kruskal 是的,这一波虽然被说是泡沫的声音很多,但还是值的期待的。
2017-12-13 10:03:00 +08:00
回复了 Morriaty 创建的主题 程序员 隔壁 [AI 邪乎] 帖有感,不得不说说“预期管理”的事
@rogwan 但对于研究人员而言,50 到 80 已经是质的飞跃了
1 ... 16  17  18  19  20  21  22  23  24  25 ... 30  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5715 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 65ms · UTC 06:44 · PVG 14:44 · LAX 23:44 · JFK 02:44
♥ Do have faith in what you're doing.