V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  p2pCoder  ›  全部回复第 7 页 / 共 57 页
回复总数  1123
1 ... 3  4  5  6  7  8  9  10  11  12 ... 57  
2020-09-24 09:27:15 +08:00
回复了 bengcaca 创建的主题 问与答 简书是不是要黄呀,怎么都是“文章正在审核中”
这几年国庆都这样
2020-09-23 17:30:28 +08:00
回复了 blindie 创建的主题 问与答 9 月开始各 app 隐私政策就一个个更新 是发生什么了吗?
工信部有政策了
2020-08-23 08:53:46 +08:00
回复了 wseani 创建的主题 职场话题 不想工作了,可是..
如果没有很强的抗压能力,建议还是尽早离开算法这个方向,尤其是互联网业务的相关算法工作
无论是 nlp cv 这种内容理解方向还是 推荐、广告方向,AI 落地都要面对 很复杂的数据流以及在复杂系统下很难把握的业务指标,而这些业务指标是实打实 直接关系到 收入 dau 用户留存的,在算法效果不好的时候,压力自然会很大
数据流的复杂,深度学习本身的黑盒属性,不确定性很多,楼主如果打算坚持做,建议 首先厘清边界,作为算法要做 特征 样本 模型调参 数据分析等几个算法工程师核心的东西,很多工程上的东西,比如线上 serving,尽量找专门的人做,如果没有专门的人,那就尽量去学习周围做好的 迭代的快的框架;和产品、业务方,最好有统一的出口,避免和对方每天都扯皮浪费很多时间;对待最终效果,保持平常心,算法迭代能有一半有正向收益就很不错了。
2020-08-07 15:44:36 +08:00
回复了 shoumu 创建的主题 成都 现在成都搜索、推荐类算法的岗位需求怎么样?
很少,就算有也是偏边缘业务
搜索、推荐、广告团队,成都招人太难了
2020-08-03 16:53:14 +08:00
回复了 beryl 创建的主题 程序员 成长瓶颈的时候一般怎么提升自己
大厂的话,去更核心业务
新开一个服务,启动不注册服务,可以做线上 trace,定位是不是单机的问题
除了服务本身的问题,线上 预发 测试的容器规格需要考虑
不同环境下的实例数目需要考虑
同时启动的服务实例数目需要考虑
启动时候依赖的中间件 db 的负载情况 需要了解
2020-06-30 19:15:58 +08:00
回复了 yanshenxian 创建的主题 程序员 字符串哈希为 Long 型整数算法有推荐的吗
64 位 一般都很难碰撞
机器学习 深度学习里面用的最多是 mumurhash3
存过线性模型,32 位,三千万的模型碰撞位七八万
64 位,75 亿的模型,碰撞为 0
2020-06-24 08:22:04 +08:00
回复了 PopRain 创建的主题 问与答 有没有可以内网部署的“有道云笔记”软件?
企业 wiki:confluence
性能调优 先跑个 profiler 找下瓶颈在哪
并发的 cpu 密集计算 建议 几方面优化 ,首先是合理的 计算分片,减少线程 进程切换的 cpu 消耗,然后是并行计算要考虑中间结果的缓存,看逻辑上是否有大量的重复计算,最后,就是优化算子,比如 整形 浮点型的位数,字符串转 hash,减少字符串操作,用取 hash 及 hash 后的整数的位运算取代
如果是 java golang python 这些语言,还要考虑在计算密集型的应用中,gc 的巨大压力,以及语言本生的限制,如果最后真的是调优无法达到要求,就建议 c++重写,性能会有质的提升,还可以从编译器以及硬件架构层面进行优化
2020-06-02 09:34:17 +08:00
回复了 seers 创建的主题 TensorFlow Tensorflow 有没有入门书籍推荐
有深度学习基础吗?
2020-06-01 09:34:53 +08:00
回复了 NibborQ 创建的主题 职场话题 关于入职体检。。。
肝功正常就没问题
2020-05-27 09:30:46 +08:00
回复了 byaiu 创建的主题 职场话题 想了解一下 C++工作 3 年工资一般能给到多少?
推荐引擎 深度学习 和高性能计算
天花板挺高的
2020-05-25 09:58:09 +08:00
回复了 hanjingzhan 创建的主题 问与答 是什么让你选择考研?
当年考研本校纯粹就是为了在学校再混三年,幸好没考上
如果你是主动选择考研,知道自己考研是为了什么,明确了 ROI,我建议你考
2020-05-19 23:16:14 +08:00
回复了 yuk1no 创建的主题 问与答 一道面试题给我整懵了,求指导
@hanhan13 方向有点错了,这其实并不是个在线的服务
一次查询千万对数据,这其实是个批处理的接口
输入和输出都不可能直接用 rpc 通信传输
2020-05-19 23:11:59 +08:00
回复了 yuk1no 创建的主题 问与答 一道面试题给我整懵了,求指导
@yuk1no 本地 map 速度比写入 nosql 快很多
四十核机器,开 400 个线程从 hdfs 拉去 70 亿行的数据的,处理字符串,存成 long double 的 key value
不超过十分钟,如果是分区增量,就更快了
spark 分布式 开 100 个 executor 写到 redis,与单机的本地 map 写入相比,速度距离差距也很大,要是 hbase,就更慢了
读的速度,本地 map 也快的多

有条件的话,建议找几台大机器自己折腾,做 benchamark
2020-05-19 17:56:36 +08:00
回复了 yuk1no 创建的主题 问与答 一道面试题给我整懵了,求指导
可以考虑用本地 map
把用户 id-订单 id 的拼接字符串取 murmurhash,可以用 48 位或者 64 位的
我在项目中曾用 64 位整型存过 50 亿-100 亿个 string key 的 map,把 string 用 murmurhash 转为 64 位整型后,测过几次,碰撞个数为 0,内存占用在 一百多 G 左右,map 是 key 为 64 位整型,value 位 double,你这个问题,占用的内存更小
高端点,可以考虑设计个 bitmap 之类,这样查找速度会更快,这种还需要懂算法的更精细的设计
存到 nosql 里面会慢很多,你找几个 128 核 500G 内存的机器,存个本地 map,肯定比用 nosql 的数据结构性能高几百倍可能还不止,成本也更低
2020-05-18 14:00:31 +08:00
回复了 statement 创建的主题 职场话题 大家找工作是看技术栈还是看行业
技术栈和技术能力是有区别的
2020-05-18 13:52:18 +08:00
回复了 RSDTE 创建的主题 问与答 为什么那么多高学历的人都不屑于去考老师?
主要还是因为钱
特别是针对男性
大城市比如上图说到深圳的老师待遇已经很不错了,
但是相对于房价还是吃力
所以还是女性明显多于男性

要不是缺钱,谁不想拥有个寒暑假
2020-05-18 11:04:37 +08:00
回复了 qqqqqcy 创建的主题 职场话题 业务 or 技术,如何选择
效能部门,建议尽量不要选
1 ... 3  4  5  6  7  8  9  10  11  12 ... 57  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5572 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 06:50 · PVG 14:50 · LAX 22:50 · JFK 01:50
Developed with CodeLauncher
♥ Do have faith in what you're doing.