程序员间常见的一个话题是『反正工作中又碰不到,我要这算法有何用?』,因而有标题所问。
本帖的讨论范围暂时不包括那些过于典型的场景,这里的“典型”是指:当我需要做一个功能,百度或 Google 之后,大家都在用这个算法,那我就使用这个算法吧。比如垃圾词过滤的 AC 自动机(包括其他改进版)、爬虫 URL 判重的 BloomFilter (包括其他改进版)。
我举两个我见过的例子:
word2vec
本身是做Word Embedding
的,进而可以用来判断同义(同位)词。一个有趣的应用场景是,训练用户的商品浏览记录,用户同一个 session 内连贯的浏览,相当于一个句子,每个商品相当于一个 word,进而发现相似的商品。这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.