@好东西传送门 出品, 过刊见 http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报
可点击加长版49条 http://ml.memect.com/archive/2015-01-30/long.html
@ArnetMiner
关键词:学术搜索
全新ArnetMiner上线,最新代号AMiner,从学术网络中挖掘深度知识、面向科技大数据的挖掘。收集近4000万作者信息、8000万论文信息、1亿多引用关系、链接近8百万知识点;支持专家搜索、机构排名、科研成果评价、会议排名。期待您的关注和建议 [系统持续改进中] 。 @唐杰THU @好东西传送门
@赵印_Eason
关键词:算法, 聚类
《MinHash》 MinHash是一种概率意义的聚类算法,快速实现,有随机因素。 在推荐场景: It assigns a pair of users to the same cluster with probability proportional to the overlap between the set of it...(阅读全文: [1] 下载LOFTER客户端: [2] )
[1] http://easoncool.lofter.com/post/d4fca_5933570
[2] http://www.lofter.com/app/QRCodedownload?act=qbposttoweibo_20140726_01
@爱可可-爱生活
关键词:自然语言处理, Daniel Hammack, Omer Levy, Python, 代码
[问答]《What are some interesting Word2Vec results?》 [1] Quora上的主题,讨论Word2Vec的有趣应用,Omer Levy提到了他在CoNLL2014最佳论文里的分析结果和新方法(稍后单独推荐),Daniel Hammack给出了找特异词的小应用并提供了(Python)代码 [2]
[1] https://www.quora.com/What-are-some-interesting-Word2Vec-results
[2] https://github.com/dhammack/Word2VecExample
长微博图: http://ww3.sinaimg.cn/large/5396ee05jw1eoroc4d5l4j20yf2rcqnu.jpg
@弓长小泰
关键词:算法, 自然语言处理, 机器翻译
@好东西传送门 给定中文句子和英文句子,求中文句子能翻译成英文句子的条件概率,有这样的工具包或者算法吗?谢谢!
@朗格里格朗zk
关键词:算法, Spark, 代码, 主题模型
基于GraphX实现的Gibbs Sampling LDA,定义文档与词的二部图,顶点属性为文档或词所对应的topic向量计数,边属性为Gibbs Sampler采样生成的新一轮topic。每一轮迭代采样生成topic,用mapReduceTriplets函数为文档或词累加对应topic计数。 [1] @gerrylin @Copper_PKU @好东西传送门
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.