机器学习日报 2015-01-30

2015-01-31 09:14:40 +08:00
 haoawesome

@好东西传送门 出品, 过刊见 http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

可点击加长版49条 http://ml.memect.com/archive/2015-01-30/long.html


全新ArnetMiner上线

@ArnetMiner

关键词:学术搜索

全新ArnetMiner上线,最新代号AMiner,从学术网络中挖掘深度知识、面向科技大数据的挖掘。收集近4000万作者信息、8000万论文信息、1亿多引用关系、链接近8百万知识点;支持专家搜索、机构排名、科研成果评价、会议排名。期待您的关注和建议 [系统持续改进中] 。 @唐杰THU @好东西传送门

 


MinHash

@赵印_Eason

关键词:算法, 聚类

《MinHash》 MinHash是一种概率意义的聚类算法,快速实现,有随机因素。 在推荐场景: It assigns a pair of users to the same cluster with probability proportional to the overlap between the set of it...(阅读全文: [1] 下载LOFTER客户端: [2] )

[1] http://easoncool.lofter.com/post/d4fca_5933570

[2] http://www.lofter.com/app/QRCodedownload?act=qbposttoweibo_20140726_01

 


Word2Vec的有趣应用

@爱可可-爱生活

关键词:自然语言处理, Daniel Hammack, Omer Levy, Python, 代码

[问答]《What are some interesting Word2Vec results?》 [1] Quora上的主题,讨论Word2Vec的有趣应用,Omer Levy提到了他在CoNLL2014最佳论文里的分析结果和新方法(稍后单独推荐),Daniel Hammack给出了找特异词的小应用并提供了(Python)代码 [2]

[1] https://www.quora.com/What-are-some-interesting-Word2Vec-results

[2] https://github.com/dhammack/Word2VecExample

长微博图: http://ww3.sinaimg.cn/large/5396ee05jw1eoroc4d5l4j20yf2rcqnu.jpg

 


问答:机器翻译中如何计算中文句子翻译为某一英文译文的概率

@弓长小泰

关键词:算法, 自然语言处理, 机器翻译

@好东西传送门 给定中文句子和英文句子,求中文句子能翻译成英文句子的条件概率,有这样的工具包或者算法吗?谢谢!

 


基于GraphX实现的Gibbs Sampling LDA

@朗格里格朗zk

关键词:算法, Spark, 代码, 主题模型

基于GraphX实现的Gibbs Sampling LDA,定义文档与词的二部图,顶点属性为文档或词所对应的topic向量计数,边属性为Gibbs Sampler采样生成的新一轮topic。每一轮迭代采样生成topic,用mapReduceTriplets函数为文档或词累加对应topic计数。 [1] @gerrylin @Copper_PKU @好东西传送门

[1] https://github.com/amplab/graphx/pull/113/commits

1620 次点击
所在节点    机器学习
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/166960

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX