@好东西传送门 出品, 过刊见 http://ml.memect.com
订阅:给 [email protected] 发封空信, 标题: 订阅机器学习日报
可点击加长版31条 http://ml.memect.com/archive/2015-02-20/long.html
@爱可可-爱生活
关键词:自然语言处理
[开源] Wiki2Vec —— 从维基百科Dumps生成Word2Vec向量的工具,包括词向量和主题向量
长微博图: http://ww2.sinaimg.cn/large/5396ee05jw1epfedr29wsj20l42p21h4.jpg
@爱可可-爱生活
关键词:算法, Java, PCA, 代码, 可视化, 异常检测
[开源]《RAD - Outlier Detection on Big Data》 [1] Netflix开源大数据异常检测模块RAD(Robust Anomaly Detection),采用Robust PCA检测异常点,主页上有可视化Demo。RAD是Java语言的开源项目Surus的一部分 GitHub: [2]
[1] http://techblog.netflix.com/2015/02/rad-outlier-detection-on-big-data.html
[2] https://github.com/Netflix/Surus
长微博图: http://ww1.sinaimg.cn/large/5396ee05jw1epg2vvef9ij20i11pd1bv.jpg
@网路冷眼
关键词:自然语言处理
[word2vec的工作原理] [1] word2vec是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。本文是讲其工作原理的,作者声明公式较多,慎入[doge]转需!
[1] http://andyljones.tumblr.com/post/111299309808/why-word2vec-works
长微博图: http://ww4.sinaimg.cn/large/663aa05ajw1epflaiwuwzj20k923gndj.jpg
@好东西传送门
关键词:架构, 算法, Spark, 代码, 集成学习, 聚类, 主题模型
BIDMach是一个高性能机器学习库,是Berkeley BID Data Project的一个产品,在一些评测中跑出了比spark还好的结果。 [1] 目前支持罗 辑回归、K-means、矩阵分解、随机森林、LDA、PageRank等算法 @晨晨_20130325 推荐
[1] https://github.com/BIDData/BIDMach
@达沃斯DAVOS
关键词:应用, 机器人
[人工智能-专题] #春节涨知识# [大红灯笼]人工智能是天使还是魔鬼? [1] 自动化对人类意味着什么? [2] 幼儿之于人工智能的启示 [3] 第二次机器时代对工人意味着什么? [4] 机器人革命已经到来? [5]