机器学习日报 2015-02-03 讨论:词嵌入到底有用在何处?

2015-02-04 07:56:28 +08:00
 haoawesome

@好东西传送门 出品, 过刊见 http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

可点击加长版44条 http://ml.memect.com/archive/2015-02-03/long.html


讨论:词嵌入到底有用在何处?

@老师木

关键词:公告板, 自然语言处理, 问题

word embedding(如word2vec)到底有用在何处?china-beijing=japan-tokyo这种性质又有什么用途呢?所以,通常用什么指标评价这个方法好/神奇。

 


Real-Time Bidding展示广告PPT

@zwner

关键词:会议活动, 算法, 应用, 资源, PDF, WSDM, 广告系统, 幻灯片, 会议, 课程

我们研究组在#WSDM2015#上关于Real-Time Bidding展示广告的教学演讲幻灯片可以下载了: [1] 这次除了有各类DSP竞价算法、SSP底价算法外,还加入了anti-fraud和广告期权交易的内容。另外也罗列了做互联网广告研究的公开数据集和开源工具。 @袁帅

[1] http://tutorial.computational-advertising.org/images/WSDM2015.pdf

 


机器学习职位面试主要考察什么?

@好东西传送门

关键词:公告板, 算法, 招聘

国内互联网公司机器学习数据挖掘类的职位面试主要考察什么方面的东西? [1] 知乎的这个问答里Orangeprince列出几类不同的从业者 ,招聘主要根据其中H和I两类模版挑选人才。看 1.机器学习算法的理解 2.实际的项目经验 3.对于业务的理解能力和敏感性 4.沟通表达能力

[1] http://zhi.hu/fL6w

 


CUDA系列学习 (四)

@Rachel____Zhang

关键词:经验总结, GPU, 博客

#CUDA系列学习 (四)终于写好了~ 首先介绍了Parallel communication patterns的几种形式(map, gather, scatter, stencil, transpose), 然后复习了cuda memory model并从high level上分析怎样写出高效代码,最后继续上一讲讨论流程控制(control flow)以及原子操作。 [1]

[1] http://blog.csdn.net/abcjennifer/article/details/43374009

长微博图: http://ww1.sinaimg.cn/large/9b6c6e0fgw1eow8hq4fyqj20530eidgw.jpg

 


doc2vec实战效果

@cosmozhang

关键词:自然语言处理, 主题模型

我试了一下用doc2vec [1] 处理 Pang 和 Lee 的 sentimet analysis 的数据集,对于每一个doc得到 一个feature vector 再用这个feature vector 作为输入用svmlight 进行分类,结果准确率在53%左右,和抛硬币没太大区别。[汗]

[1] http://radimrehurek.com/gensim/models/doc2vec.html

1615 次点击
所在节点    机器学习
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/168069

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX