作为学生,想做点推荐算法的东西,但是没有数据源,怎么办?

2017-03-24 21:06:03 +08:00
 cqcn1991

比如我想做大众点评的餐馆的推荐,但是一来没有数据,二来即便做出来了也得不到验证,推不到用户面前

不知道这方面有啥可以“入门”,“实战”的机会?

1951 次点击
所在节点    问与答
13 条回复
murmur
2017-03-24 21:08:29 +08:00
自己抓就是了 正好连爬虫技术一块学到了
你得到验证了还得了 各厂花钱雇的反爬虫工程师就是为了对付你们实战的

貌似前段时间 ali 有个机器学习的比赛还是啥 可以用到接近真实的数据
cqcn1991
2017-03-24 21:12:05 +08:00
@murmur 爬虫可以学,其实我也懂一点。

不过,你后面那句没理解,为啥说反爬虫是为了反我们做验证?推荐系统的验证,不是给用户用,看实际效果吗?
shiny
2017-03-24 21:12:15 +08:00
正好先学习个爬虫技术
ryd994
2017-03-24 21:13:16 +08:00
yelp
murmur
2017-03-24 21:13:19 +08:00
@cqcn1991 各家都不卖东西 客户的评价就是他们的家底了 能随随便便公布么或者让你抓到

百度的电影推荐 阿里的商品购买预测 这活动都过去了 下一波不知道啥时候慢慢等吧
000wangxinyu000
2017-03-24 21:14:23 +08:00
kaggle
v2pro
2017-03-24 21:14:44 +08:00
kaggle ,天池……直接用比赛的不挺好吗……
shoumu
2017-03-24 21:14:46 +08:00
去玩玩 kaggle 之类的比赛吧,还是挺有意思的
murmur
2017-03-24 21:19:47 +08:00
@v2pro 天池最近一期比赛是交通流量预测的 楼主估计是要找那些接地气的项目还要国内的数据源

以前的数据源发布页的 apply 都是灰的 估计短时间内不会对外公开吧
cqcn1991
2017-03-24 21:26:10 +08:00
@murmur kaggle 那种太高端了…而且太技术了,拼的是准确率
murmur
2017-03-24 21:27:31 +08:00
Kilerd
2017-03-24 21:33:05 +08:00
模拟,爬虫
cqcn1991
2017-03-24 21:51:34 +08:00
@murmur 主要是预测 /机器学习,和推荐系统还不太一样吧...我可能标题没写太好...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/350132

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX