时长 12:16,请在 wifi 环境下观看
当当当当~
TalkingData 的视频访谈栏目开播啦
它有一个非常响亮的名字:《数中生智》
顾名思义,就是从数据中产生智慧
在这个栏目当中
我们将探讨大数据能产生怎样的智慧
以及怎么从大数据中生产这些智慧
与大数据以及 AI 相关的
趋势、科学、技术、实践以及从业者
都将是这个栏目所关注的焦点
在本期栏目当中我们邀请到了 TalkingData 数据科学家王小辉与陈日涵,和大家一起聊聊:AI 带来的机遇,以及如何把握这些机遇,成为 AI 时代所需的人才。
陈日涵
才貌兼具的 TalkingData 数据科学家
毕业于明尼苏达大学统计专业,目前就职于 TalkingData 从事数据科学工作。主要关注的方向为机器学习、计算机视觉及贝叶斯优化。
统计学或人工智能是比较大的概念,而机器学习只是其中的交叉部分,它属于学习( Learning )的分支。统计可能更为严谨,关注于数据建模( Data Modeling ),机器学习则是更贴近应用测的学科,关注预测,对于假设或模型检校( Mode Checking )的要求并不严格。
对于那些在校生来说,基础是更为重要,需要去上基础的数学课以及去修一些机器学习的课程。
现在有很多像 Cousera 这样的网站,提供免费的在线课程,都可以作为很好的入门材料,而 Youtube 上也有一些大神,比如 Andrew Ng (吴恩达)、Stephen Boyd 主讲的公开课。很多名校如斯坦福大学也有免费在线的公开课,这些公开课实际上与其在校生所学的课程同步,会比开源网站上的课程更有深度,若想提高自己在 AI 领域的知识积累,公开课是一个不错的途径,此外,GitHub 上也有很多机器学习或深度学习相关的学习资源。
注:参考资料见文末
除了做算法、数据建模( Data Modeling )、预测( Prediction )等这些基本的工作以外,数据科学家还需要去了解数据本身和业务场景,这是衡量一个数据科学家合格与否的重要标准。
数据科学家要成为数据工程师与业务之间的桥梁,一方面与数据工程师对接,需要对技术框架和代码有一定理解;一方面,将数据算法和模型做成一个合格的产品,指导实际业务。
大体上有两种方法,首先是开源竞赛,不仅能在论坛上和其他人交流提升自身的知识水平,也能刷一些排名( Rank )去提升用人单位发现自己的几率;第二是对一些开源项目做贡献,因为做贡献的这个行为也能从侧面反映出自身是一个合格的数据科学家。
TalkingData 曾在 Kaggle 上发布过性别识别的竞赛,参与人数刷新了 Kaggle 当时的历史记录。最近,TalkingData 在 Kaggle 上发布了另外一个关于广告反欺诈的竞赛,欢迎大家参加。
详情请点击:组队打击广告欺诈,重金召唤你的加入
友情提示:部分网站需要科学上网
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.