[异周话题 第 4 期] 如何在一年内成为优秀的数据挖掘工程师?

2017-10-12 10:38:36 +08:00
 eric614802

话题背景

数据挖掘(Data Mining),顾名思义是指从海量的数据中通过算法搜索隐藏于其中信息的过程,它是数据库知识发现中的一个步骤。近年来,数据挖掘引起了信息产业界的极大关注。数据挖掘能够将大量数据转换成有用的信息和知识,并可以广泛用于各种应用于各行各业,例如商务管理、生产控制、市场分析、工程设计和科学探索等。

早在 2009 年,Google 通过分析 5000 万条美国人最频繁检索的词汇,将之和美国疾病中心在 2003 年到 2008 年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终 google 成功预测了 2009 冬季流感的传播甚至可以具体到特定的地区和州。数据挖掘的应用远远不止于此,本周的 [异周话题] 我们就来聊聊 [数据挖掘] 的相关话题。

话题内容

大家可以围绕以下一个或多个问题展开讨论:

1.如何入门数据挖掘?需要学习哪些知识请分享你的经验与建议。
2.如何成为一名优秀的数据挖掘工程师?需要突破哪些难点?请分享你的经验与心得。
3.如何看待数据挖掘的行业前景?如何看到数据工程师的职业前景?请分享你的观点与看法。
4.数据挖掘和机器学习有什么区别?你更看好两者之中的哪一个方向?

话题时间

2017 年 10 月 10 日-10 月 15 日

话题奖励

活动结束后,我们将选取 4 位讨论精彩的同学,各送技术图书《写给程序员的数据挖掘实践指南》图书 1 本。

话题链接

点击链接,参与话题:http://www.epubit.com.cn/article/1354

图书作者: [美] Ron Zacharski (扎哈尔斯基)

作者简介:Ron Zacharski 拥有软件开发和计算语言学方面的背景。他是一位计算机科学副教授,并且为从事机器学习和信息提炼的几家创业公司担任过咨询顾问。此前,他在 New Mexico 的计算研究实验室工作,从事机器翻译、特别是人们较少学习的语言方面的研究工作。他曾获得明尼苏达大学计算机科学博士学位,爱丁堡大学的语言学博士后,并且拥有音乐艺术学士学位。Ron Zacharski 的经历颇具传奇色彩:他初学音乐,做了十年的音乐理疗师。后获得计算机科学博士学位,专攻自然语言处理。现在是一名软件开发工程师,同时也是一位松冈操雄曹洞宗的禅师。。

图书简介:本书是写给程序员的一本数据挖掘指南,可以帮助读者动手实践数据挖掘、集体智慧并构建推荐系统。全书共 8 章,介绍了数据挖掘的基本知识和理论、协同过滤、内容过滤及分类、算法评估、朴素贝叶斯、非结构化文本分类以及聚类等内容。本书采用“在实践中学习”的方式,用生动的图示、大量的表格、简明的公式、实用的 Python 代码示例,阐释数据挖掘的知识和技能。每章还给出了习题和练习,帮助读者巩固所学的知识。
本书适合对数据挖掘、数据分析和推荐系统感兴趣的程序员及相关领域的从业者阅读参考;同时,本书也可以作为一本轻松有趣的数据挖掘课程教学参考书。

1793 次点击
所在节点    机器学习
2 条回复
magicO
2017-10-13 04:25:16 +08:00
搬板凳
eric614802
2017-10-13 08:44:03 +08:00
@magicO 与 i 赶快去参加,板凳在异步社区( http://www.epubit.com.cn/)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/396988

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX