sivacohan
2017-07-29 02:13:42 +08:00
不知道你面的什么岗位。我对初级爬虫工程师的面试也是先爬一个网站。目标网站是阳光高考。
题目是:24 小时内,从阳光高考上抓取学校名称,学校的院系设置。代码托管到 GitHub 上。邮件回复时,指明 GitHub 的 repo 地址。
希望获得的答案:
1,不仅仅有 master 分支
2,git log 不只有一条
3,commit 信息相对完整
4,良好的代码风格
5,干净的 requirements.txt
6,良好的存储方式
7,爬虫框架的选择
8,确认沟通能力
9,如果能顺手爬取更多的内容这是一个大的加分
初级工程师的问题是简历太简单,同质化严重。看简历很难有一个区分度。所以前置有一个模拟项目能保证面试不尴尬。
并且,如果你之前完全没经验,能在 24 小时搞定这个小问题,那也足以说明你的学习能力。
至于指定网站,是为了让题目有标准答案,大家能处在同一标准下比拼。避免因目标网站的不同造成影响。