一次莫名其妙的面试

2016-05-13 14:39:18 +08:00
 SlipStupig

今天本来抱着试一试的心态刷一下面试,莫名其妙被 PASS
面试官:你介绍一下你自己
我:巴拉巴拉
面试官说:你用 python 还是 java 开发爬虫
我说: python
面试官:什么场景或有验证码
我:这个看业务方喜好,他们要喜欢什么时候都可以用
面试官:你识别过验证码吗?
我:我识别过字符和数字不复杂的
面试官:什么原理
我:用取字摸
面试官:实际实现过吗?
我:实现过,用 tesseract-ocr
面试官:你识别过其它的吗
我:我之前识别过 163 的,但是准确率太低
面试官:你认为什么叫高
我: 60%算及格,我只到 30%
面试官:你怎么知道哪里有验证码呢
我:没有特别好的办法,只能在表单附近找有没图片
面试官:你怎么得到验证码,是用浏览器方式吗?(我实在没明白什么是浏览器方式)
我:我直接解析 xpath ,得到路径下载二进制文件下来,然后本地识别就行了
面试官:我知道了(态度特别差)

我到底错在哪了,求各位大神指导

8332 次点击
所在节点    职场话题
62 条回复
yanyandenuonuo
2016-05-15 21:31:57 +08:00
@hyzjshwo 我也遇到这种问题了。。几个知名公司的 HR 最后都这样干了。。给不起工资何必开那么高呢,浪费双方的感情和时间。。。
cppgohan
2016-11-25 16:36:24 +08:00
楼主我来挖坟, 取字摸是什么意思?

能不能发个 url 科普一下, 另外, lz 有没有什么爬虫成果和心得, 分享分享:).

我只玩过很少量的网页数据分析, 自动下载. 验证码这块感觉很高级, 如果我的话, 估计直接考虑接入 api 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278439

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX