一次莫名其妙的面试

2016-05-13 14:39:18 +08:00
 SlipStupig

今天本来抱着试一试的心态刷一下面试,莫名其妙被 PASS
面试官:你介绍一下你自己
我:巴拉巴拉
面试官说:你用 python 还是 java 开发爬虫
我说: python
面试官:什么场景或有验证码
我:这个看业务方喜好,他们要喜欢什么时候都可以用
面试官:你识别过验证码吗?
我:我识别过字符和数字不复杂的
面试官:什么原理
我:用取字摸
面试官:实际实现过吗?
我:实现过,用 tesseract-ocr
面试官:你识别过其它的吗
我:我之前识别过 163 的,但是准确率太低
面试官:你认为什么叫高
我: 60%算及格,我只到 30%
面试官:你怎么知道哪里有验证码呢
我:没有特别好的办法,只能在表单附近找有没图片
面试官:你怎么得到验证码,是用浏览器方式吗?(我实在没明白什么是浏览器方式)
我:我直接解析 xpath ,得到路径下载二进制文件下来,然后本地识别就行了
面试官:我知道了(态度特别差)

我到底错在哪了,求各位大神指导

8253 次点击
所在节点    职场话题
62 条回复
cxbig
2016-05-13 16:54:55 +08:00
LZ 想太多,面试失败别总想着是自己的问题
leassy
2016-05-13 16:55:15 +08:00
面试的觉得楼主对他是个威胁,所以决定不录用,我们公司就是这样的
SlipStupig
2016-05-13 16:55:48 +08:00
@jarlyyn 请问浏览器抓取是通过气功还是 HTTP 协议?我发包和浏览器发包有什么区别?
SlipStupig
2016-05-13 16:57:50 +08:00
@leassy 还有这种事情,能力强是不是不是他能更省事嘛!

@cxbig 我就是觉得我没啥问题,我才来上 v 站
assassinpig
2016-05-13 16:57:56 +08:00
明显没有问出他想问的东西 又不愿意多透露具体应用场景
SlipStupig
2016-05-13 16:59:19 +08:00
@assassinpig 没有场景我更不好回答了,图像处理这块我确实不是强项,但是他问的东西我觉得好业余
iphantom
2016-05-13 17:04:25 +08:00
根据我的经验

他问的就是他目前遇到的问题 把问题当面试题

他只是想通过面试 来解决他的问题 而不是招聘
SlipStupig
2016-05-13 17:05:57 +08:00
@iphantom 如果是这样应该问更细致的东西啊,处理验证码又不是网上没教程,你要看不会我随便说两句,你也解决不了啊
ice00shark
2016-05-13 17:18:17 +08:00
我觉得他是想问你是怎么确定这个登录需要验证码的。
他们可能是需要智能的分析出何时需要解验证码。
jarlyyn
2016-05-13 17:23:36 +08:00
@SlipStupig

是否解析 js
SlipStupig
2016-05-13 17:26:04 +08:00
@ice00shark 我说了怎么识别验证码出验证码, form 内看有没图片,其实还有其它办法,他不让我说,就反复问我怎么得到验证码,对我直接下载验证码这种方式我感觉他特别轻蔑
SlipStupig
2016-05-13 17:27:53 +08:00
@jarlyyn 你直接用 webkit 或者 CEF 等获得验证码图片的数据,是用 JS 获得的,而不是不是靠协议?
jarlyyn
2016-05-13 17:28:03 +08:00
@jarlyyn

另外我用过的气功叫做 phantomsjs
qqjt
2016-05-13 17:28:45 +08:00
……一股找人解答疑难的气息
Felldeadbird
2016-05-13 17:28:47 +08:00
面试官不会带入面试者去他的问题,所以这个面试官不是个好得面试官。也就是说他的技术没楼主好。
SlipStupig
2016-05-13 17:29:07 +08:00
@jarlyyn phantomjs 不需要网络请求就能得到远程 server 的数据?
jarlyyn
2016-05-13 17:30:33 +08:00
@SlipStupig

抬杠什么意思,万一验证码走 canvas 呢。

又或者验证码地址是 js 生成的呢……
Ouyangan
2016-05-13 17:31:13 +08:00
面试官比较菜
cxshun
2016-05-13 17:39:01 +08:00
应该是面试官比较菜,不懂那些东西。
onion83
2016-05-13 17:47:00 +08:00
> 浏览器是靠气功把图片读出来的吗?

让一个手欠格式化硬盘丢一年数据的,沮丧一下午的人活过来了 :)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278439

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX