如何拒绝高危需求又不得罪人?

4 天前
 kong0bbs

CEO 发现到企业微信上发任意 http url 能够以卡片的形式显示。 卡片会展示该 url 的 icon 、title 、description 、keywords 几个信息。 CEO 觉得这个功能很棒,想在公司自研 IM 上也达到类似效果。

自研 IM 挂在我的直属 TL 名下。 CEO 将想法丢在公司大群里,说企业微信的功能很方便,问能不能做。 TL 马上答应下来,他跟 CEO 差了几级,平时根本说不上话。

TL 在找人开发时卡住了,没人愿意接这个需求。 原因是这需求要爬任意 url ,有风险,可能不合规。 TL 问了法务,法务给的答复也模棱两可,法务让技术测判断。 但是 TL 已经答应了 CEO ,再反悔,会留下不良印象。 TL 在公司表现不错,也很年轻,不希望在 CEO 面前丢分。

在实在找不到人的情况下,TL 找到我,希望我能接。 但我也不想碰这个需求,但我跟他共事 7 年了,拉不下脸面。 但他以私人身份求我,甚至承诺把团队顶格绩效给我。 我还是想拒绝,但又怕得罪人,应该如何拒绝?

类似案例: 有家公司爬深圳市 ZF 网站上的公开数据。 但程序有 bug ,出现了死循环,导致以近 100qps 发请求。 最终把 ZF 网站打挂了,事情发生在周末,ZF 人员在休假,无人恢复,挂了一周末。 引发了很多市民的投诉,最终,技术总监和程序员都进去了。

10730 次点击
所在节点    职场话题
159 条回复
NevadaLi
4 天前
高危需求要和对方直截了当的表明情况,对方还没有意识到问题的严重性。如果你俩关系不错,建议也劝他别因小失大。

关键问题太委婉会让对方意识不到危险,到时候真出事就麻烦了。
xzour
4 天前
可以找找有没有第三方卖这种数据的。不一定要自己亲自爬
kong0bbs
4 天前
不是静态数据,而是发任意 url 要抓取 tkd 信息展示成卡片,包括公司内网 url 和外网 url 。
lloovve
4 天前
直接跟 ceo 反馈啊,这又不是技术问题,不要想着用技术解决
xzour
4 天前
@kong0bbs 强大的第三方其实也是实时的(比如企查查,爱企查这种爬工商信息的,不也卖接口)。自己内部的网站那就简单,自己对接就好。如果百度卖这种数据,比你自己爬还强大。由于这个不像企查查这种有商业机会,估计也不太好找,但可以去试试做搜索引擎的服务商。
dji38838c
4 天前
这个只是一次性对一个 URL 进行一个 GET 请求,很多国外 IM 都有,应该不算有合规问题吧?
renmu
4 天前
这种信息直接请求 html 就能拿到而且本来就是给浏览器或者外部应用看的,我觉得不涉及所谓爬虫
xzour
4 天前
@dji38838c 对,也可以改为发 url 消息才请求一次 get ,而不是预处理。限制请求间隔抓缓存。
ETiV
4 天前
我觉得可以接,因为标准是开放的,叫 open graph ,https://ogp.me/

比如现在这个帖子,查看 HTML 代码,就会看到下面这些:

<meta property="og:locale" content="zh_CN" />
<meta property="og:type" content="article" />
<meta property="og:title" content="如何拒绝高危需求又不得罪人? - V2EX" />
<meta property="og:description" content="职场话题 - @kong0bbs - CEO 发现到企业微信上发任意 http url 能够以卡片的形式显示。卡片会展示该 url 的 icon 、title 、description 、keywords 几个信息。CEO 觉得这" />
<meta property="og:url" content="https://www.v2ex.com/t/1052841" />
<meta property="og:site_name" content="V2EX" />

企微也不是每个 URL 都有卡片展示的,抓不到的就不显示呗
xzour
4 天前
看上面的回答,不涉及爬虫,顶格绩效,可以考虑接下。
potatowish
4 天前
调第三方接口,不要自己去抓取,出了事第三方兜底
forvvvv123
4 天前
企微是怎么实现的,怎么解决的合规问题?
abigeater
4 天前
以客户端 IP 发送的请求,不算高危需求吧。看很多 IM 都实现了
x86
4 天前
这种只是取个 meta 头信息不算爬吧
bigfei
4 天前
可以从客户端请求发,涉及不到爬虫
kong0bbs
4 天前
我们 im 是 web 套壳,没有安卓/ios 开发,前端说没法子跨站发请求。

而且前端发请求会导致 ip 特征变得很明显,都是公司出口 ip ,很快就会被封。
kong0bbs
4 天前
前端发请求,同源策略过不去
toesbieya
4 天前
web 套壳那让基座写个请求方法给 web 调不就行了吗
vanleon
4 天前
先做公司侧的 url ,今年做完了拿定格绩效,然后明年跑路
iOCZS
4 天前
不写代码就是最安全的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1052841

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX