爬 gov cn 网站上的公开数据然后交给大模型向量化处理,是否有风险

6 天前
 jerrry

个人感觉有两个风险

所以有点犹豫。如果只是参与这个项目的其他部分,不涉及爬虫这块,是否有风险呢?

2491 次点击
所在节点    问与答
29 条回复
belin520
6 天前
@yyzh #5 我靠,深圳真的是太太太太先进了。。。
sneezry
6 天前
政府的东西别碰
yangliudi123
6 天前
还记得宋朝的莫须有吗,也许有吧
wbrobot
6 天前
@signin 公开数据你也不能拿,比如公安的治安处罚信息,是拒绝转载的,阅读过网站说明吗?
不是你能看到的数据就可以随便抓的,最简单的判断标准,.gov.cn 的,略过。
dingyaguang117
6 天前
生在中国 龙非盘着 虎非缩着, 何况你是个程序员 P 民
yvkino
6 天前
这还用想,不抓别人不代表不抓你
hahasong
6 天前
破坏计算机系统罪 一抓一个准
EndlessMemory
6 天前
爬虫抓进去的不少,关键就在于又没有人找你
abersheeran
6 天前
有价值,那就可以,比如企查查之类的,工信部挂了号的,数据随便他抓。做着玩,别把人打崩了也可以。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1052719

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX