我这个爬虫是否违法?

2022-11-24 22:43:38 +08:00
 xuAN111

各位大佬们,提个问题,我目前开发了一款课表。

用户只需要授权教务系统账号给我,然后课表爬虫会自动去获取课程信息导入。

这个数据爬取过程是否违法?


在知乎找到一个回答,找不到更多了

以下为知乎回答: 课程表信息只是课程的单纯排列,没有独创性,不属于著作权保护的范围。高校又不是盈利性企业,在教学领域也不存在商业秘密。在民商法领域寻找保护课程信息的依据应该是不成立的。

至于出借账号密码只是违反了学校教务系统的管理规定,如造成损失可以诉诸侵权法处理。

6935 次点击
所在节点    程序员
46 条回复
realpg
2022-11-25 23:46:05 +08:00
什么爬虫都违法
baobao1270
2022-11-26 01:22:48 +08:00
@mikewang

首先我认同你说的,password 和密码学的确有关系,但是关系并不是直接的而是间接的。
但是对您说的“建议了解《密码法》”,个人认为不准确。
第一,密码法适用的对象是使用加密算法的单位,而题主是信息系统的使用者,并不是加密算法使用的主体。
第二,密码法着重于“将密码等信息加密”,而题主的行为更偏向网络安全法、个人信息保护法规制的范畴。
第三,密码法的主要法益保护对象是“国家安全”,而网络安全法的法益保护对象是企业、个人信息保护法的法益保护对象是个人,很难说题主的行为涉及到了国家安全,因此您的提法并不准确。
最后,“唯独密码”加密是不完善的,根据我国规定公民个人信息等也需要加密存储。
mikewang
2022-11-26 04:05:19 +08:00
@baobao1270 受教,感谢!
xingHI
2022-11-26 11:10:32 +08:00
判断爬虫行为是否违法;从法律专业角度来看,首先要看爬取行为本身是否合法,然后是对于数据的使用是否合法。这个我在之前的回答里面阐述过。

首先课程表信息本身,确实不受到著作权法的保护,但不意味着不属于著作权法范畴就可以合法爬取;全校的课程表是以数据库形式存储在学校服务器,通过教务系统向本校师生开放,属非公有,同时学生用户有权查看。
OP 采用模拟登陆的方式进入系统,且是由用户来输入账号密码导入,虽无免责声明,但属于用户使用行为,只要说明与程序实质一致,用户知情下主动使用,且教务处无声明禁止此方式,则属于合法方式爬取( OP 属于提供技术)。
对于课程表数据,只要后续的课程表的数据处理在用户的掌握之中,并未进行非法行为(课程表几乎不可以吧,只要你不公开数据),就属于合理使用,并且学生用户本身有权使用。

最后给出建议:
1. 可以尝试走正规途径,如果官方认可,兴许能给该程序带了更多变化;
2. 起草符合法律规定的免责声明,且说明程序运作流程,以明示的方式展现给用户,用户确认再给予使用该功能;
3. 程序的安全性进行检测,是否有密码、数据泄漏风险等,软件开发者需要尽到注意义务;
4. 最后其实各大学校这类的软件挺多,只是广告多,使用不便捷,也可看出盈利困难。

来自 法律+计算机 学生的建议
cowcomic
2022-11-26 20:06:53 +08:00
可以从两个维度来衡量

数据公开维度:
首要考虑数据是否是客观意义上的公开数据,还是面对特定人群的。某电商的商品信息就是公开数据(即使是登录才能看也算是公开的,因为并没有对登录后的身份做区别限制,也没有对注册做限制),但商家后台的订单信息就是面对特定人群的。面对特定人群的爬虫行为一定涉及侵权(无论是否商用,哪怕自己只是归档存储也会认定)
公开数据再考虑对方 robots 协议是如何制定的,这部分的约束性稍微较弱,不遵守并不会一定被认定侵权,所以很多大公司的爬虫的确也不遵守,是有隐患的(如果有很明显的商用,那就会惹麻烦,只要不商用,通常会被睁一只眼闭一只眼)

系统影响维度:
这个就简单了,就看爬虫会不会影响目标站点的正常运行,只要有比较大的影响,不管在数据公开维度是否有问题都会被认定侵权。以前采过一个地方网站,采集内容都是公开的信息,但是没控制好并发,把这个网站采挂了,那该负责任负责任,没啥说的
Joker520
2022-12-01 15:27:04 +08:00
@dorothyREN 这你也信嘛!!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/897720

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX