我这个爬虫是否违法?

2022-11-24 22:43:38 +08:00
 xuAN111

各位大佬们,提个问题,我目前开发了一款课表。

用户只需要授权教务系统账号给我,然后课表爬虫会自动去获取课程信息导入。

这个数据爬取过程是否违法?


在知乎找到一个回答,找不到更多了

以下为知乎回答: 课程表信息只是课程的单纯排列,没有独创性,不属于著作权保护的范围。高校又不是盈利性企业,在教学领域也不存在商业秘密。在民商法领域寻找保护课程信息的依据应该是不成立的。

至于出借账号密码只是违反了学校教务系统的管理规定,如造成损失可以诉诸侵权法处理。

6979 次点击
所在节点    程序员
46 条回复
8zip
2022-11-25 08:54:15 +08:00
会有人把自己密码泄露怪给你,不管是不是真的怪你
名校行政级别非常高,抓你分分钟
fbichijing
2022-11-25 09:24:05 +08:00
自用,没问题。因为没人知道,只要控制好爬虫的访问频率,基本没啥问题。

公开使用,不开源。别人需要承担账号密码泄露的风险。看别人愿不愿意去用了。这个账号密码的重要性如果是相当高的话别人的使用意愿就会大大降低。

公开使用,开源。别人下载源码在自己的电脑上跑,别人可能会魔改这个爬虫。使用者账号密码泄露的风险因开源原因而大大降低,但爬虫制作者需承担别人改爬虫的风险。你不知道别人改了爬虫之后会去做什么。

我个人觉得,写这种爬虫,自己用是最保险的了。一小部分懂的人使用问题也不大。公开的话就像走在灰色道上,容易湿鞋。

最理想的情况下是和系统开发者沟通或合作增加功能。不然如果存在着即便被发现也不会有什么关系的立场,就可以去做这个事情。总体感觉如果不存在上面两种情况,做这个事多半吃力不讨好。

至于合不合法。robots 的君子协议一直都在。即便没有这个东西,嗯......
YaakovZiv
2022-11-25 09:58:00 +08:00
自动导入数据,这属于无授权数据获取吧,可以考虑加一个手动导入的按钮,用户点的时候,等于授权了操作,是用户自己用自己的账户进行了数据导入。
我一般是主动找学校要授权许可。或者联系学生找老师要授权许可,一封邮件也算。
SunsetShimmer
2022-11-25 10:05:24 +08:00
xuAN111
2022-11-25 10:29:37 +08:00
@YaakovZiv 用户填写教务账号密码,然后点击教务导入,导入课程信息。
(爬虫访问教务登录 拉去课程信息 导入课表)
(不存储账号)
Joker520
2022-11-25 11:10:02 +08:00
你说没有存储账号密码,就一定没存储了吗?这个说不清楚呀,如果出了问题的话
yedanten
2022-11-25 15:12:22 +08:00
别问 ,问就是违法 ,这里是大清,说你有罪就有罪
dorothyREN
2022-11-25 15:31:10 +08:00
@Joker520 #26 微信还说不存储用户的聊天记录呢
rozbo
2022-11-25 15:46:48 +08:00
楼上几位说的看起来一点儿问题都没有,但实际上纯属纸上谈兵。让用户授权更是皇帝的新装,是判定的是入侵计算机系统,而不是入侵用户,只要系统没有授权你访问,你就是非法的,而用户授权你访问没有用,用户对系统无所属关系因而不持有授权能力。

更别说之前已经有判例了。。。
libook
2022-11-25 16:08:55 +08:00
法庭的存在的意义之一就是大多情况下双方都有“合理”说法,律师可以帮忙把行为使用合理合法的方式描述,当双方都有道理的时候,那么就需要辩论来看如何认定、谁更合理。简单来讲就是越是灰色区域越有扯皮的空间,但最终得以法庭判决为准。

我工作上接触赛博空间三大法律体系比较多,说一下我个人的经验。既然需要登录才能访问的数据,它再简单也不属于公开数据,当然如果学生按照系统要求正常登录把课程表复制下来再公开发布到社交平台上没有问题,问题在于教务系统并未授权除账号所有者以外的人员直接从教务系统中获得数据,限制的不是数据本身,而是数据处理行为。法律规定的数据处理行为分为收集、存储、使用、加工、传输、提供、公开等方面。

如果理想情况下按照正常合法合规的方式来做的话,就是学校要授权第三方课表服务使用学生的账号来获取课表数据,同时学生也授权第三方课表服务使用学生的账号来获取课表数据,这是数据安全合规的典型案例。

当然如果你没有服务器,只是个终端应用程序,那么用户如何使用都只是用户个人行为,你可以以免责声明的方式来降低风险(当然使用非公开接口依然会有破坏计算机系统的罪名风险);但如果数据过你的服务器的话,就涉及到了数据的使用、传输等行为,就需要履行数安法规定的义务以及承担相应责任。也就是说法律风险比较大,法庭上扯皮的话优势较小。
PythonYXY
2022-11-25 16:09:05 +08:00
除非你预先和教务部打好关系,不然想处分你也是分分钟钟的事
abc8678
2022-11-25 16:16:04 +08:00
@dzdh 我一直手动录入课表,然后固定在桌面小部件上。登录之后,自己的号就不一定安全了
ufo5260987423
2022-11-25 16:21:13 +08:00
你肯定是违法的,关键看是否愿意执法。
xxxbin
2022-11-25 16:23:39 +08:00
有个疑问? 反过来,爬虫在客户端,用户自己触发自己提交怎么算?
huangjinjiang20
2022-11-25 16:28:04 +08:00
我 8 年前的毕业设计就是做这个
qianxaingmoli
2022-11-25 16:31:15 +08:00
参考 wakeup 课表,程序不参与账号登录,由用户手动登录教务并手动导入 https://www.wakeup.fun/
baobao1270
2022-11-25 16:33:15 +08:00
只要不被发现就不算违法,只要抓不到你就不算违法
至于怎么才能不被发现,怎么才能抓不到你,那就各显神通呗
baobao1270
2022-11-25 16:34:25 +08:00
@mikewang 你才是不了解密码法的,也不了解密码学
密码法管的不是 password ,密码学也不研究“登陆密码”,而是“如何加密”
kingjpa
2022-11-25 16:39:34 +08:00
按照我大清律例, 你是否犯法,取决于你现在是什么角色,以及你之后是什么角色,站在哪一边。
mikewang
2022-11-25 22:26:51 +08:00
感谢指出我的问题 @baobao1270

password 本身不在《密码法》的管辖范围内,但是 password 在系统中是以加密的形式存在的( AES/SM 国密等),属于被加密保护的信息(其他信息在数据库中都有可能明文储存,但是唯独密码基本都是以密文形式出现的);
另外 password 也可能是加密算法密钥的构成部分,很难说和“密码学”没有关系。
当然这是我个人的看法,如有不妥之处还请指正:)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/897720

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX