V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Fffys  ›  全部回复第 2 页 / 共 2 页
回复总数  38
1  2  
@wbrobot 你这有点不太厚道。。。而且我这是无薪的课程实习。。。
跟进,我进一步询问后同意只抓取有 API 或者写了 free use 的网站,并且告诉我不会有商业用途,但是其中有的 API 网站写明了如果要用于商业用途需要联系网站管理员,我要怎么确定的确不会有商业用途呢?只爬取这两种是否就是安全的了?
@whyrookie 加了也没用,目前只在 API 28 的手机上测试的,而且 Activity Recognition Transition API Codelab 这里面的 Java 版的例子也是两种都加了,也没能识别到活动
因为没有认识的相关律师,打算在 quora reddit 上也发帖问问,那些在个人 bio 里写了是律师的人的回复可以全信吗?主要是我对欧美这边相关法律也不了解……
@NoOneNoBody 前者……不过也有不少是 free use 的网站,有的是明确写出是公共领域的数据,有的网站也没有 terms of use 就只有免责声明,也没有对爬虫进行限制,现在我是在想,是不是有一种合法爬取的方法?比如只爬公用领域、free use 的数据,或者和网站联系获得合法授权之类的?
后者的话,因为网站有很多,不太方便写成一个统一的方法,很多需要解析 HTML 从标签里获取数据,不过你的意思是,只要我最终交付的代码不包括具体的网站名我就可以法律上完全免责吗?但是我也需要提供示例输出文件啊,然后里面肯定有字段指向爬取的网站……
@hrdom 担心版权问题啊,这个网站本身就面临多个版权纠纷,而且欧美都普遍注重版权的,有的网站在不同资源上有注明不同类型的 CC 协议,爬取时就只需要按照 CC 协议过滤就可以只爬取合法商业化的资源,但是这个网站对版权的处理就比较模糊
@mxT52CRuqR6o5 手工爬是指什么?目前还在确认任务阶段,我还没问是爬数据还是开发服务,不过丢了很多网站过来,应该只是数据吧

另外,其中有个网站是互联网档案馆,这个怎么处理?查了下好像这个网站本身就面临多个版权纠纷案
@131 那这样,我要求提供有法律效力的授权文件,如果提供了就做,没提供就拒绝
补充:
- 笔记本空间不太够目前不能在虚拟安卓机上测试,手头就只有这一个小米 6 ,MIUI 优化开着,没有 root ,以前用过运动记录类的应用(当时也开着 miui 优化),可以检测到运动。
- play services 没问题
2024-08-10 15:52:20 +08:00
回复了 Fffys 创建的主题 程序员 抓包 iPad 的工具 mitmproxy 为什么昨天可以用今天就不行了?
@wow0o 不是的,这只是错误示例之一,返回桌面的时候代理没关,这应该是后台的进程,想抓的是星野和猫箱,但是两个都没抓到,具体看上面附言
2024-06-26 10:31:18 +08:00
回复了 Fffys 创建的主题 问与答 适合屯屯鼠的存储方式有哪些?
@129duckflew 但是这只是目前 3T ,之后可能还会有更多……一直买移动介质搬家也不太方便……而且万一丢了就没有了……
2024-06-26 10:24:59 +08:00
回复了 Gotchaaa 创建的主题 问与答 喷墨打印头长期不用就堵是不是无解
爱普生好一点,三个多月没打印,短线,深度清洗几次,等了三天,就正常了
2024-05-04 00:42:16 +08:00
回复了 Fffys 创建的主题 git 备份到 github,直接输入可以但 cron 没成功
@aloxaf 原来有同步插件啊!谢谢!我去瞅瞅! obsidian 的文件夹的用户是 macbook ,设置 crontab 的任务时也是为这个用户设置的:`sudo crontab -e -u macbook` 但是还是会有上面的错误!为什么呢……?没有其它用户了,终端用的是默认的 zsh ,你说的切换到当前用户是指?
图里的路径和 `config_machine.json` 里的路径都是正确的,找了同学要来了他的版本,能正常运行,但似乎我还是不懂为什么同学的配置可以图里的就不可以?
```json
{
"configurations": [
{
"name": "RISC-V: Debug on URIscV",
"type": "cppdbg",
"request": "launch",
"program": "${workspaceRoot}/project/uriscv/kernel",
"MIMode": "gdb",
"miDebuggerPath": "/opt/riscv/bin/riscv32-unknown-linux-gnu-gdb",
"miDebuggerServerAddress": "localhost:8080",
"stopAtEntry": false,
"stopAtConnect": true,
"cwd": "."
}
]
}
```
这样算抄袭吗?一般意义上的?规定里只说了复制粘贴不行……因为完全没思路时间又不多这次的作业只能这样了,提交上去会被查出来吗?会有很高的查重率什么的吗?
2024-01-31 09:07:56 +08:00
回复了 Fffys 创建的主题 Node.js 为什么用 npm install 不管什么都返回 -122?
@Fffys 对了,再次使用 npm 安装的时候用了 --verbose 以获得更详细的出错信息,正是通过这个更详细的出错信息才最终找到问题的
最后,依然不知道问题在哪里,但是换了个网络环境就没有问题了,看来还是网络原因……后来我们做了网速测试,发现我平常的网络环境 gitter 很大但是同学的就很小
2024-01-31 09:03:21 +08:00
回复了 Fffys 创建的主题 Node.js 为什么用 npm install 不管什么都返回 -122?
问题解决了,原因有 2:
1. 就像 dfkjgklfdjg 说的那样,目录太长;
2. 我以为空间还有很多,但其实空间用超了,清除缓存的命令没有起效,光缓存就占用了配额的 90%(离谱!)
手动清空了缓存文件夹并修改了目录之后就成功安装了
1  2  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4567 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 05:35 · PVG 13:35 · LAX 22:35 · JFK 01:35
♥ Do have faith in what you're doing.