求助啊,百度网盘分享资源的下载链接该如何获取?求助求助

2014-06-02 09:14:23 +08:00
 napretep
我是个新手,因为语言学科研接触Python,半个月前想提高语料库容量,打算下载百度网盘所有的txt文档,可是半个月过去了,一直卡在网盘资源下载链接的抓取上…多方求助无果,在这里谢过各位了呀,能提供一些线索也好啊…我目前想了两条路子,一条是结合本地html源代码和headers的通信信息分析下载地址的一些规律,另一条比较麻烦我也没怎么做过就是使用js解释器运行js代码获得链接地址,好像很复杂,本人刚学python一个月,啥都不会,求各位大神帮忙啦(ToT)/~~~
11446 次点击
所在节点    问与答
30 条回复
PeterD
2014-06-03 13:51:09 +08:00
@napretep 你的模块继承也是错的
给你个正确的 http://pan.baidu.com/s/1o6ySpiq
napretep
2014-06-03 15:50:06 +08:00
@PeterD
babun的安装是不是这样:先下jvm,再下groovy,然后运行build.groovy?
但是在运行Build.groovy时,遇到这样的错误:

java.io.FileNotFoundException: \groovy\babun.version (系统找不到指定的路径。)

at build.run(build.groovy:5)


还有%USER_HOME%/.babun是什么路径?环境变量吗?
PeterD
2014-06-03 17:24:07 +08:00
@napretep 不需要这样。

babun 安装方法见 https://github.com/babun/babun#installation

"""
Installation

Just download the [dist file](http://projects.reficio.org/babun/babun-dist.zip), unzip it and run the install.bat script. After a few minutes babun starts automatically. The application will be installed to the %USER_HOME%\.babun directory.
"""
-------

1. 下载 http://projects.reficio.org/babun/babun-dist.zip
2. 解压
3. 运行 install.bat

-------
%USER_HOME%是你一打开cmd.exe所显示的路径
napretep
2014-06-04 00:39:22 +08:00
@PeterD
安装完了,肥肠不好意思= =
又来麻烦你了
这次的问题是乱码,我打开babun.bat打算输入help命令查询运行Python程序的方法,但是发现除了左边一侧的命令是英文的,右边一侧的解释全是乱码,根本看不懂,该如何解决呢?
是不是编码不一致的问题?应该在哪里解决?
还有问题就是如何运行你的Python程序?通过什么命令?
napretep
2014-06-06 16:33:55 +08:00
@PeterD
经过不断百度谷歌,已经能够通过这个shell运行Python程序了(其实还有部分关于babun本身的编码问题仍未解决)
但是程序运行仍然报错,list元素溢出:
Traceback (most recent call last):
File "c:\babun-master\pan.baidu.com.py", line 1358, in <module>
main(argv)
File "c:\babun-master\pan.baidu.com.py", line 1235, in main
comd = argv[1]
IndexError: list index out of range
napretep
2014-06-06 18:44:38 +08:00
@PeterD
OK
现在的情况是这样:
{ ~ } » python c:\\babun-master\\pan.baidu.com.py "pan.baidu.com/s/1pJCx44z" ~ 1
['c:\\babun-master\\pan.baidu.com.py', 'pan.baidu.com/s/1pJCx44z']
!! 命令错误

这里参数传递有什么要求?
PeterD
2014-06-06 20:29:17 +08:00
@napretep
babun 是一个基于Cygwin的,让在windows上也可以使用linux shell.
help 是cmd.exe中的命令,用gbk编码,所以在以utf8编码的babun下自然是编码错误。你想知道的不是babun这么用的问题,而是linux shell是什么。 -- 关于linux的基础,推荐你看看 http://www.ppurl.com/2010/09/%E9%B8%9F%E5%93%A5%E7%9A%84linux%E7%A7%81%E6%88%BF%E8%8F%9C-%E5%9F%BA%E7%A1%80%E5%AD%A6%E4%B9%A0%E7%AF%87%E7%AC%AC%E4%B8%89%E7%89%88.html (注册后,可下载)

python的基本知识推荐你看看:
中文: http://www.pythondoc.com/pythontutorial27/
en: https://docs.python.org/2/tutorial/

pan.baidu.com.py 的用法 https://github.com/PeterDing/iScript#pan.baidu.com.py 写得很清楚。
如,你想运行的
下载:
python c:\\babun-master\\pan.baidu.com.py download "pan.baidu.com/s/1pJCx44z"

python c:\\babun-master\\pan.baidu.com.py d "pan.baidu.com/s/1pJCx44z"
转存:
python c:\\babun-master\\pan.baidu.com.py save "pan.baidu.com/s/1pJCx44z" "/存到这
里"

python c:\\babun-master\\pan.baidu.com.py s "pan.baidu.com/s/1pJCx44z" "/存到这
里"

这里 c:\\babun-master\\pan.baidu.com.py 也可以写成 /cygdrive/c/babun-master/pan.baidu.com.py
----------------
注意:
运行前pan.baidu.com.py中的username和password是要手动填入的。
PeterD
2014-06-06 20:31:15 +08:00
napretep
2014-06-11 16:05:16 +08:00
@PeterD
python c:\\down\\pan.baidu.com.py d 'http://pan.baidu.com/share/link?shareid=540994448&uk=943277605'
Traceback (most recent call last):
File "c:\down\pan.baidu.com.py", line 1358, in <module>
main(argv)
File "c:\down\pan.baidu.com.py", line 1268, in main
x.do()
File "c:\down\pan.baidu.com.py", line 1178, in do
self.get_params()
File "c:\down\pan.baidu.com.py", line 1114, in get_params
"bdstoken": p.group(2),
AttributeError: 'NoneType' object has no attribute 'group'


最近在做一个将必应搜索百度网盘结果做成list的小程序和你的程序接合,今天完工,准备接一下你的程序时,发现又有问题,求解决。
PeterD
2014-06-11 21:42:37 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/115355

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX