如何批量抓取 MSDN 订户下载目录?

2015-08-14 21:44:00 +08:00
 MicrosoftAzure

最近非常关注MSDN订户下载。

想抓取其信息,做成一个离线版的文档方便查找。

链接(以Expression 4为例)为

https://msdn.microsoft.com/zh-cn/subscriptions/downloads/#searchTerm=&ProductFamilyId=415&Languages=en&PageSize=10&PageIndex=0&FileId=0

目录架构有以下两种:

产品A to Z

A to Z(如 E)→一级目录(如 Expression 4)→语言类别(如 Chinese - Simplified)→该语言项下所有文件标题(如 Expression Studio 4 Ultimate (x86) - DVD (Chinese-Simplified) (MSDN AA))→文件详细信息(文件名、SHA1和发布日期等)

产品类别

九大产品类别(如 设计人员工具)→一级目录(如 Expression 4)→语言类别(如 Chinese - Simplified)→该语言项下所有文件标题(如 Expression Studio 4 Ultimate (x86) - DVD (Chinese-Simplified) (MSDN AA))→文件详细信息(文件名、SHA1和发布日期等)

请指导下如何批量抓取,谢谢!

没什么编程基础,求各位指导!

或者另外一种思路,如何把这个https://msdn.microsoft.com/zh-cn/subscriptions/downloads/
下载下来?在脱机环境下随便点击某项,需要的文件标题和详细信息(主要是文件名和SHA1)能一览无余即可。

再次感谢各位!

2709 次点击
所在节点    问与答
4 条回复
learnshare
2015-08-14 21:46:43 +08:00
msdn i tell u ?
MicrosoftAzure
2015-08-14 21:47:54 +08:00
@learnshare 谢谢回复。它仅提供了一些盗版文件下载链接,而它的文件目录并不完整。
xfspace
2015-08-14 21:50:20 +08:00
@MicrosoftAzure 非要官方下载才是正版文件吗?我只是针对“仅提供了一些盗版文件”
MicrosoftAzure
2015-08-14 21:58:29 +08:00
@xfspace 我没看过微软的许可协议。但我个人认为非法分发所得到的文件均属于盗版文件,只有通过官方许可的途径如购买正版DVD或获授权通过官方网站下载等得到的文件才是正版文件。

负面例子

以System Center Endpoint Protection为例,其内置的许可协议仅限制软件的使用。

协议如下:

请注意:使用该软件时,需遵守购买该软件时附带的许可协议中的条款和条件。例如:
如果您是批量许可客户,使用该软件时应遵守批量许可协议。
如果您是 MSDN 客户,使用该软件时应遵守 MSDN 协议。
如果您未从微软或其授权分销商购买有效许可证,则不得使用该软件。

因此,对于这一软件来说,获取途径无关紧要,使用时遵守协议即可。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/213288

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX