V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
MicrosoftAzure
V2EX  ›  问与答

如何批量抓取 MSDN 订户下载目录?

  •  
  •   MicrosoftAzure · 2015-08-14 21:44:00 +08:00 · 2677 次点击
    这是一个创建于 3191 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近非常关注MSDN订户下载。

    想抓取其信息,做成一个离线版的文档方便查找。

    链接(以Expression 4为例)为

    https://msdn.microsoft.com/zh-cn/subscriptions/downloads/#searchTerm=&ProductFamilyId=415&Languages=en&PageSize=10&PageIndex=0&FileId=0

    目录架构有以下两种:

    产品A to Z

    A to Z(如 E)→一级目录(如 Expression 4)→语言类别(如 Chinese - Simplified)→该语言项下所有文件标题(如 Expression Studio 4 Ultimate (x86) - DVD (Chinese-Simplified) (MSDN AA))→文件详细信息(文件名、SHA1和发布日期等)

    产品类别

    九大产品类别(如 设计人员工具)→一级目录(如 Expression 4)→语言类别(如 Chinese - Simplified)→该语言项下所有文件标题(如 Expression Studio 4 Ultimate (x86) - DVD (Chinese-Simplified) (MSDN AA))→文件详细信息(文件名、SHA1和发布日期等)

    请指导下如何批量抓取,谢谢!

    没什么编程基础,求各位指导!

    或者另外一种思路,如何把这个https://msdn.microsoft.com/zh-cn/subscriptions/downloads/
    下载下来?在脱机环境下随便点击某项,需要的文件标题和详细信息(主要是文件名和SHA1)能一览无余即可。

    再次感谢各位!

    4 条回复    2015-08-14 21:58:29 +08:00
    learnshare
        1
    learnshare  
       2015-08-14 21:46:43 +08:00   ❤️ 1
    msdn i tell u ?
    MicrosoftAzure
        2
    MicrosoftAzure  
    OP
       2015-08-14 21:47:54 +08:00
    @learnshare 谢谢回复。它仅提供了一些盗版文件下载链接,而它的文件目录并不完整。
    xfspace
        3
    xfspace  
       2015-08-14 21:50:20 +08:00 via Android   ❤️ 1
    @MicrosoftAzure 非要官方下载才是正版文件吗?我只是针对“仅提供了一些盗版文件”
    MicrosoftAzure
        4
    MicrosoftAzure  
    OP
       2015-08-14 21:58:29 +08:00
    @xfspace 我没看过微软的许可协议。但我个人认为非法分发所得到的文件均属于盗版文件,只有通过官方许可的途径如购买正版DVD或获授权通过官方网站下载等得到的文件才是正版文件。

    负面例子

    以System Center Endpoint Protection为例,其内置的许可协议仅限制软件的使用。

    协议如下:

    请注意:使用该软件时,需遵守购买该软件时附带的许可协议中的条款和条件。例如:
    如果您是批量许可客户,使用该软件时应遵守批量许可协议。
    如果您是 MSDN 客户,使用该软件时应遵守 MSDN 协议。
    如果您未从微软或其授权分销商购买有效许可证,则不得使用该软件。

    因此,对于这一软件来说,获取途径无关紧要,使用时遵守协议即可。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2663 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 15:49 · PVG 23:49 · LAX 08:49 · JFK 11:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.