• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ljcarsenal
V2EX  ›  程序员

微信公众号历史文章获取?

  •  
  •   ljcarsenal · Nov 14, 2014 · 14697 views
    This topic created in 4197 days ago, the information mentioned may be changed or developed.
    知道有个传送门网站,但那个网站似乎不稳定(对爬虫来说,很容易503)。我们决定自己做个爬取微信公众号文章的站。首先要获得某个公众号的具体历史文章列表。这个可以通过微信上查看历史文章获取,然后抓包分析,获取了一定的效果。现在知道 url getmasssendmsg?__biz=MjM5NDM3MDQwMA==&uin=MTM1OTY1NzgyMA%3D%3D&key=1d3004ed55a8e3866db43e981efca321ea995610a3e118f8e873edc416d2e4ced7c42ec56d8ec12591ddbf188f8678f7&devicetype=android-17&version=26000032&lang=zh_CN&pass_ticket=QBqGJE4KnmXPpjLqhheqoycmRWzt0IiDkxKOfkSHk06ZjRoVHEmwS0OM2p7DhJaF
    这样的结构。biz参数是每个号独有的,key似乎也不一样。但找不到规律。。
    不知道传送门是怎么获取那么多文章链接的?
    8 replies    2020-01-08 16:19:41 +08:00
    crab
        1
    crab  
       Nov 14, 2014
    ljcarsenal
        2
    ljcarsenal  
    OP
       Nov 14, 2014
    @crab 经过我对比,搜狗这个好多账号查不到,还没有传送门的全
    deben
        3
    deben  
       Nov 14, 2014
    @crab sogou 干掉了我的 IP 这条路不太好走
    确切说是腾讯干掉的,搜狗的公众号搜索结果,是用 js 从微信那边取来的
    yepinf
        4
    yepinf  
       Apr 23, 2015
    @deben
    “搜狗的公众号搜索结果,是用 js 从微信那边取来的”,应该是有私密的接口吧

    @ljcarsenal
    楼主历史文章获取进展如何?
    yepinf
        6
    yepinf  
       May 14, 2015
    @ljcarsenal

    这个能实现吗?我测试到301跳转那一步,不能返回数据啊
    好囧:D
    qhservice1024
        7
    qhservice1024  
       Aug 14, 2019
    http://www.qianhaikeji.cn,文档导出助手一键搞定
    vow
        8
    vow  
       Jan 8, 2020
    哭, 我也在想这个 key 该怎么算出来
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3077 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 15:10 · PVG 23:10 · LAX 08:10 · JFK 11:10
    ♥ Do have faith in what you're doing.