DeanThompson

[分享] xhs-trail:一个本地优先的小红书创作者数据看板

  •  
  •   DeanThompson · 12h 18m ago · 218 views

    最近把一个自己用的小工具整理了一下,开源出来了:

    https://github.com/DeanThompson/xhs-trail

    它叫 xhs-trail ,主要用来分析小红书创作者后台导出的「笔记列表明细表.xlsx 」。

    背景很简单:小红书后台可以看到每条笔记当前的数据,但如果想看「这条笔记最近 7 天涨了多少」「哪些旧笔记还在长尾增长」「图文和视频到底哪个更适合这个账号」,后台就不太方便。

    我自己在做一个很小的小红书账号,3000 多粉,内容偏医学英语、医学词根、临床沟通。账号不大,但复盘需求反而很具体:

    • 一条笔记是不是发完就结束了
    • 有没有旧笔记还在被推荐
    • 某个系列是不是稳定有收藏
    • 视频带来的观看多,还是图文带来的收藏多
    • 哪些内容值得继续写

    这些问题只看后台当前总数很难回答。把每天的数据存下来以后,就能看增量和轨迹。

    所以我做了一个本地工具:每天导一份 Excel ,工具把它存成 snapshot ,然后按时间窗口计算增量。

    目前主要功能:

    • 导入小红书后台 Excel
    • 按快照追踪每篇笔记的曝光、观看、点赞、收藏、评论、涨粉
    • 看最近上升最快的笔记
    • 看发布超过 14 天但仍在增长的长尾笔记
    • 看收藏率高但曝光不足的笔记
    • 按系列分析表现
    • 对比视频 / 图文的总量、篇均和比率指标
    • 本地维护系列规则和关键词
    • CSV 导出
    • CLI 查询,方便给 Agent 或脚本使用

    技术栈比较普通:

    • 后端:FastAPI + SQLite
    • 前端:React + Vite
    • 数据处理:Python / pandas / SQLAlchemy
    • 部署:本地运行或 Docker Compose

    几个明确的边界:

    • 不做爬虫 / 不做登录代理 / 不接第三方爬虫 API
    • 只处理用户自己从小红书后台导出的 Excel
    • 数据默认保存在本地 SQLite

    这样既避免了反爬和合规问题,也保证创作者数据不需要离开本地。后面如果有人需要 hosted 版本,可能会考虑做,但本地开源版会一直保留并免费。

    截图在 README 里,示例数据也带了一份脱敏样例。感兴趣可以试试,也欢迎提 issue 。

    GitHub:

    https://github.com/DeanThompson/xhs-trail

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1065 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 18:19 · PVG 02:19 · LAX 11:19 · JFK 14:19
    ♥ Do have faith in what you're doing.