V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
liudaolunhuibl
V2EX  ›  分享创造

接着微信聊天记录词云之后又做了微信聊天记录年度统计

  •  
  •   liudaolunhuibl · 2022-01-04 09:43:19 +08:00 · 3219 次点击
    这是一个创建于 1055 天前的主题,其中的信息可能已经有所发展或是发生改变。

    接上文 的 https://www.v2ex.com/t/825496#reply7 元旦节又添加了微信聊天记录的年度统计: https://github.com/liudaolunboluo/WxChatRecordTool/tree/main/annual_records

    预览时这样的: 今年,你和米粒儿一共有 321 天有过交流,你们一共互相发了 15306 条信息,你发给米粒儿发了 8306 条消息,米粒儿给你发了 7000 条消息。在 2021-02-07 这一天你们一共发了 325 条消息,在 2021-02-18 这一天你们在深夜 01:50:33 还在聊天

    然后另外还可以生成本年度的词云

    原理很简单,就是对导出的聊天记录的 json 做统计,几十行 python 代码而已,我也只是抛砖引玉

    之前有人提到了导出工具的安全性这个没法保证,这个导出工具是我能找到的最方便的了,导出工具的原文是 https://zhuanlan.zhihu.com/p/32511173 在这里,知乎上的一位大佬做的,所以如果有人聊天记录里有敏感信息的可以谨慎使用这个导出工具。关于微信聊天记录其他导出方式我也试过了,比如说 mac 上的反向工程去获取微信本机数据库 sqlLite 上的密码好像现在已经用不了了。

    6 条回复    2022-01-04 17:50:07 +08:00
    WeitingChen
        1
    WeitingChen  
       2022-01-04 13:09:25 +08:00
    聊天信息安全确实是个问题
    binaryify
        2
    binaryify  
       2022-01-04 14:23:11 +08:00
    没啥用,微信聊天记录各种不同步,统计会不太准确
    sandman511
        3
    sandman511  
       2022-01-04 14:48:46 +08:00
    挺好的 我的聊天记录很同步 应该会很准
    关于安全方面,有聊天记录敏感信息的别用就是了
    tediorelee
        4
    tediorelee  
       2022-01-04 17:02:17 +08:00
    执行 python WxAnnualRecords.py /Users/xli1/Desktop/message.json /Users/xli1/Desktop 报错

    File "WxAnnualRecords.py", line 14
    SyntaxError: Non-ASCII character '\xe6' in file WxAnnualRecords.py on line 14, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
    tediorelee
        5
    tediorelee  
       2022-01-04 17:14:25 +08:00
    @tediorelee 文件头加上编码格式解决了,但是运行还是报错,提示:

    Traceback (most recent call last):
    File "WxAnnualRecords. py", line 4, in <module>
    import jieba
    ImportError: No module named jieba

    但是按照版本手动安装 pip3 install jieba==0.42.1 ,提示已经安装了

    Defaulting to user installation because normal site-packages is not writeable
    Requirement already satisfied: jieba==0.42.1 in /Users/xli1/Library/Python/3.8/lib/python/site-packages (0.42.1)
    tediorelee
        6
    tediorelee  
       2022-01-04 17:50:07 +08:00 via iPhone
    @tediorelee 没事了要用 python3
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2810 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 07:32 · PVG 15:32 · LAX 23:32 · JFK 02:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.