之前开发了一个《垃圾短信过滤 App 》- 胖鱼信使
主要是 2 个原因:
1: 市面上没有完全不联网
的垃圾短信过滤 App
2: 想学习一下人工智能分类
上架研发初期,垃圾短信的训练样本都是来自互联网,然后加上自己和家人的几百条数据,
偶尔有用户会给我回馈几条,还能处理。
后来想更提高一把模型准确性,想多搞点样本,有个用户提供了这些个短信数据。
192,184,722,019 字节(磁盘上的 192.36 GB )
纯文本数据,这也太多了。。。。
有什么工具能对其进行批量标注吗?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.