V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  andforce  ›  全部回复第 9 页 / 共 26 页
回复总数  505
1 ... 5  6  7  8  9  10  11  12  13  14 ... 26  
2024-09-26 07:25:30 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@512357301 这个太好了,我现在正在我的 Mac 上一条一条往 MySQL 里导入。
我都不确定 MySql 能不能处理 7 亿条数据😵‍💫

数据清理还真的依赖一个牛逼的数据库才行
2024-09-26 07:08:14 +08:00
回复了 xiaohj 创建的主题 职场话题 要不要调过去新的部门,纠结中
看你的描述,新部门那些事儿,半年就会磨灭你所谓的技术成长热情。
不是越忙技术成长就越快,积累就越多。

新部门类似中台,地位尴尬出力不讨好。

回头写绩效可能会多罗列几条,但也不会有大的出彩的东西给到你。

当前部门领导器重就不要犯傻,老老实实呆着吧
2024-09-25 18:41:57 +08:00
回复了 xiaolaji8888 创建的主题 程序员 写个 base64 编码解密小脚本方便大家使用
可以,但没必要🌚
2024-09-25 17:28:18 +08:00
回复了 LHRUN 创建的主题 分享创造 分享一下我刚做的个人站 /about
@LHRUN #79 你就等着我 fork 然后吃灰去吧 https://i.imgur.com/io2SM1h.png
2024-09-25 16:52:38 +08:00
回复了 Yancey 创建的主题 Android oppo 手机开发安卓, logcat 日志不打印
别浪费时间,OV 家的手机适配是个大坑,
先用别家手机开发,先搞出功能来,后面 OV 适配你还得喝一壶
2024-09-25 14:23:38 +08:00
回复了 shebaoting 创建的主题 V2EX v2ex 最初是怎么发展起来的?
@wjfz #18 https://i.imgur.com/VUWFktU.png 还真是给屏蔽了

Mac 上 Clash 常年开着

还有 ADGuardhttps://i.imgur.com/bkw3VRr.png
2024-09-25 12:15:22 +08:00
回复了 shebaoting 创建的主题 V2EX v2ex 最初是怎么发展起来的?
我更好奇的是,v 站好像没有广告?主要靠什么盈利
2024-09-25 11:31:49 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@lisongeee #32 https://i.imgur.com/xr1UOz1.png 从这个角度看,在 iOS 系统中,只安装这个开发者的“1 个 App”即可。

Keychain 和 iOS AppGroup 互相通信,依赖同一个开发者的签名。
2024-09-25 10:46:56 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@lisongeee #30
哈?
在 iOS 系统下,
不声明且不请求网络权限,不声明文件读写权限,
有且只有读取短信的权限的前提下,
请问如果做到不联网,且把数据通过网络传递出去呢? https://i.imgur.com/VUWFktU.png
2024-09-25 09:33:25 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@TimeStudy #20 4090 我家里就有,但具体怎么跑呢? https://i.imgur.com/krir4IG.png
2024-09-25 09:32:06 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@ibazhx #14 https://open.bigmodel.cn/dev/howuse/batchapi 原来还有这种服务,学习了,不过第一件事确实得先选一下样本
2024-09-25 07:51:52 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@syaoranex #9 感谢,不过“使用文本嵌入模型转换向量”这听起来好像有点过于专业了,不太会实际操作。https://i.imgur.com/VUWFktU.png
2024-09-25 07:49:13 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@noqwerty #7 我的 app 的做法是:点击反馈跳转到网页,在网页里让用户主动粘贴。

其实 App 有了联网权限,就有了把短信自动上传的可能性,当然如果你 100%信任作者或者不关心“可能短信会被收集”这件事,就无所谓了
2024-09-25 00:27:32 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@guiyumin 可能我表达不太严谨。我想要的是这个应用完全离线,连网络权限都不申请那种。

熊猫我记得提交反馈的时候会有网络权限申请
2024-09-25 00:13:30 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@lozzow 经过 2 楼的数据量估算,数据量太大了。

数据条数都按亿为单位了,突然觉得没有必要全部都参与训练。

感觉可以从中根据关键字主动选取垃圾短信,和正常短信。

感觉训练数据样本再百万级别就已经很能打了
2024-09-25 00:00:28 +08:00
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@raycool 我粗略估算了一下,按照 utf8 编码,汉字大约占用 3 个字节。那么就是约 640 亿个汉字,假设每条短信按 30 个汉字算,大约有 21 亿条。
如果考虑到去重,就算 80%是重复的,那么还得有 4 亿条。。。。

由于大模型思考需要时间,就算 1 秒条,全部标注完也得 10 万小时起步了。。。
@v2doudou #5 完美
2024-09-24 18:02:29 +08:00
回复了 ttgo 创建的主题 iPhone 一个 app 读取照片的时候,他可以获得照片的位置么?
可以,照片位置是照片的标准属性
1 ... 5  6  7  8  9  10  11  12  13  14 ... 26  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2602 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 14:27 · PVG 22:27 · LAX 07:27 · JFK 10:27
Developed with CodeLauncher
♥ Do have faith in what you're doing.