xmoiduts 最近的时间轴更新
xmoiduts

xmoiduts

V2EX 第 140272 号会员,加入于 2015-09-27 20:33:57 +08:00
Surface Dock DIY, 小改又轻又薄的桌面拓展坞
分享创造  •  xmoiduts  •  2019-07-19 17:33:46 PM  •  最后回复来自 weixiangzhe
10
大雪纷飞的季节,有哪些手机不会轻易关机?
问与答  •  xmoiduts  •  2017-12-10 23:19:34 PM  •  最后回复来自 vcinex
9
从记事时开始的半身痒痒,有 v 友知道原因么?
健康  •  xmoiduts  •  2016-09-26 10:31:03 AM  •  最后回复来自 zkd8907
23
不知道大家遇到过这种刷点击的劫持不?
宽带症候群  •  xmoiduts  •  2016-08-15 15:33:34 PM  •  最后回复来自 xmoiduts
2
用 Arduino 自制应急感应灯,给黑夜带来一点光明。
分享创造  •  xmoiduts  •  2018-01-06 15:57:23 PM  •  最后回复来自 loktar0ga
21
这种流量劫持是否应该向工信部举报?
宽带症候群  •  xmoiduts  •  2016-04-28 16:08:34 PM  •  最后回复来自 mazhen8u8
18
课程设计大作业,我该从哪里入手?
问与答  •  xmoiduts  •  2015-12-24 16:24:09 PM  •  最后回复来自 Pastsong
9
xmoiduts 最近回复了
我假设用的是燃热了,电热没那么高要求;
燃气具 8 年强制报废,优先和房东商量一下能否你出一部分钱换一个好点的燃热。
我租住地点房东配的是一台万和燃热,我全年设置 39 度,拧到纯热水洗浴,水温还行,只会凉不会烫。
缺点是最低功率下不去,盛夏自来水热的时期,最低温度压不住,要打开厨房水龙头放热水,分流热功率,才能让洗澡水没那么烫。
@GobyHsu 识别出错误的语气词,是不是因为那段时间没有语音,只有静音或 BGM 。whisper 在这种情况下会有幻觉。
@340746 gemini 2.0 flash 试试

10:直播听写粗分句
作用:对直播文稿粗略分行
建议模型:gemini 2 flash ( ai studio )理由:8k 输出( ctx 2000 行左右上下文行号开始异常); 不推荐 2.5 pro thinking ,想得太多反而无法完成工作爆 COT

```
你是一个文字处理 ai ,

将以下听写文稿按照以下标准来断行,不要修改也不要校对文稿内容。
在每行之前加入行(L for Line)号,例如 `{L1} 正文正文正文` ,请忠实断行并正常分配行号,只输出非空的行。
原文中的换行仅用于限制原文单行长度,请勿视为带有语义

模拟 YouTube 字幕的显示效果,遵循以下规则:
- 每行字符数不超过约{拉丁字母:80 ,中日类:35}个字符。
- 优先在自然停处进行断句,例如句号、逗号、语气词等。
- 尽量保持语义完整性,避免在词组中间断句。
- 短句可以单独成行。
- 长句可以跨多行,但要在合适的位置断开。
- 保持视觉上的整洁,避免过长或过短的行。
- 考虑朗读时的自然停顿和节奏。

输出到 multiline text block 中
```
{前五行断行结果}

--process-full-text? -Y
--line-number-start = L467 # (这个是给 claude 的监工代码,实际没什么用,删了也行)

{大段未断行正文}
42 天前
回复了 nizhong044 创建的主题 YouTube 为什么老高与小茉的视频这么催眠?
听听戒社,linvo 说宇宙,茂的模,yan talk ,都很好睡。
这不巧了,同样在做两个 side-project ,一个是云 GPU 人声分离 https://github.com/xmoiduts/vocal-extract-transcribe-bot , 一个是 whisper 音频提取字幕 https://github.com/xmoiduts/OpenAI-API-transcriber 。题主您比我走得远,我还没走到发现时间轴不准的阶段,因为我不打轴,全文投成专栏。

我的方案选型有少量不同:

之前尝试从 UVR 代码里扒一个专用于提取干声的东西,失败,UVR 的陈年代码耦合太紧了。
后来我转用了 MSST https://github.com/ZFTurbo/Music-Source-Separation-Training ,同样的模型,推理命令行超级直观。

切段由于受 whisper api 单文件 25MB 的限制,我做了按 码率 和 时长 双要素判定每片长度的逻辑。相邻两片之间重合 9 秒(随便定的),合并逻辑还没做,目前实际是我手工合并。
我完全不准备用 whisper 自动断的句,只用单词模式[timestamp_granularity: word],后续接入一个大模型断句。
- 不建议用 gemini 思考模型断句,会爆 COT ,但 gemini flash 系列不错。
翻译推荐 claude 系列,但是要注意 claude 3.5 系会偷懒,3.7 系会有些幻觉,要在提示词中加以监工,claude 有足够的反思能力。
57 天前
回复了 Takizawa 创建的主题 生活 老婆爱捡(攒)破烂,有啥办法吗?
我(男)也爱攒袋子,小时候攒笔壳笔芯(因为是塑料管),觉得以后可能 diy 会用上,其实并没有。
上班以后由于不做饭,攒外卖袋子当垃圾袋,但进屋的经常多于扔掉的。
为了缓解这个问题,我买了两卷巨贵巨厚实的宜家风格垃圾袋(宜家本身停产了,我买的仿品),这样至少不担心没有袋子用了。
上回退项,包里塞了三个这样的垃圾袋,把零碎物品都打包回了家。

备注:外卖袋子当垃圾袋偏小,如果平常“启动困难”,不愿意下楼,导致每次扔垃圾要扔很多个袋子单手拿不下,可以用编织绳子(编织数据线那类的)把垃圾袋串起来,这样一次可以提 8-10 袋下楼。
73 天前
回复了 ggp1ot2 创建的主题 健康 三阳了,还有人没有阳过吗?
2023 年 9 月首阳(是的,我 22 年末躲过去了),2024 25q1 无“流感样症状”(感冒发烧)。耗资巨额,可计价的大头在于整租相对合租的溢价,小头在于防护设备(口罩,鼻喷,far-uvc 设备等)。
73 天前
回复了 ggp1ot2 创建的主题 健康 三阳了,还有人没有阳过吗?
@sumeoy 要看核酸或抗原检测结果,无论哪种,做了才知道。
73 天前
回复了 ggp1ot2 创建的主题 健康 三阳了,还有人没有阳过吗?
@xiaon 可以使用抗原,如果在大城市还有“美团”“京东”多联核酸快检。
很多医院也可以单测新冠核酸,但医院的多联呼吸道检测很可能故意漏掉新冠这一项,因为不测就没有,没有就不用走上报流程,不走流程就省工时。
73 天前
回复了 ggp1ot2 创建的主题 健康 三阳了,还有人没有阳过吗?
@Goooooos 23 24 年 侧面观察海(关)外的新闻图片,香港地区和泰国的群众口罩仍然没有摘掉,还处于一种很高的佩戴率。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2563 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 06:19 · PVG 14:19 · LAX 23:19 · JFK 02:19
Developed with CodeLauncher
♥ Do have faith in what you're doing.