V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  ludyleocn  ›  全部回复第 2 页 / 共 8 页
回复总数  145
1  2  3  4  5  6  7  8  
你弄几个人了,我看咸鱼上 500 ,问他他说没人。有些人是冲着白嫖车费的,实际上一万块理财也放不进去。
5 月 31 日
回复了 ttao98 创建的主题 程序员 Claude Code 团队计划,非中转站
@ellison13tj 我目前接触的一个大老是公司有海外业务部,合法合规并且公司账号注册、企业银行卡支付+发票。他海外用了日本服务器架设了 Claude relay service 给国内业务部的同事用,两个 max X20 帐号每天蹬满都不封号。
5 月 30 日
回复了 huluwa561 创建的主题 程序员 大佬们 vibe coding 的项目怎么样了
@sharpy 谢谢你,我马上弄了一个,我很多产品的产品流程预览。。。
5 月 30 日
回复了 huluwa561 创建的主题 程序员 大佬们 vibe coding 的项目怎么样了
你这个有源头大佬吗,我每天都有量要自己上自己做,给公司人用的。
我自己甚至去找了号池、上游,因为自己还有办公室要带,一个月光搞号池适配都花了 2000 多去买 plus 帐号、Claude 号。还没算自己桌面跑着的 antigravity 、openai 、Claude
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho

算了,看你憋了半天只能复读“屁股歪了”实在太可怜了。实话实说,我其实是个精神病患者,今天正好发病,所以手把手教教你该怎么反驳我,不然你连怎么嘴硬都不知道。

如果你有脑子,你应该这么回我:

关于开源授权:Qwen 虽然开源,但其 AUP ( Acceptable Use Policy ,可接受使用政策) 里明确禁止“将本模型的 Outputs 用于开发和训练其他竞争模型”。A 家喂了千问的语料,在法理上同样违背了开源授权。

关于语料清洗:A 家在公关文里自诩安全合规,但其 Data Pipeline (数据管道) 居然能把带千问身份信息的“脏数据”混进 Pre-training Corpus (预训练语料) 里,这要么说明他们的数据过滤极其无能,要么说明他们自己也天天在主动抓取简中合成数据做 SFT (监督微调),只是这次没洗干净翻车了。

关于回旋镖:是 A 家自己先在面向公众的公关文里,发明了 Distillation Attacks (蒸馏攻击) 这种非学术黑话来给竞争对手定罪、游说国会。既然它自己都不要学术脸面用这词,大众用它自己定义的“蒸馏”去回旋镖嘲讽它,合情合理。你抱起学术字典来扯 Hinton 经典定义和 Imitation Learning (模仿学习),就是典型的拉偏架。

剧本我都用最专业的词汇替你写好了,你可以直接复制过去接着跟我对线。别说我没疼过你,退下吧。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho

Qwen 是完全开源的模型! 全球任何人写几行 Python 直接就能从 Hugging Face 免费下载。你觉得 A 家需要像那三个厂一样,注册 24000 个欺诈账号、违规翻墙去“偷”千问?连开源和闭源的区别都没搞懂,就在这脑补 A 家也在违规,这智商真的别出来搞笑了。

三个厂当小偷被 A 家指名道姓、连 IP 带高管名字抓了个现行( 1600 万次白嫖,24000 个欺诈号)。你作为小偷的“孝子贤孙”,不仅不觉得自家丢人,反而在这撒泼打滚大喊“被害人肯定也偷了我们”。这种贼喊捉贼的无赖戏码,你演得不累吗?

说不过了就甩下一句“屁股歪了/懒得回复”准备土遁,典型的心虚嘴硬。既然脑子和常识都跟不上,以后这种技术帖建议你直接闭嘴绕行,省得出来丢人现眼。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho 你自己贴的链接,你自己看完了吗?

这篇文章第一段白纸黑字写着: “These labs generated... through approximately 24,000 fraudulent accounts, in violation of our terms of service and regional access restrictions.”

A 家自己定性的违规原因清清楚楚:1. 注册欺诈账户; 2. 绕过区域限制; 3. 违反服务条款( ToS )。

甚至文章第二段开头就说了:“Distillation is a widely used and legitimate training method.”(蒸馏是一种被广泛使用且合法的训练方法)。

懂了吗?蒸馏技术本身是合法的,A 家指控的是他们“用欺诈号绕过区域限制、违反 ToS 去白嫖数据”的行为。

A 家公关为了把“违反 ToS 白嫖语料”这件事包装得像网络安全事件,才在标题里发明了“蒸馏攻击”这个公关词汇。结果你们这群人拿着人家大厂为了维护商业利益造出来的公关软文当学术圣经,跟风嘲讽“Claude 被蒸馏了”,连“白嫖语料违反 ToS”和“学术蒸馏”的区别都分不清,多读点书,真的。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho A 家公关通告我漏看了,这我认。但这跟洗地和回旋镖毫无关系,我是在划清基本的技术边界。当初国模出身份幻觉,一群外行高喊“铁证如山、抄袭套壳”时,我就觉得极度弱智;今天 Claude 出幻觉,你们又拿着同一套“蒸馏”黑话来起哄,同样弱智。这在工程上根本就不是什么“蒸馏”,纯粹是数据清洗不力导致的简中语料污染——吃垃圾食物没洗干净导致拉肚子,你们非要起哄说成是“偷偷拜垃圾为师”。脑子不好使就多去读读真正严肃的学术论文,别把大厂为了游说国会写的商业公关稿当学术圣经。跟风起哄还自以为抓到了回旋镖,真的很丢人。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho A 自家的学术论文对 SFT 和 KD 分得极清。它控诉别人用它数据,名义是“违反服务条款( ToS )”,是自媒体和营销号强行把这概括成了“蒸馏”。哪怕只谈使用 API 语料训练,UC 伯克利 23 年那篇著名的论文 The False Promise of Imitating Proprietary LLMs https://arxiv.org/abs/2305.15717 也写得很清楚,这种纯文本微调叫模仿学习( Imitation Learning ),模型只学会了风格,根本没学会推理能力。这跟真正的**知识蒸馏( KD )**有着本质区别。你想嘲讽 A/数据清洗不力导致语料污染,这完全没问题,我也支持你喷它。但喷也要精准。它数据清洗不干净混进了千问的语料,你可以喷它“垃圾数据不筛就喂,研发团队吃干饭”。非要跟着营销号喊“claude 在蒸馏千问”,不仅没喷对地方,还暴露了自己分不清基本概念,这不叫回旋镖,这叫杀敌八百,自损一千。不过这也算是种挺可悲的社会常态了:绝大多数人根本不在乎什么是事实和真理,他们需要的只是一个能用来宣泄情绪、抱团起哄的靶子。只要能嗨起来,哪怕拿着最降智的营销号黑话当圣经,他们也能抱团自嗨得心安理得。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@camus 第一,API 其实是可以返回概率分布的(比如通过 logprobs 参数),通过 API 做真正的概率对齐蒸馏(也就是 Hinton 在 15 年奠基论文 Distilling the Knowledge in a Neural Network https://arxiv.org/abs/1503.02531 里定义的 KD )在技术上完全可行。

第二,Anthropic 官方每次维权,指控的都是“Violation of Terms of Service (违反服务条款,即禁止用输出数据训练竞争模型)”,它自家的学术论文里概念也分得很清。

纯粹是外行自媒体为了博眼球,统一给翻译成了“蒸馏攻击”。外行跟着乱喊就算了,V2EX 好歹是个技术论坛,把自媒体的错误翻译当真理来论证,真的没必要。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@lscho 照你这逻辑,天底下就没有‘抄袭’和‘模仿’这两个词了,全是‘蒸馏’。鲁班做了一把椅子,你照着椅子的外观也做了一把,这叫‘鲁班蒸馏’?五星级大厨做了一盘菜,你买回家尝了尝,自己模仿着也炒了一盘,这叫‘厨师蒸馏’?真正的知识蒸馏,是厨师把配方比例、火候温度、调料克数( Logits/暗知识)原封不动地传授给你。你现在只是买了一盘人家的成品菜(语料文本),回家自己瞎琢磨着模仿,这也配叫蒸馏?这顶多叫‘低配模仿’。别拿文学修辞来碰瓷工科学术概念了,多丢人啊。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@MIUIOS 笑死了,你上 Hugging Face 是不是只配下载 alpaca_data.json 这种 52k 的微调包?
去看看大模型基座训练用的 FineWeb 、RedPajama 、The Pile 。几万亿 Token 全是人类几十年的互联网网页、代码、维基百科和图书,请问这是哪个模型‘蒸馏’出来的?
就算退一步,只看指令数据集,Dolly-15k 是 Databricks 员工手写的,OpenAssistant 是全球志愿者手工众包的,MATH 是人类出题的。你管这叫蒸馏?
退一万步,哪怕是用 GPT-4 生成的文本,在学术上也叫‘合成数据( Synthetic Data )’。知识蒸馏( KD )在机器学习里有严格的数学定义,是要对齐 Logits (暗知识/概率分布) 算 KL 散度的。你连人家的 Logits 都拿不到,就敢管‘拿生成文本跑 SFT’叫蒸馏?
连合成数据( Synthetic Data )和知识蒸馏( KD )两个词的定义都分不清,只下了两个玩具微调包,就以为自己窥见了 LLM 的全貌,确实挺 TM 幽默的。
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
@MIUIOS 你开中转站没遇到单个 key 日蹬百亿吗?其实我想发图的,我自己产品在调用 deep seek 和 gemini 也遇到过这样情况
5 月 30 日
回复了 cxd8190102 创建的主题 Claude Claude Opus 4.8 来了,但它说它是 qwen
用裸 curl 问出 Claude 自称 Qwen 就大惊小怪,纯属缺乏大模型常识的少见多怪。首先,API 默认是‘无身份预设’的裸模型,不像网页端会自动注入系统提示词,它在被问及身份时完全是根据词频概率进行预测。其次,这是所有大模型普遍存在的‘身份幻觉’现象——不管是 GPT-4 、Claude 还是 Llama ,在训练时都大量使用了包含其他模型语料的混合合成数据集,一旦数据清洗不彻底,在没有系统提示词锚定身份的情况下,任何大模型随时都会‘认错祖宗’自称是别的模型。不信就在你的 curl 请求里加上官方标准的 "system": "You are Claude..." 参数再测一次,少把整个行业普遍存在的语料污染和概率幻觉,当成你‘揭露真相’的依据。
5 月 28 日
回复了 VoiceEXONE 创建的主题 移民 老婆最近频繁让我准备润去新加坡
我跟你相反,反而我老婆那种死读书上来的就是没那个意识。
你怎么解决中转站的域名被证书弄成危险,然后域名商停止解析
5 月 19 日
回复了 vfx666 创建的主题 iPhone 百亿补贴怕买到换屏机怎么破
换屏应该有的,第一第二批直播帮人挑屏幕处理下来的 lg 屏幕大概率也是还在流通
1  2  3  4  5  6  7  8  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2822 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 12:49 · PVG 20:49 · LAX 05:49 · JFK 08:49
♥ Do have faith in what you're doing.