V 友如何看待复旦发布的国内首个类 ChatGPT 模型 MOSS?

2023-02-21 10:57:05 +08:00
 hapsinge
小苔藓
6192 次点击
所在节点    问与答
55 条回复
LaurelHarmon
2023-02-21 12:19:10 +08:00
邱总在 ChatGPT 刚发布的时候还怀疑人家是误打误撞搞出来的(参见知乎回复),而且当时他对于 InstructGPT 等技术细节还不是很熟,根本就没有 follow 到最新最前沿的研究进展,只是了解个大概,属于 NLP 各个领域啥都做的样子,你觉得他手下的人会专注大模型这块的研究吗?然而两个月过去后突然上线 demo ,这谁信啊;
出名后又说什么我们只是学术团队,工程能力欠缺,你代表的可是复旦啊,中国科研的尖尖子,既然敢宣发,就要敢检验,想要名利,就得有两把刷子,欲戴王冠,必承其重。
tanranran
2023-02-21 12:55:51 +08:00
@hapsinge #15 居然是 flutter 写的网页
tanranran
2023-02-21 12:56:50 +08:00
中文互联网的数据质量不行,爬取小红书的最后养成一个只会说家人们绝绝子的人工智能,爬取知乎会出一个谢邀钢鞭怪,爬取豆瓣微博会出一个女拳怪,爬取 V2EX ,会出什么?
hapsinge
2023-02-21 13:03:52 +08:00
@tanranran Chatgpt 也没说自己对中文支持的弱。
cwyalpha
2023-02-21 13:14:35 +08:00
看截图的问答还行
xingye163
2023-02-21 13:22:17 +08:00
恶意的猜测可能代码是套西方成品的,不然不可能中文能力弱,说中文环境的话有甩锅嫌疑,西方环境也是大量政治、种族等言论,而且英语是通用语,跨地区,跨国别、跨种族,可能更复杂才对。
希望是我个人小人之心了。
imrei
2023-02-21 13:34:19 +08:00
人家官方自己说离 ChatGPT 还远,我国做这个要么会巨大成功,要么就是歇菜,没有第三选择
icyalala
2023-02-21 13:37:29 +08:00
@tanranran chatgpt 正常中文能好好回答。让它用小红书 /微博 /知乎风格来写帖子,或者问它这几个平台发言有什么特点,它也能写出来。说明 chatgpt 训练数据是有这些平台抓取内容的。
ytll21
2023-02-21 13:44:40 +08:00
挺聪明的做法,先借这个风口拉投资,占住国内的先发优势。至于产品,都说了因为没钱做不出同样的产品,换言之,有钱就肯定行啦。
callmesmc
2023-02-21 13:47:02 +08:00
高校有这个财力和资源吗?还不如指望百度...
areschen
2023-02-21 13:47:52 +08:00
一蹭蹭俩热度,啧啧
itskingname
2023-02-21 13:52:53 +08:00
吹牛都不会吹。还搞内测。复旦的教职工和校友那么多,要内测为什么不找他们?直接向互联网公布了,还美其名曰内测,真是坟地里面撒花椒,麻鬼呢。
zh584728
2023-02-21 14:11:56 +08:00
@tanranran #22 会说: 体制问题
ershierdu
2023-02-21 14:17:14 +08:00
- 起这个名没啥问题吧,就像它官网提到的,BERT 也是某个角色的名字。作为面向大众的产品,取一个既能表现自身特点、又有广泛群众基础的名字挺好的
- 高校确实没有足够的资源去做到像 ChatGPT 那么成熟,但收集用户真实的交互数据是很有用的。例如,对用户提问方式的认知,可以反过来优化模型本身。我以前做过一点跟搜索相关的科研,一个难题就是没有真实的 query 数据集,隐私、合规性等原因导致能拿到这个数据的商业公司不可能把这些数据开源给你用。这应该也是 ChatGPT 在去年没有明确盈利点的情况下提供免费使用的重要原因之一。
- 对于国内高校提供的工程型平台,我个人觉得鼓励应该多于批评,在当前的环境中还是很难能可贵的
InvincibleDream
2023-02-21 14:32:22 +08:00
BERT 是 Bidirectional Encoder Representations from Transformers 的首字母缩写,MOSS 代表什么意思? Moron-Oriented Search System ?
wateryessence
2023-02-21 14:41:13 +08:00
复旦有中国研究院提供优质语料,非常看好,winwin
hapsinge
2023-02-21 14:54:54 +08:00
@wateryessence 那为什么还说“MOSS 的最大短板是中文水平不够高”呢?
iv2usr
2023-02-21 15:00:00 +08:00
@wateryessence 哈哈哈哈,艹
wateryessence
2023-02-21 15:01:47 +08:00
@hapsinge 邱组可能还没想起来内部的优质资源,相信复旦,相信邱老师
gniviliving
2023-02-21 16:21:20 +08:00
@callmesmc 指望百度多卖点医疗广告?
抱歉,魏则西事件永远不会过去!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/917844

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX