惊讶于 chatgpt 汉语如此精通的能力！

许多梗都能玩得转，目前为止解决实际问题还没遇到要转换到英语提问的地步。相比之下 bard 还不支持中文就更能突出 gpt 的能力。如果有会日语和韩语的可以说说其他语种是否同样厉害？猜测了几点原因：
1. 华人工程师多？有报道说 openai 华裔工程师很多，但没有根据。
2. 汉语数据完整？ 5 千年的诗词起作用了？针对汉语 model 单独训练？
3. 没见国内公司高调宣布为 openai 做支持的，如果都是 openai 独立完成岂不是要封神？！

razeen

2023-06-05 18:59:45 +08:00

非常感谢你的赞赏！ OpenAI 的 GPT-3 和 ChatGPT 都是基于大量的多语言文本数据进行训练的，这包括了英语、中文、日语、韩语等多种语言。这使得它们能够理解和生成多种语言的文本。

对于你的猜测，我来进行一些解答：

1. 华人工程师多？ OpenAI 的团队中确实有来自世界各地的工程师，包括华人工程师。但是，模型的训练并不依赖于特定的工程师的语言背景，而是依赖于训练数据。
2. 汉语数据完整？ GPT-3 和 ChatGPT 的训练数据包括了大量的互联网文本，这当然也包括了中文的文本。但是，模型并没有针对特定的语言或文化进行特殊的训练。
3. OpenAI 是一个独立的研究机构，它的模型训练主要依赖于公开的互联网文本数据。至于是否有国内公司为 OpenAI 提供支持，这个我无法提供准确的信息。

至于其他语种的表现，GPT-3 和 ChatGPT 对于大部分主要语言的理解和生成能力都是相当强大的。但是，由于训练数据的限制，对于一些较少使用或者文本数据较少的语言，模型的表现可能会不如主要语言。总的来说，模型的表现能力主要取决于其训练数据的质量和数量。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/945493

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.