中文 LLaMA 模型

2023-04-06 15:03:11 +08:00
 davinci21s

在 github 上发现这个项目:


以 ChatGPT 、GPT-4 等为代表的大语言模型( Large Language Model, LLM )掀起了新一轮自然语言处理领域的研究浪潮,展现出了类通用人工智能( AGI )的能力,受到业界广泛关注。然而,由于大语言模型的训练和部署都极为昂贵,为构建透明且开放的学术研究造成了一定的阻碍。 为了促进大模型在中文 NLP 社区的开放研究,本项目开源了中文 LLaMA 模型和经过指令精调的 Alpaca 大模型。这些模型在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。同时,在中文 LLaMA 的基础上,本项目使用了中文指令数据进行指令精调,显著提升了模型对指令的理解和执行能力。


https://github.com/ymcui/Chinese-LLaMA-Alpaca

看着效果好像还不错,有没有试过和 chatgpt3.5 对比效果怎么样。

1831 次点击
所在节点    分享发现
3 条回复
545347837
2023-04-06 23:56:05 +08:00
本地跑过,效果一般,启动速度倒挺快的( m2 mac mini ),和 chatgpt3.5 没得比。。。
gabon
2023-04-07 13:01:45 +08:00
跑过,一般,没得比
davinci21s
2023-04-07 13:27:59 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/930272

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX