使用 RAG 学习 HarmonyOS

62 天前
lgc653  lgc653

背景介绍

随着微信 HarmonyOS 版本的发布,HarmonyOS 已经构筑了自己的基本版图,未来在信创领域也将大有所为,而目前熟悉 HarmonyOS 的开发者还比较少,网上相关的资料也比较落后,导致搜索引擎和 AI 大模型的检索、对话质量都不高。

那么遇到了疑难问题,我们除了查询 API 文档,是否还有更加便捷一些的办法呢,这里我使用了 RAG 技术,根据网络公开分享的 HarmonyOS 文档以及OpenHarmony代码仓库制作了 HarmonyOS 的资料库。

为了应对向量检索命中率并不优秀的弱点,这里加入了全文索引和一些自定义的 RANK 规则组成混合索引,实际应用中效果还是非常不错。在日常开发和学习 HarmonyOS 时都有不错的效果。

技术方案

现在的 RAG 技术大多基于云平台,部署比较麻烦,运行也比较消耗资源,我这里采用的轻量级的方案:

实际使用过程中,这套方案部署简单(一键本地安装),查询质量也并不比大型 RAG 系统差,当然主要是以下几个原因

产品实现

新建知识库

我这里自己做了一个示例,大家可以下载看看效果。

下载地址: https://pan.baidu.com/s/1bZ4sCG21yZJEz2JqIES7YQ?pwd=aw8w ,下载HarmonyOS 应用开发者基础认证.zip后解压到硬盘任意目录,

左侧主菜单选择知识库知识库设置,新建时目录选择刚才的HarmonyOS 应用开发者基础认证.zip解压目录

image-20250115141337947

验证索引

索引已经建好,执行验证索引操作验证一下,在列表中找到刚才新建的知识库,点击索引按钮。

image-20250115141856194

验证完成后索引按钮前的图标变成✅即可

知识库应用

知识库问答

如果对大模型的回答有疑虑,可以点击左侧图标打开文件进行详细学习和进一步的 AI 问答

图片识别

网络中获取的一些资料不是文本格式,不利于搜索问答,例如

通过图片识别功能(需模型支持多模态功能)来识别题目后进行问答

HTTP 服务器模式

一台机器知识库开启 HTTP 服务器,同局域网中所有设备均可访问,轻松将本地资料库分享给大家

使用 HTTP 服务器时,如您的模型需要借助特定软件上网才能访问,请使用特定软件的Tun 模式

其它设置

以上参数设置为推荐即可,一般不需要改变

比较重要的全文索引匹配规则

  • 精准:适合判断题、单选题
  • 宽松:适合多选题、简答题

扩展知识库

如果下载的知识库不能让你满意,可以自行扩展知识库,知识库支持 pdf 、docx 、doc 、pptx 、ppt 、epub 、md 、markdown 、srt 、txt 、html 等多种文件格式进行索引。

拷贝对应文件到文件夹,点击索引按钮,选择全量索引增量索引即可

索引生成完毕可以将您的文件夹拷贝分享给其它人

相关下载

Local Agents

HarmonyOS 知识库

该知识库为《 HarmonyOS 应用开发者基础认证》构建,内容来源于网络公开分享的 HarmonyOS 文档、题目以及OpenHarmony代码仓库。

下载HarmonyOS 应用开发者基础认证.zip后解压到硬盘任意目录

配置模型

需要配合大模型使用,需要申请大模型 apiKey

1048 次点击
所在节点    分享发现
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1105500

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX