V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ligz  ›  全部回复第 1 页 / 共 5 页
回复总数  93
1  2  3  4  5  
10 天前
回复了 ligz 创建的主题 程序员 《独立开发技术栈 2024》 分享一篇博客
@nealHuang 用的我自己写的一个主题 hugo-ladder ,具体的搭建可以看这篇博客: https://guangzhengli.com/blog/zh/how-to-create-your-blog-for-free-by-hugo-ladder-in-30min/

字体用的是霞鹭文楷~
@rpman 暂时都是用的同一个 chunking ,大概 2000 tokens 一个 chunk 。
@connectsixboy 理论上模型变化很大会造成失效,但是 OpenAI 最近都是更新 gpt 模型,text-embedding 模型更新频率很慢。
@hahastudio embedding 共享的商业化我也感觉有点难,感觉细分领域自己创建独有业务领域的 embedding 数据给别人使用还是很有前景的
@pkoukk #10 LangChain 还是可以的,这个项目所有和 OpenAI / Azure Openai 集成的代码都是用的 LangChain ,想要学习 LangChain 写 AI 应用的小伙伴可以拉代码看看。

如果不想用 Python 写 AI 应用,我觉得 LangChainJs 是唯一选择。
@Seanfuck 如果有趣或者细分领域还是有帮助的,例如上传法律条文、上传一些面试题之类的
@zzh161 什么代理?
@SWALLOWW
@ql562482472

@SWALLOWW
@ql562482472

举个例子,我基于 https://github.com/k88hudson/git-flight-rules/blob/master/README.md 这个 Git 操作手册进行 Embedding 创建了 vector 数据后,就可以问 ChatGPT 基于这个文档材料相关的问题。例如问 I want to undo rebase/merge ,它就会回复 To undo a rebase or merge, you can reset your branch to the original HEAD pointer using the ORIG_HEAD variable. Use the command "git reset --hard ORIG_HEAD" to recover your branch to its state before the rebase/merge. 这段话是基于材料的上下文,而不是 GPT 的自由发挥。

再比如我上传朱自清的《背影》这篇文章,我问橘子是谁买的?可以得到回复是父亲买的。

所以这个功能是基于上传材料的上下文得到 GPT 的回答,而不是纯粹的 GPT 问答。

![Snipaste_2023-07-12_09-30-40]( https://cdn.jsdelivr.net/gh/guangzhengli/PicURL@master/uPic/Snipaste_2023-07-12_09-30-40.png)
@nyxsonsleep @dawnven 声音选择的是 https://docs.elevenlabs.io ,价格还行。
自荐一个刚创建的 Youtube 频道: https://www.youtube.com/@devweekly ,最新一期换了一个比较磁性的 AI 声音。每周发布一些最新的开源项目和有趣的产品项目。
分母来了
@rui2k 效果确实一般,embedding 的方案限制还是比较明显的。
@beiwei2008
@ZSeptember
@B1ock

embedding 的方案会将相关度高的文本给 ChatGPT ,而不是整本书的内容,所以现在如果问的是很模糊的问题,其实效果并不算好,但是问题精确的话,效果就还行。
@jZH 这个错误应该是我只打包了 arm64 的镜像导致的,目前已经推送了 amd64/arm64 ,你删掉本地镜像重新下载即可。
@metalvest 管理之前已经上传过的文档这个需求打算后面加上。感谢建议。
@metalvest 不好意思,应该是我最后清理依赖的时候删掉了,已加。谢谢提醒🙏
@justin2018 还需要重新投喂,生成新的 embedding 。并且最好换个名字,因为现在是按照文件名创建的 embedding 。后续这个也可以优化。
@cheng6563 语料库就是你自己的材料,比如你上传一本书的内容,可以问 ChatGPT 这本书写了什么
@NicholasZhan 对,因为现在创建出来的 embeddings 还是差点意思,所以大多是问答模式,后续看看怎么优化。
@Clash 这些后续都考虑支持
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1302 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 17:38 · PVG 01:38 · LAX 10:38 · JFK 13:38
Developed with CodeLauncher
♥ Do have faith in what you're doing.