V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  locoz  ›  全部回复第 67 页 / 共 323 页
回复总数  6451
1 ... 63  64  65  66  67  68  69  70  71  72 ... 323  
2023-03-07 17:31:54 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
@tool2d #27 输入的最大长度应该是这篇文档中提到的: https://platform.openai.com/docs/models/moderation
2023-03-07 17:30:59 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
@tool2d #27 回答的最大长度,跟输入的最大长度,应该是两个不同的概念?我这边之前测试 API 是存在 4096 token 的输入限制的。现在的关键问题其实是输入的最大长度。
2023-03-07 16:47:52 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
@tool2d #24 我看文档是都有 token 数限制,不知道你说的无限 token 是怎么做到的?
2023-03-07 16:13:51 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
@BirlGoy #20 是的,关键还是这个 token 数限制,而且长文很难饶过这个限制,无论是简化还是分段都容易出问题。只能看 openai 愿不愿意给定制用户提升限制了,能提升或许还能做相关的操作。
2023-03-07 16:10:30 +08:00
回复了 Auth0 创建的主题 OpenAI OpenAI 给我开了 300 刀
@zhouqian #78 因为 openai 本来就送 18 刀的免费额度,只要注册了账号就有,所以可以通过无限增加账号来堆免费额度...这个规则漏洞后面大概率要被封的,太多这么薅羊毛的了,肯定会影响正常用户使用和 openai 的营收。
2023-03-07 13:02:30 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
@BirlGoy #16 不不不,不是喂给它的参考内容太少,而是「文本转向量并匹配」这部分操作的匹配并不一定准确、完整。我当然知道 ChatGPT 本身没有问题,这方面用途我已经用了挺久了,只不过之前都是部分段落内容输入,而不是完整内容输入。

“先让 gpt 回答一次,根据答案去搜索 embedding ,再把这些内容参考交给 gpt 回答一次”
这种方式就我目前给的文件来说,没啥用...因为第一步的匹配操作就已经没有匹配到正确位置了,ChatGPT 也没法做出正确的描述,更别提后续基于这问问题了。
2023-03-07 11:30:00 +08:00
回复了 BirlGoy 创建的主题 OpenAI 理解 chatpdf.com 的代码原理
试了一下,对于高度定制化的内容,这种处理方式还是不太行,因为不一定能匹配到对应的原文,自然也就会导致 AI 要么猜内容、要么说不知道。

如果是常规的知识类书籍,由于数据很可能已经被学习过了,这种方式就相当于做了一个预先输入、限定回答范围的过程,能使回答内容更精准些,但回答的内容其实不一定是来自于 PDF 内。

所以:
@proxytoworld #1
实际并没有办法真正意义上地绕过 token 限制。

@tool2d #2
@justin2018 #9
实际只是相关内容已经被学习过了。
2023-03-07 11:21:53 +08:00
回复了 kqq19930511 创建的主题 macOS mac 有 samba 的图形化客户端吗?
finder 的 samba 连接确实毛病一堆,连接麻烦还老卡顿,跟 windows 上那种挂载个虚拟盘的体验没法比...
2023-03-07 11:20:44 +08:00
回复了 sewer 创建的主题 程序员 写的套壳 GPT 上 Trending 了~~这都行.🤣
通知滤盒也是有在做 AI 识别,不过这种功能主要还是个隐私问题,毕竟有些通知内容会涉及到身份证、手机号、行程之类的信息。
2023-03-07 11:18:04 +08:00
回复了 brader 创建的主题 程序员 ChatGPT 的/v1/chat/completions 接口流式响应设计有点不科学
当时抓包看到这返回方式的时候就感觉很蠢...明明可以分开两部分传输,却非要放在一个 json 里返回,导致流量浪费极大。只能说做术业有专攻,做 AI 的并不懂后端和网络。
2023-03-07 08:15:27 +08:00
回复了 Auth0 创建的主题 OpenAI OpenAI 给我开了 300 刀
这是完全可以预料到的…
2023-03-04 11:48:23 +08:00
回复了 otite 创建的主题 程序员 ChatGPT 新发布的 API 好快,免费的套壳网站也出来了
@acctv2 #226 那说明你账号的 api key 被别人调用了啊...官方的 chat 页是独立的,根本不会在开放 api 那部分里产生记录。
2023-03-04 09:32:43 +08:00
回复了 otite 创建的主题 程序员 ChatGPT 新发布的 API 好快,免费的套壳网站也出来了
@acctv2 #59 具体是什么场景下使用到了其他模型呢?
2023-03-04 09:30:40 +08:00
回复了 otite 创建的主题 程序员 ChatGPT 新发布的 API 好快,免费的套壳网站也出来了
@shuxhan #47 不是故意的,其实是 openai 在网页版里做了预设的要求,但 API 得用户自己设置,所以输出结果会有差异。
另外,笔记的关键在于帮助自己整理思路,而不是对外输出。如果你写笔记是为了对外输出,那你当然会写得很累、很耗费精力。因为你需要做润色、做校对,需要考虑别人能不能看懂,没办法放开。说白了,笔记少、零碎才是正常的现象。
对于我来说,笔记分两种。一种是速记,临时用短句描述一下事情、想法,避免忘记;一种是具体分析类的长笔记,本质上跟需要发布的文章差不多,但是完全不会考虑润色问题,前后逻辑可能会很跳脱,想到啥就单独列一条出来。

无论是哪一种,对于我来说其实都不需要额外耗费什么时间,基本就是想到啥顺手就打出来了。

而且你说的其实不应该称之为笔记了,而是被发布出来的文章,它跟笔记本来就属于两种不同的东西,没什么好对比的。
你说的其实就是:基于大模型做微调,产生一个垂直行业的定制模型。这是有的,也是可行的。
事实上你自己用 ChatGPT 就能做到一定程度的这种效果,只不过受限于它的记忆容量( token 数),只能做一些比较简单的微调,而且需要每次提问都强调来避免跑偏。
2023-02-26 15:06:01 +08:00
回复了 skai0dev 创建的主题 MacBook Pro MBP 的屏幕该用什么擦拭啊
@sisyphus60 #77 你说的是那个蓝色的、很多凸点的布?那个是明显比超细纤维布要粗糙的,如果想尽量不留痕迹就尽量别用那个。
@gushu #15 超聚变表示很草
1 ... 63  64  65  66  67  68  69  70  71  72 ... 323  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1031 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 19:56 · PVG 03:56 · LAX 11:56 · JFK 14:56
Developed with CodeLauncher
♥ Do have faith in what you're doing.