ChatGPT 图像理解能力能在哪些场景发挥作用?

2023-10-09 09:47:11 +08:00
 xuelang

试了下 ChatGPT 的图像理解,比预期好,效果还是很赞的。

ChatGPT 图像理解能力深度体验

现在能想到的一些用途包括:

  1. 以后排查问题可以直接扔截图给它;
  2. 帮忙实现 web 页面;

其他还要啥好的使用场景吗?

2130 次点击
所在节点    OpenAI
22 条回复
whatv3
2023-10-09 09:54:19 +08:00
验证码...
jimrok
2023-10-09 10:02:27 +08:00
去除水印
xuelang
2023-10-09 11:05:43 +08:00
@whatv3 那得破解才行
xuelang
2023-10-09 11:06:15 +08:00
@jimrok 这里说的是图像理解。。去水印至少得有文生图才行
xuelang
2023-10-09 11:12:27 +08:00
@whatv3 试了下数字验证码,好像不用破解,直接就给识别了
zealotxxxx
2023-10-09 13:11:42 +08:00
你直接看微软发的那个论文,基本说的很全了。
[2309.17421.pdf]( https://browse.arxiv.org/pdf/2309.17421.pdf)
maxxfire
2023-10-09 13:38:03 +08:00
大家来找茬游戏,可以玩通关了
JayZXu
2023-10-09 14:15:00 +08:00
如果速度能提升的话,对视障人士还是挺有用的
jimrok
2023-10-09 14:16:48 +08:00
修改设计图可能行,把老王 p 掉,把老王 p 好看点
xuelang
2023-10-09 14:25:24 +08:00
@zealotxxxx 感谢,我瞅下
tuutoo
2023-10-09 15:22:09 +08:00
有人能使用这个图像识别功能了没?上次看了介绍,但啥时候有这功能啊。
iorilu
2023-10-09 15:36:23 +08:00
这么说打码问题可以解决了?
xuelang
2023-10-09 16:01:18 +08:00
@tuutoo 我这边已经有了,还在不断体验中
xuelang
2023-10-09 16:01:32 +08:00
@iorilu 试了下,并不能很好识别验证码
xuelang
2023-10-09 16:01:54 +08:00
@jimrok 这不行。。。这个只是理解图片而已
whatv3
2023-10-09 16:35:07 +08:00
@xuelang 用了多少 token ? 算算看是不是比打码平台便宜...
xuelang
2023-10-09 17:00:50 +08:00
@whatv3 哈哈哈,这是关键。目前还是打码平台靠谱便宜,ai 效果不行
qiany
2023-10-09 22:54:20 +08:00
检测员工摸鱼时长
youthfire
2023-10-10 10:06:56 +08:00
其实应用场景可以有很多,但是限制权在别人手里。比如说,interpretor (Advanced Data Analyze),出来的时候可以进行复杂的表格结构分析,然后完成 ocr ,最后排版。当时我经常用在业务上。但是现在只剩“告诉你逻辑/思路”,连 ocr 都不能顺利完成,不是告诉你环境缺失相关组件,就是一顿分析后质量很低,又或者提供惨不忍睹的部分结果。所以这个问题,回到图像理解能力上也是一样,它能懂,但是对于能不能做到你的需求,一直是变量。能力是有,但是服务商略微调整,你这边的结果,或者应用能力就变动很明显。
MelodyZhao
2023-10-10 10:47:44 +08:00
看图讲故事,还是挺不错的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/980105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX