可能是除了 ChatGPT 之外第一个搞出来的,使用方式很简单,调用时在 Prompt 中加入特定名称的 markdown 就行,类似这样:
```
这是谁画的
[GPT-4 Vision](
https://cdn.pixabay.com/photo/2023/10/07/23/39/girl-8301168_1280.png)
```
效果图:
甚至比直接用 ChatGPT 更灵活,在微软的 GPT-4v 测试报告中有 few-shot 场景,使用 ChatGPT 聊天框是复现不了的:
但是用 API 就可以做到文字和图片交错的能力,灵活度提高了。在官方识图 API 出来之前,可能是最好的替代品。复现下这个案例:
我们一直在做 GPT 相关各种功能,也有 Plus GPT-4 转 API 的工作,这次对接上识图功能,每天可以支持调用上百万次,有需求的大佬可以联系我: emhpZ3VvNjMwMA==
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/981654
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.