V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
IndexOutOfBounds
V2EX  ›  OpenAI

4o 的多模态怎么还没开放

 •  
 •   IndexOutOfBounds · 42 天前 · 2437 次点击
  这是一个创建于 42 天前的主题,其中的信息可能已经有所发展或是发生改变。

  现在好像还是单纯的文本模型

  16 条回复    2024-06-06 10:05:55 +08:00
  baoshuai33
      1
  baoshuai33  
     42 天前 via iPhone
  前面有个回形针一样的就是可以传文件
  kuhung
      2
  kuhung  
     42 天前
  拍照问他也可以呀
  crokily
      3
  crokily  
     42 天前
  拍照和语音一句句对话这些一直都有,但是像发布会上的那种实时对话还是没有发布。
  也不知道啥猴年马月才会发布。
  maolon
      4
  maolon  
     42 天前 via Android   ❤️ 1
  openai 的臭毛病,先把 hype train 搞出来,具体用户啥时候能体验,慢慢等灰度去吧。
  开发者论坛上一堆问什么时候开放演示里功能的,答曰: 无可奉告(现在只给密切合作伙伴使用)
  James2099
      5
  James2099  
     42 天前   ❤️ 1
  语音内测要几周,全部上线还得几个月,看 Open Ai 公告,就是为了在谷歌之前发布,不然没亮点了,加上斯嘉丽控诉 opanai ,下架了一个声音,估计不知道要多久,好几周了
  binaryify
      6
  binaryify  
     42 天前
  图片可以识别的
  shan1989
      7
  shan1989  
     42 天前
  目前只能输出文字,无法直接输出图片这些吧
  youngxhui838
      8
  youngxhui838  
     42 天前 via Android
  我连 4o 都还没有灰度到
  IndexOutOfBounds
      9
  IndexOutOfBounds  
  OP
     42 天前
  @baoshuai33 @kuhung @crokily @binaryify 我猜现在的语音,图片都还不是原生多模态,比如语音是先转成文字再给 gpt 的,和原生多模态还不一样,信息会有损耗,比如声音的语气情绪
  crokily
      10
  crokily  
     42 天前
  @IndexOutOfBounds 是不一样,发布会演示的是 RTC 实时对话,现在这个还得一句一句等候处理。
  appsyb
      11
  appsyb  
     42 天前
  4o 发布会就是为了狙击 Google I/O gemini 的
  ufogxl
      12
  ufogxl  
     42 天前
  @shan1989 可以输出图片,还能利用 bing 搜索在线内容
  18k
      13
  18k  
     42 天前
  我的有了,就是没开会员限制文件次数
  binaryify
      14
  binaryify  
     39 天前
  @IndexOutOfBounds 语音还得等,但是图片我看是可以识别图片内容的,不只是文字,你给它几个西瓜的图,打上数字编号,他会告诉你哪个熟了可以买,给它发 k 线图,也会给你分析走势
  IndexOutOfBounds
      15
  IndexOutOfBounds  
  OP
     38 天前
  @binaryify 哦哦,我主要还是指原生多模态。这个应该是模型外挂了什么视觉识别?不是模型本身认识图片,Poe 上用 gpt3.5 也可以上传图片,但模型本身显然只能处理文字
  binaryify
      16
  binaryify  
     38 天前
  @IndexOutOfBounds #15 确实,现在感觉和发布会的就是买家秀和卖家秀的区别
  关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2670 人在线   最高记录 6679   ·     Select Language
  创意工作者们的社区
  World is powered by solitude
  VERSION: 3.9.8.5 · 33ms · UTC 14:46 · PVG 22:46 · LAX 07:46 · JFK 10:46
  Developed with CodeLauncher
  ♥ Do have faith in what you're doing.