我认为的 ChatGPT 的下一个方向

2023-03-02 19:58:02 +08:00
 donotquestion
ChatGPT 是基于文本的语言模型,做的仅限于文本方面的工作。
我大胆预测下一个方向是基于视频学习的模型,暂且命名为 ActionGPT 哈哈

那么这个模型发展逻辑我觉得可能是这样的:

1 、一个机器人拥有各种基础功能,各个关节具有三维方面的可操作性能力
2 、ActionGPT 开始学习大量视频,并最终理解一些含义。例如喝水动作,首先是拿水杯,让拥有基础动作的机器人
通过视频得到分解的动作,并通过模拟,完成这个拿的动作,然后再送到嘴巴,喝下去。
3 、上面两步完成之时,才是真正大爆发的时代,你甚至有了穿衣服机器人、炒菜机器人、洗澡机器人等等,真正迎来机器人时代,这些只是生活机器人,更恐怖的是延展到其他方面。

细思极恐,新时代的主题已经很明确了,就是机器人时代,爆发就在眼前。
1625 次点击
所在节点    分享发现
4 条回复
pepsiwant
2023-03-02 20:04:28 +08:00
我想的是内容创作,当算力足够高的时候,AI 学习了文本、音频和视频,乃至于人类的各种情感体验,你就随便对 ai 说我要看 XX ,我的嗜好是 YY ,包含 ZZ 元素。AI 给你无限生成。再进一步,我要啥样的语音,啥样的剧情,背景故事、男女主角如何,生成十分钟的短片,还是八十集的连续剧,情感体验,反转几次,是笑中带泪还是黑色幽默,是王家卫当导演,还是毕志飞,不管什么样的元素,秒秒钟给你安排了
systemcall
2023-03-03 00:16:57 +08:00
chatgpt 在文本这块并不完美
比如我问它关于牢厂的问题,它就特别容易卡死,有时候回答到一半就卡壳了,有时候直接报错。最多聊个 2 、3 次就不能再聊下去了
wa007
2023-03-03 09:02:08 +08:00
文生视频,据说已经在做了,但技术上有卡点
donotquestion
2023-03-03 15:45:18 +08:00
@wa007 这个生成视频我不觉得是一个彻底改变性的方向,我觉得方向是机器人学习人的动作并能重复这个动作并理解含义。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/920609

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX