V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
scoful
V2EX  ›  OpenAI

用预测双色球的方式,简单测试对比了一下 GPT-4 和 GPT-4o

  •  
  •   scoful ·
    scoful · 14 天前 · 829 次点击

    物料准备:

    1. 双色球中奖号码输入 ChatGPT 之后.pdf
    2. 双色球.xlsx
    3. 支持 GPT-4 和 GPT-4o 的不同账号 贴个链接: https://pan.baidu.com/s/1yqu7Eg9oq5WvHdIDoyyG1g?pwd=3egr 提取码: 3egr 复制这段内容后打开百度网盘手机 App ,操作更方便哦

    过程设计

    1. 先考察双方对 pdf 的解析和总结
    2. 通过对话引导,是否能做预测
    3. 再考察双方对 Excel 的解析,近 100 期的双色球中奖数据
    4. 考察双方自动数据处理后,通过提问,对数据进行提取输出

    设计的问题如下:

    • 分析一下这个 pdf ,然后总结一下(分析和总结都能做到,4o 太啰嗦了 )

    • 那你是否可以做到文中说的操作?( 4 还在说明预测的不可信,4o 已经迫不及待的开始输出 )

    • (可选)是的,是随机事件,咱们来尝试模拟一下(这个是问 4 的,4o 已经输出一堆了,很不矜持啊 )

    • 这是近 100 期的中奖数据(数据故意不做清洗,故意误导<其实是懒的处理了>,中奖号码的格式是直接复制网页的,也没指明红球和蓝球,4 做的很好,主动提问规则是什么,4o 不管三七二十一,一顿输出,还是错的)

    • 列出在历史数据中,最常出现的 10 个号码( 4 能理解这个问题,同时还输出出现的次数,而 4o 就一言难尽了,改了几次它才理解意思,不过有点小怀疑是因为今天第一天发布,太多人使用,压力大,做了智能限制,因为其实试了几轮的,有时候能理解,可能负载均衡了)

    • 列出在历史数据中,红球和蓝球分别最常出现的 5 个号码( 4o 在上一个问题就是主动输出这样的,4 正常理解正常输出)

    • 尝试输出你认为的下一期的中奖号码,用你的逻辑进行推理( 4o 好像又一次偷懒了)

    结果截图:(有点长,可以拖到最后看主观总结或下载来看细节)

    1. 先是 4 的截图

    2. 4o 的截图

    主观总结:

    1. 从回复速度来对比,4o 的确是回复更快。
    2. 从回复的智能程度对比,对于同样的问题,4o 有时候会答非所问,或者说是太积极的对答案进行拓展,甚至是想太多,主观能动性太强了,有点话痨。而 4 的话,就是中规中矩,一问一答,毫不多嘴,甚至会主动提出自己的疑问,很严谨的风格。
    3. 感兴趣的佬友可以下载物料重新测试看看

    个人看法,对于不太复杂的问题,直接用 4o 更快的得到答案,逻辑复杂的还是暂时用 4 ,稳一手。

    第 1 条附言  ·  14 天前

    哇哦,刚刚对比了一下今天双色球开奖结果。

    4,预测中了4个红球,喜提10元

    4o,预测中了3个红球,喜提0元

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1072 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:43 · PVG 06:43 · LAX 15:43 · JFK 18:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.