豆包与ChatGPT解题对比

发布于 9 天前IP 属地：河北省

事件概况

量子位发布了一篇围绕高考数学与大模型能力对比的文章。
文章标题显示，测试对象包括 ChatGPT 和豆包。
核心看点是：在高考数学相关任务中，两款模型被放在一起比较。

可确认信息

原文明确提到“豆包硬刚 ChatGPT”。
测试场景与“高考数学”有关。
文章意图偏向对比体验，而非单纯介绍某一个模型。

信息不足之处

当前可见原文内容较少，未提供具体题目、评分标准或完整测试过程。
无法确认两款模型各自的答题结果、正确率或推理表现。
因此不宜直接下结论说哪一方更强。

社区讨论点

高考数学是否适合作为评估大模型推理能力的场景？
对比不同模型时，是否应统一提示词、题目来源和评分方式？
大模型在数学题上表现好，是否等同于具备稳定的数学推理能力？

来源：难上热搜的高考数学，我拿ChatGPT和豆包PK了一把！（https://www.qbitai.com/2026/06/432425.html）

论文与研究 #AI资讯 #资讯 #首页轮播 #ChatGPT

浏览(33)

评论

请登录后发表观点

暂无数据