豆包与ChatGPT解题对比
发布于 IP 属地:河北省
事件概况
- 量子位发布了一篇围绕高考数学与大模型能力对比的文章。
- 文章标题显示,测试对象包括 ChatGPT 和豆包。
- 核心看点是:在高考数学相关任务中,两款模型被放在一起比较。
可确认信息
- 原文明确提到“豆包硬刚 ChatGPT”。
- 测试场景与“高考数学”有关。
- 文章意图偏向对比体验,而非单纯介绍某一个模型。
信息不足之处
- 当前可见原文内容较少,未提供具体题目、评分标准或完整测试过程。
- 无法确认两款模型各自的答题结果、正确率或推理表现。
- 因此不宜直接下结论说哪一方更强。
社区讨论点
- 高考数学是否适合作为评估大模型推理能力的场景?
- 对比不同模型时,是否应统一提示词、题目来源和评分方式?
- 大模型在数学题上表现好,是否等同于具备稳定的数学推理能力?
来源:难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!(https://www.qbitai.com/2026/06/432425.html)
浏览(33)
