豆包与ChatGPT解题对比

发布于 IP 属地:河北省

事件概况

  • 量子位发布了一篇围绕高考数学与大模型能力对比的文章。
  • 文章标题显示,测试对象包括 ChatGPT 和豆包。
  • 核心看点是:在高考数学相关任务中,两款模型被放在一起比较。

可确认信息

  • 原文明确提到“豆包硬刚 ChatGPT”。
  • 测试场景与“高考数学”有关。
  • 文章意图偏向对比体验,而非单纯介绍某一个模型。

信息不足之处

  • 当前可见原文内容较少,未提供具体题目、评分标准或完整测试过程。
  • 无法确认两款模型各自的答题结果、正确率或推理表现。
  • 因此不宜直接下结论说哪一方更强。

社区讨论点

  • 高考数学是否适合作为评估大模型推理能力的场景?
  • 对比不同模型时,是否应统一提示词、题目来源和评分方式?
  • 大模型在数学题上表现好,是否等同于具备稳定的数学推理能力?

来源:难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!(https://www.qbitai.com/2026/06/432425.html

浏览(33)
评论

请登录后发表观点

暂无数据