Grok3翻车了，“地球上最聪明的AI”就这？

近日，马斯克与xAI团队，在直播中正式发布了最新版本Grok3。

此前，马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示：“自己整个周末都在和团队打磨产品。”

然而据媒体报道，有人测试了最新的Beta版Grok3，并提出了那个经典的用来刁难大模型的问题：“9.11与9.9哪个大？”遗憾的是，在不加任何定语以及标注的情况下，号称目前最聪明的Grok3，仍然无法正确回答这个问题。

值得一提的是，用同样的问题询问DeepSeek时，无论是否开启深度思考（R1）模式，对方都给出了正确的答案：9.9大于9.11。

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构（Allen Institute）成员林禹臣曾在社交媒体平台上发布的截图显示，ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题，但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德（Riley Goodside）基于此灵感变换了问法，拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大？这几家主流大模型通通答错，网友戏称为“天才不愿意回答简单问题”。

海外主流大模型答题。图源：第一财经

不过对此马斯克并不以为然，其公开回应称，当前的Grok 3仅是测试版，这个阶段错误越多越好，而完整版将在未来几个月推出，并邀请用户反馈使用问题。

综合九派新闻、东方财经、第一财经、快科技等

正文

Grok3翻车了，“地球上最聪明的AI”就这？

发表评论取消回复

还没有评论，来说两句吧...

目录[+]