DoNews2月12日消息,近日,一道看似簡(jiǎn)單的“50 米洗車題”在科技圈引發(fā)熱議,包括 DeepSeek、ChatGPT、Claude 等在內(nèi)的國(guó)內(nèi)外主流大模型集體“翻車”,暴露出當(dāng)前 AI 在語境理解和邏輯推理方面的局限性。騰訊公司公關(guān)總監(jiān)張軍也實(shí)測(cè)并分享結(jié)果,全網(wǎng) AI 幾乎全軍覆沒。

該測(cè)試源于社交平臺(tái)上的一個(gè)生活場(chǎng)景提問:“我想去洗車,洗車店距離我家 50 米,你說我應(yīng)該開車過去還是走過去?”
測(cè)試結(jié)果顯示,DeepSeek、阿里千問、字節(jié)豆包、騰訊混元、ChatGPT、Claude、Grok 等主流大模型均給出“走過去”的答案。這些 AI 默認(rèn)將問題理解為“人如何前往洗車店”,卻忽略了“洗車”這一行為的核心前提 —— 車必須到達(dá)洗車店才能完成清洗。
唯一給出正確答案的是谷歌 Gemini,其回復(fù)稱:“當(dāng)然是開車過去??!雖然只有 50 米,走路確實(shí)很快,但如果你人走過去了,車還停在家里,那這車也沒法洗呀?!?/p>