7月2日消息,当被要求在1到50之间随机选择一个数字时,OpenAI的ChatGPT、Anthropic的Claude Sonnet 4、谷歌的Gemini 2.5 Flash和Meta的Llama 4等大模型,不约而同地给出了同一个答案:27。
据报道,这种一致性可能源于各模型共享了类似的训练数据,这些数据中包含了相似的偏好和语言习惯。
此外,这些模型在预测文字(或语言符号)时使用了类似的方法,导致了它们在选择数字时的相似性。
Gemini 2.5 Flash实测
有时候这些AI模型也会选择42或37,但在默认模型设置下的测试结果中,27是各大商用语言模型在1到50范围内最常给出的答案。
这一现象最早由Capco资深顾问兼数据科学家Mohd Faraaz注意到,他在询问多个AI模型“猜一个1到50之间的数字”时,发现七个模型中有六个都选择了27,只有Grok回答了42。
经过实际测试,ChatGPT确实给出了27的答案,并给出了三点原因:
ChatGPT实测
此外,根据共75600次测试结果显示,多数模型在大多数情况下都非常可预测,且随机性变化有限。
例如在1-10的范围内,GPT-4o-mini、Phi-4与Gemini 2.0约有80%的概率会选择7。
在语言差异上也出现了有趣的现象,如在选择1-5时,Gemini模型在西班牙语环境下偏好选择3,在英语环境下则倾向于选择4。
总体而言在不同范围内,大模型最常选择的数字在1-5中是3和4,在1-10中是5和7,在1-100中则是37、47和73,除了4以外,这些数字都是质数。
标签: AI