關於通用人工智能的發展競賽(AGI)仍然很漫長,蘋果公司的研究人員認爲,像ChatGPT和Claude這樣的頂級AI模型在推理方面仍然面臨困難。盡管已經有大型推理模型(LRMs),但它們的能力和局限性仍未得到明確理解。目前的評估主要集中在最終答案的準確性上,而沒有提供對推理能力的洞察。研究表明,LRM並沒有有效地泛化推理,且在復雜性增加時通常會面臨準確率崩潰。研究人員得出結論,這些模型僅僅模仿推理,而並未真正掌握,這不符合AGI的要求。盡管行業內一些領導者認爲AGI可能在未來幾年內實現,但它仍然是一個遙遠的目標。仍然很漫長,蘋果公司的研究人員認爲,像ChatGPT和Claude這樣的頂級AI模型在推理方面仍然面臨困難。盡管已經有大型推理模型(LRMs),但它們的能力和局限性仍未得到明確理解。目前的評估主要集中在最終答案的準確性上,而沒有提供對推理能力的洞察。
研究表明,LRM並沒有有效地泛化推理,且在復雜性增加時通常會面臨準確率崩潰。研究人員得出結論,這些模型僅僅模仿推理,而並未真正掌握,這不符合AGI的要求。盡管行業內一些領導者認爲AGI可能在未來幾年內實現,但它仍然是一個遙遠的目標。
![AI 模型離 AGI 級推理還很遠](http://img.gateio.im/social/moments-dea1e31890d5c3f9cb9284de2e16221a019283746574839201