2025-03-26 00:00
CEO AI⎹ EJ Tech
AGI新基準試專考人類簡單任務
人工智能(AI)研究團隊ARC Prize宣布,推出第二版通用人工智能(AGI)評估基準ARC-AGI。是次更新大幅提高AI推理系統的挑戰門檻,目標是推動更有效率、具普遍化能力的系統發展,縮短業界邁向AGI的時間。
與業界其他基準不同,ARC-AGI並不重視測試博士級的專家技能,反而留意AI難以完成、但普通人可以簡單克服的難題,例如符號語義理解、動態組合推理,或情景化規則應用等,冀藉此揭示那些無法單靠擴大模型規模彌補的能力缺陷。
理解符號語義及組合推理
新版ARC-AGI包含1000筆訓練資料,以及三組各120筆的評估集,皆經由實驗證實具備人類可解性,與前代相比,進一步提高任務多樣性及校準度 ...
(節錄)全文共607字