AGI新基準試專考人類簡單任務

人工智能（AI）研究團隊ARC Prize宣布，推出第二版通用人工智能（AGI）評估基準ARC-AGI。是次更新大幅提高AI推理系統的挑戰門檻，目標是推動更有效率、具普遍化能力的系統發展，縮短業界邁向AGI的時間。與業界其他基準不同，ARC-AGI並不重視測試博士級的專家技能，反而留意AI難以完成、但普通人可以簡單克服的難題，例如符號語義理解、動態組合推理，或情景化規則應用等，冀藉此揭示那些無法單靠擴大模型規模彌補的能力缺陷。理解符號語義及組合推理新版ARC-AGI包含1000筆訓練資料，以及三組各120筆的評估集，皆經由實驗證實具備人類可解性，與前代相比，進一步提高任務多樣性及校準度 ...

（節錄）全文共607字