« 返回前頁列印

2023-12-22 00:00

EJ Tech 創科鬥室

AI大模型搞不懂SEC文件GPT-4閉卷試九成錯 Llama 2僅19%準

放大圖片
現時在不少大型金融企業,無論分析師或投資者,都開始於營運層面引進人工智能(AI)技術。外媒CNBC報道,美企Patronus AI最近一項研究發現,坊間多款大型語言模型(LLM),均無法準確分析美國證券交易委員會(SEC)的文件。號稱性能最佳的GPT-4 Turbo,在測試中仍有15%答案失準,「閉卷」(closed book)測試失敗率更達88%,對金融應用誤差太大,料跟真正落地尚有距離。 Patronus AI團隊成員具備Meta Platforms背景,一直希望以公正獨立的角度,成為AI界別的評級機構,增強企業對生成式人工智能(Generative AI)的信心。該企最新產品為數據集Fi ...

(節錄)全文共1248字