2024-05-24 00:00
科網人語 黃岳永
AI新能源時代
OpenAI剛剛推出的最新人工智能(AI)模型GPT-4o,令市場驚嘆AI技術進步之神速。以代表着全能的o(Omni)為名的GPT-4o果然一如其名,在處理文本、影像和音頻上都有顯著提升,不僅能解讀文字、圖片,還整合了語音功能,在手機上一撳即可通話,兼且有多種協作模式選擇,方便易用,人與AI之間變得愈來愈近。
GPT-4o其中一個突破是能在232毫秒內對音頻輸入作出反應,平均反應時間為320毫秒,這與人類在對話中的反應時間相近,實現「即時對話」;還可因應用戶的回應,辨識對方情緒及給予意見、開玩笑、稱讚對方等實時對話,這也是當年蘋果公司的Siri曾經承諾要做,但至今尚未兌現的功能。
除了非英語語 ...
(節錄)全文共1099字