2024-03-13 00:00
中環解密 凌通
AI大語言模型評測 文心4.0中文頂呱呱
講起人工智能(AI),可能大家在日常工作都會用到。香港大學經管學院就多個主流的AI大語言模型(LLMs)在中文及英文環境作綜合深入評測,發現在中文語境下,文心一言4.0綜合表現最佳;於英文語境的情況,ChatGPT 4-Turbo優勢明顯。
評測顯示,在中文語境下,綜合表現最佳的是由百度(09888)開發的文心一言4.0,OpenAI的GPT 4-Turbo及阿里巴巴(09988)的通義千問2.0緊隨其後。至於在英文語境下,只有GPT 4-Turbo的綜合得分獲得80分以上,大多數國產大模型的綜合表現均處於稍微劣勢的位置。
港大指出,今次評測主要針對三大核心能力,包括自然語言能力、專業學科能力 ...
(節錄)全文共354字