熱門:

2025年4月29日 中國財經 港股直擊 香港財經

阿里巴巴通義千問發布並開源Qwen3

阿里巴巴(09988)通義千問周二凌晨發布新版Qwen3系列人工智能(AI)模型,公司聲稱,新版模型可以匹敵谷歌(Google)和OpenAI提供的最佳模型,在某些情況下甚至優於競爭對手。

新版Qwen3包括2個MoE模型和6個Dense模型,參數量從6億個到2350億個。與DeepSeek-R1、OpenAI o1及o3-mini、馬斯克的Grok 3和谷歌Gemini 2.5 Pro等其他頂級模型比較,旗艦模型Qwen3-235B-A22B在編碼、數學、通用能力等基準評估中,取得具競爭力的結果。

小型MoE模型Qwen3-30B-A3B的活化參數量是QwQ-32B的10%,表現更勝一籌,甚至像Qwen3-4B這樣的小模型,也能匹敵Qwen2.5-72B-Instruct的表現。

六個Dense模型也已開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0許可下開源。

Qwen3模式支持兩種思考模式,其一為思考模式,在這種模式下,模型會逐步推理,經過深思熟慮後給予最終答案。這種方法非常適合需要深入思考的複雜問題。其二是非思考模式,能提供快速、近乎即時的反應,適用於對速度要求高於深度的簡單問題。

通義千問並表示,Qwen3模型推理能力大幅提升,在數學、程式碼和邏輯推理等評測中,達到同規模業界SOTA水準。

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。