« 返回前頁列印

2024-07-05 00:00

商湯推可控人物視頻大模型 Vimi僅需一張相 生成片長達1分鐘

放大圖片
世界人工智能大會(WAIC 2024)昨天開幕,商湯(00020)在會上推出可控人物視頻生成大模型Vimi,只需要一張任意風格的照片,便能生成和目標動作一致的人物類短片,且時長可長達1分鐘,畫面效果不會隨着時間變化而降低品質或失真。Vimi已經在商湯的官網開放預約。 Vimi是基於商湯「日日新大模型」的能力,一張照片即可生成人物視頻,並支持多種驅動方式,可通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。 支援聊天唱跳等互動場景 商湯表示,讓照片中的人物動起來已非新鮮事,但目前市面上的產品實際應用仍存在挑戰,例如人物動作或表情動作無法精準控制、效果不穩定、時長限制在3至4秒等。 公司稱,與 ...

(節錄)全文共892字