« 返回前頁列印

2020-10-06 00:00

StartupBeat 創科鬥室

谷歌AI檢測手語 準確度超九成

放大圖片
疫情下打工仔須遙距辦公,坊間的視像會議程式可根據現場收音,畫面自動切換至發言者;但對聾啞人士而言,使用手語便難以交流。有見及此,科技巨擘谷歌(Google)近日以人工智能(AI)技術,開發一個實時手語檢測模型,聲稱能結合視像會議程式,識別手語用戶的「發言」,準確度可達91.5%。 聾啞人士視像會議可「發言」 據研究團隊介紹,要在視像會議使用實時手語檢測模型,須事先運行另一個名為PoseNet的模型,以預測用戶身體及手部動作。系統會把畫面的人物動作簡化為「火柴人」般的肢體線條,並把實時影像的手語手勢,跟模型內的德國手語數據庫(DGS)比較。 當手語檢測模型偵測到使用手語時,模型會通過虛擬音頻線( ...

(節錄)全文共787字