上兩周寫發展人工智能,牽涉大量運算力。幾十年前的人工智能系統靠工程師將需要解決的問題化成步驟。例如要電腦控制煉鋼融爐,工程師就要編碼寫出系統當爐溫達某度數,就要加入某原料。這個過程牽涉大量專門知識或幾十年的實戰經驗,工程師未必能一一掌握。而且問題愈複雜,可能出現的情景就愈多,就算幾百萬行程式碼亦未必能完全處理,因而令那一代的人工智能有了發展上限。
十餘年前開始的一代人工智能,捨棄了靠工程師逐個情況編碼的方法,而改由向系統提供大量數據,要求系統自行找出數據內藏的模式,再做決定。例如最原始的例子,就是提供數百萬張狗狗照片,再提供數百萬張貓貓照片,然後叫系統嘗試將之分類。
在最簡單的設計裡,系統會產出幾千個虛擬機械人,叫它們亂猜。當然亂猜的整體成功率只有五成,但亦會有單憑幸運,而成功率較高的機械人。系統事後檢討,讓幸運的機械人產出下一代,然後再重覆訓練,就選出更接近正確答案的第二代機械人,並由它們再產出第三代。如此反覆訓練,就可找到成功率夠高的機械人。例如 ChatGPT或特斯拉FSD等,各家大企業公布的人工智能產品,就是完成這個過程後,企業所選取的機械人。
之前說訓練人工智能需要龐大運算能力,就是因為不停重覆上述的作答過程,而訓練次數遠高於外人想像。例如現時對電腦有興趣的高中生,用家裏的電腦也可以訓練人工智能去完成八十年代的電腦遊戲。以他們在社交媒體的視頻為例,大部分在訓練幾千代的機械人之後,都有不錯成績。
合格的自動駕駛系統自然比完成瑪利奧兄弟複雜很多倍,因此訓練有經濟價值的模型,就需要以百萬代計的訓練。高中生用家中電腦訓練遊戲機械人,也需要電腦連續運作一兩天,所以可想而知,現代大型模式所需的運算量就非常龐大了。
另外,靠電腦反覆訓練,就需要明確告訴電腦如何評價每一個機械人。分辨貓狗照片,評價方法自然就是正確的辨認率。但評價瑪利奧兄弟機械人已經沒有單一答案,可以是「完成遊戲的最短時間」或「最高分數」等,完全在乎於工程師希望解決的問題。現代系統要處理實際問題,最難的就是這條所謂的「成果方程式」。
例如自動駕駛系統,特斯拉採納的成果方程式是每次人手介入時候的平均行車里數。因為各地都有現時人手駕駛的總里數和意外數目,一樣可以算出每次意外之間的平均行車里數。兩者相比,就能得出自動駕駛系統相對人手數駕駛的安全系數。特斯拉的工程師團隊也有明確目標,知道下一波訓練的目標。而且在選擇各類設計方案之時,也可按方案對成果方程式的影響而作出取捨。
最近另外有工程師就認為特斯拉的方程式只適合輔助性系統,令駕駛者更加安全。但要訓練出完全自動系統,足以變成機械的士的話,成果方程式就應以每次介入的平均時數計算。平均里數和平均時數看似差不多,但就足以影響設計上的具體選擇。其他人工智能系統的成果方程式,未必有如此公開的辯論。但是投資下一波科技股,其實就是在選擇誰家的成果方程式最後跑出了。
(編者按:楊書健最新著作《不倒燈塔》現已發售,歡迎訂購。)
本地包郵
電子書