【欲言不止】投資下一波科技股選擇

上兩周寫發展人工智能，牽涉大量運算力。幾十年前的人工智能系統靠工程師將需要解決的問題化成步驟。例如要電腦控制煉鋼融爐，工程師就要編碼寫出系統當爐溫達某度數，就要加入某原料。這個過程牽涉大量專門知識或幾十年的實戰經驗，工程師未必能一一掌握。而且問題愈複雜，可能出現的情景就愈多，就算幾百萬行程式碼亦未必能完全處理，因而令那一代的人工智能有了發展上限。

十餘年前開始的一代人工智能，捨棄了靠工程師逐個情況編碼的方法，而改由向系統提供大量數據，要求系統自行找出數據內藏的模式，再做決定。例如最原始的例子，就是提供數百萬張狗狗照片，再提供數百萬張貓貓照片，然後叫系統嘗試將之分類。

在最簡單的設計裡，系統會產出幾千個虛擬機械人，叫它們亂猜。當然亂猜的整體成功率只有五成，但亦會有單憑幸運，而成功率較高的機械人。系統事後檢討，讓幸運的機械人產出下一代，然後再重覆訓練，就選出更接近正確答案的第二代機械人，並由它們再產出第三代。如此反覆訓練，就可找到成功率夠高的機械人。例如 ChatGPT或特斯拉FSD等，各家大企業公布的人工智能產品，就是完成這個過程後，企業所選取的機械人。

之前說訓練人工智能需要龐大運算能力，就是因為不停重覆上述的作答過程，而訓練次數遠高於外人想像。例如現時對電腦有興趣的高中生，用家裏的電腦也可以訓練人工智能去完成八十年代的電腦遊戲。以他們在社交媒體的視頻為例，大部分在訓練幾千代的機械人之後，都有不錯成績。

合格的自動駕駛系統自然比完成瑪利奧兄弟複雜很多倍，因此訓練有經濟價值的模型，就需要以百萬代計的訓練。高中生用家中電腦訓練遊戲機械人，也需要電腦連續運作一兩天，所以可想而知，現代大型模式所需的運算量就非常龐大了。

另外，靠電腦反覆訓練，就需要明確告訴電腦如何評價每一個機械人。分辨貓狗照片，評價方法自然就是正確的辨認率。但評價瑪利奧兄弟機械人已經沒有單一答案，可以是「完成遊戲的最短時間」或「最高分數」等，完全在乎於工程師希望解決的問題。現代系統要處理實際問題，最難的就是這條所謂的「成果方程式」。

例如自動駕駛系統，特斯拉採納的成果方程式是每次人手介入時候的平均行車里數。因為各地都有現時人手駕駛的總里數和意外數目，一樣可以算出每次意外之間的平均行車里數。兩者相比，就能得出自動駕駛系統相對人手數駕駛的安全系數。特斯拉的工程師團隊也有明確目標，知道下一波訓練的目標。而且在選擇各類設計方案之時，也可按方案對成果方程式的影響而作出取捨。

最近另外有工程師就認為特斯拉的方程式只適合輔助性系統，令駕駛者更加安全。但要訓練出完全自動系統，足以變成機械的士的話，成果方程式就應以每次介入的平均時數計算。平均里數和平均時數看似差不多，但就足以影響設計上的具體選擇。其他人工智能系統的成果方程式，未必有如此公開的辯論。但是投資下一波科技股，其實就是在選擇誰家的成果方程式最後跑出了。

（編者按：楊書健最新著作《不倒燈塔》現已發售，歡迎訂購。）
本地包郵
 電子書