變與不變：凹凸不平的AI智能

近來，AI將如何顛覆世界，已成為科技界以至整個社會爭論不休的熱話。各種觀點南轅北轍，莫衷一是。

在美國，不同圈子的討論已壁壘分明。如AI科學家Boaz Barak指出，華爾街等東岸精英往往低估了變革的軌跡，只着眼於當下模型的局限，忽視模型進步的速度；而西岸的矽谷工程師，剛經常輕視了將實驗室模型轉化為落地應用所需克服的重重障礙。

AI及社會的未來，眾說紛紜。

智能發展的「鋸齒狀」

AI領域長期以來流傳着一個「快速起飛」（fast takeoff）的假說。此理論認為，一旦AI在某個關鍵點上超越人類，便會觸發智能爆炸，於極短時間內變得無所不能，遠超人類。

然而，這種情景恐怕過於簡單化，未必會發生。現實的演進更可能是一個循序漸進、充滿崎嶇的過程。AI的改進能力更像一個光譜，而非一個全有或全無的二元開關。並不存在一個神奇按鈕，一旦按下，超級智能便橫空出世。

更重要的原因是，AI的進步速度，必須以「每項具體任務」來衡量。我們可以將人類世界的萬千任務想像成一幅光譜圖，其邊緣並非平滑的直線，而是凹凸不平的「鋸齒狀」（Jagged Frontier）。

在那些「高峰」地帶，是AI已展現超凡能力的領域，例如處理複雜數學題或某些編程競賽。然而，在另一些看似簡單的「低谷」，AI卻顯得笨拙。例如，ChatGPT曾長時間無法正確判斷9.11大於9.9；又或者讓它學習如今全球能流利使用者已不足百人的清朝國語滿語（Manchu）。由於極度缺乏數碼化的語料數據，AI恐怕也束手無策。

因此，我們不會目睹一個AI模型在一夜之間無所不能。更可能的景象是：每項任務的進步速度大相徑庭。某些任務因容易驗證、數據充足，將會一日千里；另一些任務，例如學習滿語，受制於現實條件（需尋找極少數的母語者進行記錄），其進展自然會緩慢得多。

預測AI進程的五項準則

那麼，我們該如何判斷AI在不同任務上的發展速度？這裡有幾條簡單而有效的準則：

一、 AI在數碼世界如魚得水，迭代速度極快。因為擴展計算資源，遠比在物理世界進行機械人實驗來得容易和便宜。愈是數碼化的任務，愈容易被AI攻陷。

二、一般而言，對人類越是基礎、直觀的任務，AI學習起來也相對容易。反之，需要複雜抽象推理的任務，對雙方都是挑戰。我們可以從一項任務在人類世界的難易度分佈，作為AI發展的初步參考。

三、AI能夠勝任一些本質不難，但因規模龐大令人類無法完成的任務。經典例子是醫療影像分析。醫生一生可能看過數千張乳癌X光片，但AI能在短時間內分析一千萬張，從中找出人類因壽命和專注力所限而無法察覺的細微規律。

四、數據越充足，AI表現越好。例如，語言模型使用不同語言的能力，與該語言在網絡上的數據量成正比。數據越多，表現越佳。

五、評估指標清晰。當一項任務存在明確、單一的客觀評估標準時，AI便能透過強化學習自我訓練，從而迅速提升。因此如前文所言，一項任務的驗證結果的難度愈低，AI把它商品化的速度就越快。

AI何時駕馭萬物？

運用上述準則，我們可以對AI在不同領域的發展作一些有趣的推測（年份純屬估算，聊作參考）：

主流語言翻譯：對人類來說不難，數碼任務，數據多。（已完成）
基礎程式除錯：人類中等難度，數碼任務，數據多。（已完成）
奧數：對人類來說困難，數碼任務，數據多。（已完成）
電影製作：對人類來說極難，數碼任務，數據多，評估指標混亂。（或需一兩年後）
科研：對人類來說極難，數碼任務，但數據不易獲取。（或需五年）
長期準確預測資產走勢：對人類來說極難，數碼任務，數據多，但具有反身性。（難以判斷）

再看一些截然不同的任務：

翻譯滿語：人類不難（對母語者而言），數碼任務，但數據極少。（基於成本效益難以實現）
維修水管：人類中等難度，非數碼任務，數據不易獲取。（具身智能出現突破前難以實現）
理髮：人類中等難度，非數碼任務，數據不易獲取。（具身智能出現突破前難以實現）
讓女友一直心情愉快：終極難題，非數碼任務，數據無法量化，評估指標混亂。（不可能的任務）

總結而言，「鋸齒狀智能」提醒我們，不必對AI抱持一夜變天的幻想或恐懼。AI的影響將是不均衡的，它會優先在那些具備「數碼化、數據豐富、對人類而言非極難」屬性的任務上取得突破。

這意味著，軟件開發等行業將迎來翻天覆地的變化，而理髮、水電維修等需要與物理世界靈巧互動的行業，在可見的將來，仍將是人類的天下。如何讓女友一直心情愉快，仍會是世界級難題。

本文原刊於明報，刊登日期為 2025 年 11 月 27 日。

智能發展的「鋸齒狀」

預測AI進程的五項準則

AI何時駕馭萬物？

Sign up