Will China’s open-source AI end U.S. supremacy in the field?
With the advent of DeepSeek, the balance of power between the two nations appears to be shifting. January 28, 2025
人工智能領域瞬息萬變,這幾乎已成為老生常談。但在最近幾天,即使是那些站在人工智能研究最前沿的人也吃了一驚–被一家中國公司給嚇到了。
上周,人工智能公司 DeepSeek發佈了其 R1 推理模型,在包括數學和編碼在內的多種邏輯任務中,它與 OpenAI 的 o1 不相伯仲(比 ChatGPT 模型好得多)。它的運行成本也更低,只有 OpenAI 收費的 2%。而在週一,DeepSeek發表了 Janus Pro ,一個小到可以在筆記型電腦上執行的模型,它可以產生合成圖像,並聲稱其性能優於 OpenAI 的 Dall⋅E 3。DeepSeek 的 AI 創新速度風靡全球。
更難得的是,DeepSeek 的整個模型集合都是開放原始碼的 – 在這種情況下,這意味著他們擁有開放的權重,任何人都可以複製並在其上進行建置。
當一家中國公司成為事實上的開源領導者,而大多數主要的美國公司(Meta 除外)仍繼續嚴密保護其方法論時,這是一個奇特的時刻。事實上,這是中國人工智能公司日益增長的趨勢,從 Minimax 等新創公司到阿里巴巴等科技巨頭,都讓全球開發人員免費使用他們的人工智能模型。
到目前為止,OpenAI 的 o3 和 Anthropic 的 Claude 3 Opus 等閉源模型被認為是擁有最先進功能的業界標準,而且這些模型都是在美國製造的。開放源碼和中國模型被認為落後了幾個月。但 DeepSeek 的 R1 和 Janus Pro 顯示出技術優勢的轉變有多快。這些機型的推出震動了股市,導致美國科技股大跌。現在的勢力平衡似乎正沿著兩條關鍵軸線轉移:一條是美國與中國之間,另一條是封閉與開放源碼模式之間。
封閉原始碼模式的維護者押注,他們可以藉由保護其模式權重與訓練方法,來維護其能力差距。另一方面,開放源碼的主張者則認為,透明化 – 允許其他人在他們的工作基礎上發展 – 可以讓這些系統迅速趕上更大型的封閉式模型。如果開放源碼的論點是正確的,這將會顛覆人工智能的生態系統。一般而言,開放原始碼模型的使用成本較低,因此當兩種能力相同的模型出現時 – 一個開放、一個封閉 – 開放原始碼模型很可能會獲得更廣泛的採用,使其具有戰略優勢。
美國已經擁有世界上最好的封閉式模型。為了保持競爭力,我們也必須支持一個充滿活力的開放原始碼生態系統的發展。
開放源碼與封閉源碼人工智能之間,以及美國與中國之間的競賽,還沒有明顯的贏家。但如果 DeepSeek 能用少得多的資源與美國大科技公司競爭,美國大科技公司的壓力顯然會越來越大。出口管制旨在扼殺中國獲得最先進電腦晶片的機會,阻礙中國跟上步伐的能力。但事實上,中國高性能晶片的相對缺乏,可能促使中國的公司和研究人員提高效率,並促使他們發掘新的方法,顯著降低培訓成本。舉例來說,DeepSeek 證明,繞過傳統的監督微調階段,可以使大型模型訓練更有效率。他們甚至創造了 R1-Zero,一個省略了人工智能訓練中這一步驟的模型,以挑戰研究界對微調不可或缺的假設。
DeepSeek 的成功也讓人質疑預先訓練的重要性,預先訓練包括訓練更大的模型,以大量的文字為基礎預測下一個字。這個過程需要在繪圖處理單元 (GPU) 和資料方面進行龐大的前期投資 – 資料多到 OpenAI 的共同創辦人 Ilya Sutskever最近指出,我們可能很快就會耗盡網際網路上所有可用的資料。
不過,還有另一種新興方法可以改善模型的效能。OpenAI 的 o1 模型已於 12 月推出,此方法可讓模型透過自我反省進行推理,類似人類的推理方式,利用中間步驟與自我修正達成最終答案。這種方法的訓練秘訣之前一直由 OpenAI 密切保密。DeepSeek發表了一篇論文,詳細說明了它的工作原理,讓其他人也能實現這個過程,從而揭開了這個秘密。
DeepSeek 甚至證明,您可以更經濟有效的方式來實現這一目標,方法是採用 Meta 的 Llama 3 等公開可用的基礎模型,並透過強化學習來教導它進行推理,也就是利用人為設計的回饋和獎勵來進行試誤的過程。隨著時間的推移,這些模型似乎會自發地學習如何推理、在遇到死胡同時回溯並探索新的方法。這種方法省去了預先訓練新基礎模型的昂貴成本,對人工智能創新的影響深遠。傳統上,由於計算和資料的限制,即使是資金最雄厚的大學實驗室也很難對人工智能研究做出貢獻。隨著 DeepSeek 的突破,圍繞著資金雄厚的大公司的護城河可能正在縮小。
美國的前沿模式公司不太可能在短時間內改變其商業模式,也不見得他們應該立即改變。開放式與封閉式的競爭很可能會找到一個自然的平衡點,針對不同的使用者提供一系列不同的產品與價位。
但 DeepSeek 的推出標誌著一個轉捩點。
美國創新的前進道路,不僅包括加速開放原始碼開發,也包括鼓勵分享訓練方法,以及增加 AI 研發投資,例如白宮最近宣佈的星門計畫(Stargate Project),該計畫的目標是在未來四年內,在 AI 基礎建設上投入 5000 億美元。
美國的競爭優勢長期以來都仰賴開放式科學,以及跨產業、學術界與政府的合作。在人工智能時代,我們應該接受開放科學可能再次激發美國活力的可能性。
Eric Schmidt 是 Google 前執行長兼董事長,也是 Schmidt Sciences 的共同創辦人,以及無黨派智庫 Special Competitive Studies Project 的主席。Dhaval Adjodah 是 MakerMaker.AI的共同創辦人兼執行長。
