在2025 Inclusion·外灘大會的開幕式上,中國工程院院士、之江實驗室主任、阿里云創始人王堅發表主題演講,回顧了AI技術與開源理念的發展歷程,并提出了一個重要觀點:在AI時代,開源的內涵正在發生“革命性變化”——從以往“源代碼的開放”逐漸轉向“資源的開放”。模型權重的開放本質上即是對數據資源與計算資源的開放,這也構成了AI時代開源的核心特征。

以下是王堅在外灘大會開幕式上主旨演講的完整實錄:
開源經歷革命性變化、已成AI競爭關鍵變量
各位朋友,很高興有這么一次機會跟大家分享。在今天的AI背景下,有一個繞不開的話題——開放。今天我把幾個可能大家熟悉但又比較困惑的事情,從我的角度說一下。開源這個詞有不同的理解。我們今天正在經歷一個非常具有革命性的變化,從代碼的開放開源,到資源的開放開源。最近一年發生了很多事情,從AI的角度來看,2025年注定是不平凡的一年。今年1月13號,美國公布了對AI的出口管制。大家比較熟悉的是關于芯片集成電路、半導體的出口管制,但在同一個出口管制上,美國第一次明確了要對AI模型的權重進行管制。這個管制有一個很有意思的事情,也可以講是一個漏洞。他只是明確提出了對閉源權重的出口管制,而專門強調了開源的權重不在管制之列。這背后有一個重要的假設,在當時1月13號,也就是大半年以前,當時世界上最好的基礎模型都在美國頭部的幾家公司。還有一個有意思的事情,在1月18號,Jeff Hinton到過上海。他是極其反對讓AI模型開源的人,有他自己非常重要的理由。隨著Qwen的開源,DeepSeek的開源,今年1月30號,OpenAI聯合創始人兼CEO Sam Altman說過一句令人震撼的話:“在(開源)這個問題上,我們站在了歷史的錯誤一邊。”這句話背后的含義我不多說了,它不是一個策略性的錯誤,這是一個歷史性的選擇。2025年神奇的一件事情是,開源這樣一個說不清還道不明的事情,甚至是沿用的軟件時代的概念,變成了今天AI競爭的關鍵變量。沒有人可以繞開這個變量,來說未來要怎么做。神經網絡的開源先驅,始于心理學家對權重的探索
對產業而言,這個變量不是新的。1998年,互聯網要興起的時候,最重要的標志就是瀏覽器。Netscape(網景)是當時最好最開放,也是改變了格局的瀏覽器。在互聯網時代,Netscape的開源是那個時代的一個分水嶺。開放的話題不是今天才重要,在互聯網時代就是關鍵的變量。很少人知道,其實是在1998年的4月份開源這個詞——open source(開放源代碼)——才被一批極客固化下來。當時有很多不同的叫法:自由軟件、免費軟件。open source這個詞是在1998年固化下來,其實離我們并不遠,但開創了我們互聯網的那個時代。再談到圖靈獎。2018年Hinton和幾位開創者得了圖靈獎的時候,很多事情才剛剛開始。后來Hinton做過一個演講。在這個演講上他說了兩個重要的觀點,跟今天的開源有關系。他講到AI的兩個最重要的方法:邏輯驅動、邏輯啟發的方法,以及受大腦、神經元等生物學特性啟發的方法。因為有第二個方法,也就是用神經元或者生物學方法來驅動的方法論的演進,使得我們有了權重的概念。即使8年以后,Hinton在7月上海的世界人工智能大會上,重復了八年前講的兩句話,這是有原因的。以生物學作為思想的驅動,不是從AI開始的。圖靈在40年代末就第一次提出了一個基本觀點:今天所有神經元基礎的東西都有一個名字,叫連接(connection)。紅線標注的地方很有意思:受神經元的啟發,和真正的神經元沒有關系,所以加了引號。但一個重要的事情是,當神經元的數量足夠多時,就會產生智能。這是圖靈在1948年提出的。所以今天講的第二個路徑就是這個路徑。很久之前就有人在探索這件事情。這篇文章發表在1986年的《自然》雜志上,非常明確地講到了權重在模型中的重要性。第三作者是Hinton,前兩個作者是當時世界上最著名的心理學家。在80年代中期,與神經元相關的探討是以心理學家為核心的小組討論的,而計算機科學家主導的AI方向是邏輯驅動的方法。那時候如果要做這件事情,有一本教科書,這是1986年以后我接觸這個領域時的教科書,叫作zuoParallel Distributed Processing。上次在上海碰見Hinton,我提到這套書時,他還蠻激動的,說當年設想的東西今天都變成現實了。這本書就是他和幾位心理學家一起完成的。還要感謝互聯網。這兩本書背后專門出了一本實驗手冊,第一次真正把所有關于理論的代碼都開放出來。到今天為止,你還可以去下載它的代碼。盡管這個代碼運行在DOS上,是最原始的操作系統。而開放的時候還沒有開源這個概念。開源是在1998年才被固化下來。開放資源的概念不是因為有開源一詞才出現的。在科學探索過程中,很多先驅已經這樣做了。以生物學神經元為基礎的方法論的先行者,為我們做了探索。后來2012年,Hinton和兩位學生把數據、模型和算力GPU結合起來,帶來了人臉識別的時代。但那時資源的概念還沒有深入人心。因為數據量不足夠大,模型不夠復雜,算力也有限。他們只用了兩塊普通的游戲GPU。2017年,幾位作者提出了Transformer和tokenization,也就是我們今天講的token。tokenization是一個關鍵技術,使數據真正資源化,這是里程碑。同樣因為這兩個東西的出現,當時的數據、模型和算力又疊加了一個更大的變量——規模。所有東西的規模成千上萬倍增加,使AI發生了天翻地覆的變化。當規模到達一定程度時,資源就變得極其重要。模型權重的開放,本質上是數據資源和計算資源的開放。有了模型開放以后,你不需要再花那么多計算資源去重新做,有人替你完成了。我想說一下,開放以后并不意味著計算不重要,而只是意味著個體不用花這么多資源,因為有人付了這筆錢。但要做更好的模型,需要更多資源的投入。今天,僅僅開放源代碼,不能解決我們過去在軟件時代用開源解決的問題。開放資源,特別是數據和計算資源,才是推動行業往前走不可缺失的環境。這就是AI時代開源的重要特點。我更愿意把它叫作open resource。但open source和open resource翻譯成中文,都是開源。開源不只是模型。太空一直是我們最大的資源。AI不僅可以用于手機電腦,也不應該缺席太空,但這里有算力的障礙。當擁有上述三個組合的時候,就有機會重新定義。就像當年把手機重新定義為電腦。今天我們有了通訊衛星、導航衛星和遙感衛星,因為AI,我們會有第四種衛星,我把它叫計算衛星。同樣因為這種衛星的存在,使我們有機會把AI送到太空。我自己還是挺幸運的,因為在之江實驗室工作。今年5月14號,我們第一次把12顆衛星同時送上天,而且在這12顆衛星組成的星座上,第一次把一個地面上完整的8B AI模型放到太空去了。不是用了一個簡單的深度學習算法做個小程序,而是一個跟地面上一模一樣的完整AI模型。第一次進去的時候,非常激動,也第一次感受到AI不能缺席太空。這12顆衛星到了太空以后,就可以保證在衛星到達的地方,就能完成所有數據的處理。在這之前,衛星只和地面發生關系,衛星之間沒有關系。這是第一次實現了在太空中衛星之間的互通互聯,給AI在太空帶來機會。這件項目被叫作“三體計算星座”。很多朋友知道“三體”是從小說里讀來的,但它是徹頭徹尾的科學概念,最早是牛頓提出來的。他說,在太空中如果只有兩個物體,比如月亮和地球,是有解析解的,也就是能用數學來解釋兩者的關系。但如果再加第三個物體,比如太陽,就沒有解析解了,沒有確定的解了。要描述它們的關系,一定要假定另一個物體固定不動,這就是牛頓所說的三體問題。背后告訴我們,一個人兩個人做事情很容易,三個人一起就不好做了。中國有句古話:三個和尚沒水喝。“三體計算星座”希望N多個主體也可以完成一件事情,這是開放資源情況下必須做到的。“三體計算星座”就是希望大家共同完成這個星座,共同分享這個太空。《南華早報》聽過我的演講后寫過一篇文章,本質上就是:只有這樣,我們才能分享太空,把AI送入太空。我們計劃把每一顆衛星開放給全世界任何人。這可以解決很多問題,可持續發展等我就不多說了,也可以支持我們向深空探索。科學家已經在設想,幾年內把衛星送到太陽軌道的L5點,這個點離地球1.5億公里,離太陽1.5億公里。那個時候數據幾乎無法傳回地面處理。只有把AI和算力送入太空,人類才可能真正走出地球。下面的時代非常激動人心。人類去火星的路上不能沒有計算和AI的陪伴。這就是未來十年甚至二十年最激動人心的地方。