生成式AI推動大數(shù)據(jù)時代向大智能時代躍遷
產業(yè)觀察家們注意到生成式AI的革命性意義,并作出豐富解讀。英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛稱生成式AI的推出為“AI產業(yè)的iPhone時刻”,意指其顛覆性的技術突破和產品形態(tài)或將引發(fā)Al產業(yè)的全面變革。投資公司a16z的合伙人馬丁·卡薩多(Martin Casado)則稱其為“第三個計算時代”,意指繼微芯片將計算的邊際成本降到零、互聯(lián)網將分發(fā)的邊際成本降到零之后,大模型將創(chuàng)作內容的邊際成本降到零的第三次飛躍。麥肯錫技術合伙人萊瑞拉·余(Lareina Yee)則將其類比為計算產業(yè)經歷過的大型機到PC的劇變,意指生成式AI將技術使用權從精英轉向大眾,實現(xiàn)了AI技術的民主化。然而,以上解讀局限于AI產業(yè)自身,沒有考慮生成式AI如何重塑更廣泛的經濟。筆者認為,生成式AI和大模型有潛力成為整個國民經濟智能基礎設施,進而奠定所謂的大智能時代。
生成式AI,有何不同
不同于專注解釋現(xiàn)有數(shù)據(jù)的分析式AI或根據(jù)給定輸入推斷輸出的預測式AI,生成式AI專注于生成新內容,或稱合成數(shù)據(jù)(synthetic data)。ChatGPT僅是大模型的一種,準確地說,它僅是文本大模型的一種。文本大模型之外,還有音頻大模型和視覺大模型。最近,大模型已發(fā)展至具備多模態(tài)對話能力。
不同于預設規(guī)則或者試圖尋找結構化規(guī)則的傳統(tǒng)AI,生成式AI直接從海量未經標簽化的非結構化數(shù)據(jù)中提取基礎模型(foundation model)。由于基礎模型的參數(shù)巨大,常被稱為大模型。大模型的訓練極端昂貴,但具備一系列傳統(tǒng)AI模型不具備的優(yōu)勢:一是其采取的非監(jiān)督訓練的方式極大地降低了人工標注的需要;二是模型具有更好的通用性,可靈活應對多種任務;三是大模型可以理解并使用人類語言,交互體驗非常自然。
歸根到底,大模型是人類全量知識的壓縮。傳統(tǒng)AI利用有限的知識(預設的算法)從豐富的場景數(shù)據(jù)中提取結果,而大模型利用近乎完備的知識去解讀場景數(shù)據(jù)(盡管它不一定豐富)。
大模型作為智能基礎設施
生產力的進步通常體現(xiàn)為某種新型基礎設施的建立。工業(yè)時代出現(xiàn)電力基礎設施,網絡化時代出現(xiàn)網絡基礎設施,而智能時代將出現(xiàn)何種基礎設施?筆者斷言大模型具備成為智能基礎設施的潛力,因其具備基礎設施的三個基本特征。
一是通用性。傳統(tǒng)AI需要針對特定任務設計,表現(xiàn)出更多的專用性與垂直性。相比之下,經過高強度預訓練的大模型具備靈活應對多種非預設任務的能力,可通過微調及提示詞工程實現(xiàn)應用情景的高擴展,進而在通用性上大大提升。
二是規(guī)模經濟。大模型的規(guī)模經濟與兩個概念有關。一是智能涌現(xiàn)。只有模型參數(shù)規(guī)模超越臨界點之后,智能才開始涌現(xiàn)。工業(yè)經濟情景下,低于最小有效生產規(guī)模的廠商無法有效參與市場競爭。類似地,廠商必須投入高昂的前期訓練成本,才能參與大模型市場競爭。二是智能摩爾定律。傳統(tǒng)摩爾定律預測硅片上的晶體管密度隨時間推移指數(shù)級增長,而成本保持不變。智能摩爾定律則預測大模型智能所能覆蓋的場景數(shù)(智能密度)具有類似的規(guī)律。這意味著,隨著大模型參數(shù)的增長,其覆蓋智能場景的單位成本呈指數(shù)級降低。
三是外部性。修好的路上不跑車,價值等于零。盡管大模型語境下的“車”是什么尚未完全確定,但確定的是大模型的出現(xiàn)將促進各類“車型”的創(chuàng)新。因此,大模型對經濟的推動作用要遠遠大于生成式AI產業(yè)產值本身。聊天類應用僅僅是大模型應用的初級形態(tài),創(chuàng)意和想象力與未知場景結合迸發(fā)出的產業(yè)能量,才是大模型作為基礎設施最具想象空間之處。
通用性、規(guī)模經濟和外部性是基礎設施的一般性特征。那么,大模型作為智能基礎設施的特殊性何在?筆者認為,這是人類歷史上第一次實現(xiàn)智能的大規(guī)模集中供給,故而稱其為智能基礎設施。難道數(shù)字化時代不是已見證林林總總的智能化基礎設施嗎(如智能手機、智能電網、智能交通等)?此處需澄清,智能的基礎設施化不同于基礎設施的智能化。智能手機的核心是手機,智能電網的核心是電網,智能交通的核心是交通,賦予其各種智能內涵的過程是基礎設施的智能化。智能基礎設施的核心則是相對通用的智能本身,能對接千行百業(yè)。過去幾十年,數(shù)字化基礎設施圍繞信息的采集、處理、傳輸、存儲、計算等環(huán)節(jié)得到充分發(fā)展,而智能基礎設施的發(fā)展才剛剛開始。
從大數(shù)據(jù)時代到大智能時代
每輪基礎設施躍遷都會引發(fā)一輪新商業(yè)機遇。這是因為,基礎設施將此前需要分散承擔的可變成本轉化為集中承擔的固定成本,推動新要素普及、降低創(chuàng)新門檻。智能基礎設施帶來的新要素就是智能:大模型壓縮了人類所有知識,將場景數(shù)據(jù)輸入大模型,大模型就能根據(jù)其知識反饋相應結果。當這種智能產生模式廣泛應用,我們或將見證前所未有的大智能時代。
筆者認為,大智能時代區(qū)別于大數(shù)據(jù)時代的核心特征是數(shù)據(jù)與智能的解耦。谷歌常因所謂數(shù)據(jù)網絡效應被反壟斷機構約談:搜索引擎的市場份額越大,用戶數(shù)據(jù)就越多,數(shù)據(jù)訓練出來的機器算法也就越智能,用戶體驗進一步提升,進而獲取更大的市場份額。曾鳴教授更是基于阿里巴巴的類似經驗,提煉出以“數(shù)據(jù)智能”為基石的“智能商業(yè)”方法論。這種思維強調企業(yè)構建的數(shù)據(jù)飛輪是智能商業(yè)的前提:無數(shù)據(jù),不智能。
在大智能時代,這一圭臬在產業(yè)層面仍然成立,但在企業(yè)層面的應用卻值得推敲:智能不再完全來自于企業(yè)自身構建的數(shù)據(jù)飛輪。數(shù)據(jù)作為智能原料的地位無可撼動,然而,大模型使用這種原料的效率遠超過此前分散部署的“小模型”,以至于有志于“智能商業(yè)”的企業(yè)構建自身數(shù)據(jù)飛輪喪失經濟性。國家電網能穩(wěn)定輸出電力時,為何要在工廠旁邊自建小發(fā)電廠呢?
智能基礎設施化的后果之一是數(shù)據(jù)與智能的解耦(見圖1)。數(shù)據(jù)與智能的解耦并不意味著數(shù)據(jù)不重要,而意味著小數(shù)據(jù)也可以撬動大智能。當前,大模型的進一步發(fā)展面臨高質量數(shù)據(jù)源不足的障礙,可見數(shù)據(jù)的重要性。但這不意味著任何企業(yè)都需要花心思囤積數(shù)據(jù)。過去,企業(yè)要精心構建并維護一個數(shù)據(jù)供應鏈,才有可能實現(xiàn)所謂的數(shù)據(jù)智能。而今,大模型使得智能不需要在低水平重復開發(fā)。企業(yè)只需要用小數(shù)據(jù)去微調這個模型,便有可能開展“智能商業(yè)”。由此,企業(yè)可節(jié)省精力聚焦業(yè)務創(chuàng)新,釋放出所謂——智能紅利。
生成式AI產業(yè)生態(tài)的三大維度
立足當下,本部分嘗試從三個視角來把握高度動態(tài)復雜的生成式AI產業(yè)生態(tài)。一是供給側視角的技術生態(tài),有助于理解生成式AI技術實現(xiàn)所需的生產要素;二是需求側視角的應用生態(tài),有助于了解生成式AI的應用方向;三是中美競爭背景下的區(qū)域生態(tài),有助于理解需求側和供給側在不同條件下的互動模式。
生成式AI技術生態(tài)
大模型技術生態(tài)符合典型的IT垂直分工架構。最底層是基礎設施,負責提供大模型訓練以及推理所需的算力。產業(yè)初期,算力主要用于模型預訓練。隨著各大模型紛紛商用,用于響應用戶請求所需的推理算力占比快速增加。眾所周知,大模型的算力需求主要由GPU(圖像處理單元)來滿足,NPU(神經網絡處理器)和TPU(張量處理器)等專為大模型推理運算設計的芯片也逐步成熟。NPU主要用于手機、無人機等終端產品的計算單元,TPU是谷歌設計的云計算芯片。值得注意的是,硬件集群只是基礎設施的一部分,負責硬件資源調度的云平臺也非常重要。
基礎設施之上是大模型。大模型有開源和閉源之分。Open AI的GPT是一個閉源模型,而2023年7月,Meta的Llama II宣布支持開源和商用,引爆了大模型領域的開源運動。選擇開源模型還是閉源模型,似乎和應用有關。chatGPT、Midjourney等廣受歡迎的面向消費(2C)領域的應用都構建在私有大模型之上。但面向企業(yè)(2B)領域的應用通常構建在開源大模型之上,因為開源大模型支持私有化部署,并在微調方面提供了更大的靈活度。
值得指出的是,大模型層與應用層之間存在一個中間層,旨在幫助應用開發(fā)者解決兩方面問題。一方面,基于大模型做二次開發(fā) (微調、提示詞工程或基于人工反饋的增強學習)需要一系列工具或模板;另一方面,由于市面上存在多種大模型,應用開發(fā)者可能希望一站式接入和管理。所謂MaaS(模型即服務)集成了這些工具和功能。
大模型應用生態(tài)
技術生態(tài)主要是巨頭和工程師的場域,應用生態(tài)則是創(chuàng)業(yè)者和產品經理的沃土。在技術生態(tài)部分,應用層在技術堆棧中的位置得到了強調。本部分談及的應用生態(tài)從需求側視角展開,根本上是要回答大模型如何對接應用場景、創(chuàng)造用戶價值。這個問題可以沿著兩個維度思考:客戶屬性和產品策略。
一方面,2C領域和2B領域的大模型應用在價值創(chuàng)造方面具有顯著差異。首先,消費類應用的價值創(chuàng)造幾乎都在應用內完成,而企業(yè)級應用需要與企業(yè)內部價值鏈和IT系統(tǒng)整合。其次,消費類應用幾乎都基于公有云,而企業(yè)客戶因隱私顧慮偏好私有云或混合云部署。最后,消費類應用通常以一對多的方式提供服務進而迅速規(guī)?;髽I(yè)級應用服務通常需要一對一定制。以上2C和2B客戶市場的一般性差異,并不因大模型技術的開創(chuàng)性而改變。可見,2C應用的價值創(chuàng)造具備獨立性,而2B應用的價值創(chuàng)造高度依賴其他互補性資源。進而,2C應用有望構建出一個以自身為中心的生態(tài),而2B應用通常嵌入在位玩家(包括客戶)的生態(tài)中。
另一方面,無論是2B還是2C,大模型應用可考慮增強、替代或整合三種策略。增強策略為現(xiàn)有產品或服務加入大模型性能,進一步提升產品體驗。比如,Office產品中嵌入了基于大模型輔助工具(Copilot)或者視頻游戲中引入大模型生成個性化劇情。替代策略則把大模型應用作為生產力工具替代原有的低效流程。比如,在客服行業(yè),替代正在大規(guī)模發(fā)生,一部分營銷設計工作也有望在大模型的支撐下實現(xiàn)自動化。相較于增強現(xiàn)有產品和替代低效流程,整合策略跳出了現(xiàn)有產品或流程,重新定義客戶體驗。筆者避免使用顛覆一詞,因為這種重新定義很大程度上是基于重組現(xiàn)有要素發(fā)生的。大模型并不創(chuàng)造要素,但提供了高超的整合能力(如通過智能體即Agent進行整合)。
上述兩個相對獨立的維度可以構建出一個2X3的矩陣。這個矩陣中的一些格子看起來比另外一些格子更令人興奮。但一個機會令人興奮的程度,通常與其進入門檻成正比,與最終勝出的概率成反比。最終,這個矩陣會被具有不同資源稟賦和風險偏好的創(chuàng)新者(或創(chuàng)新采納者)所填滿,構成一個復雜而多元的大模型應用生態(tài)。
生成式AI的區(qū)域生態(tài)
產業(yè)不可避免地嵌入在區(qū)域中??v觀全球,生成式AI的產業(yè)競爭主要在中美之間開展。對于中美AI產業(yè)的一般性對比分析不是本文的重點。本文主要關注的是兩國區(qū)域條件的差異如何影響技術生態(tài)、應用生態(tài)以及兩者之間的良性反饋。
靜態(tài)對比,中美兩國在技術生態(tài)方面的差距并不致命。誠然,美國在聚集、培養(yǎng)生成式AI技術人才方面具有顯著優(yōu)勢。并且,GPU出口管制在很大程度上也增加了中國企業(yè)的成本,但同時要看到我國有三個方面的有利因素。第一,得益于開源運動的知識溢出效應,中美技術差距并沒有大到足以阻礙中國的產業(yè)進步;第二,中國企業(yè)對開源的貢獻也日益顯著,中國也吸引了一些頂級科學家回國創(chuàng)業(yè);第三,盲目的科技軍備競賽并不可取,大模型產業(yè)競爭的焦點已轉向工程化和商業(yè)化。
令人擔憂的反倒是中美應用生態(tài)的差距。高科技產業(yè)的發(fā)展,短期內可以靠資本維系,長期則需要靠市場來支付發(fā)展所需的成本,包括消費者側和企業(yè)側的支付。然而,中國消費者的付費能力遠不如美國消費者。中國移動通信用戶的月均支出約為50元,美國約為50美元,但中國企業(yè)購買GPU的成本要高于美國企業(yè)。在2B市場,先不論支付能力,中國企業(yè)數(shù)字化水平低首先就是一個大問題,尤其體現(xiàn)在SaaS(軟件即服務)的低滲透率上。大模型應用更容易部署到SaaS化程度較高的企業(yè),因其底層數(shù)據(jù)治理較規(guī)范,流程標準化程度較高。SaaS化程度不高的企業(yè)需花費大量時間、精力和資源去做前期準備,這會導致大部分企業(yè)淺嘗輒止或望而卻步。
值得強調的是,中國在移動互聯(lián)網時代的“場景優(yōu)勢”在生成式AI產業(yè)是不成立的。場景優(yōu)勢建立在迭代之上,而迭代的前提是發(fā)展用戶??v觀所有國內大模型企業(yè),沒有一家像推廣移動互聯(lián)網應用程序那樣去不遺余力發(fā)展用戶。關鍵原因在于,移動互聯(lián)網應用程序服務一個新用戶的邊際成本幾乎為零,而大模型應用發(fā)展一個用戶的邊際成本恒不為零。在商業(yè)模式清晰之前,地主家也沒余糧這么燒。
如果說中國移動互聯(lián)網的成功經驗之一在于前端場景優(yōu)勢與后端技術進步的正反饋,筆者擔心中國生成式AI產業(yè)正在經歷一個截然相反的過程。從這個動態(tài)視角再去看待中美之間技術生態(tài)的差距,恐怕會得到與靜態(tài)對比不同的結論。
幾點思考與建議
據(jù)說,人們容易高估一件事的短期影響但低估其長期潛力。關于生成式AI產業(yè),本文的觀點恰好相反:筆者長期看好其作為智能基礎設施的前途,但短期內對其結構性障礙持悲觀態(tài)度。前文沒有論述中美生成式AI產業(yè)發(fā)展面臨的共性挑戰(zhàn),而是聚焦中國相對于美國的比較劣勢。那么,中國有沒有比較優(yōu)勢呢?筆者相信,發(fā)揮以下三方面的比較優(yōu)勢或有助于彌補劣勢:移動互聯(lián)網生態(tài)、產業(yè)協(xié)同治理和商業(yè)模式創(chuàng)新。
一是打通移動互聯(lián)網生態(tài)與生成式AI產業(yè)生態(tài)。我國移動互聯(lián)網產業(yè)在網絡、終端與應用環(huán)節(jié)具備端到端的競爭優(yōu)勢,有望加持孱弱的2C生成式AI應用生態(tài)。比如,微信生態(tài)如何引入生成式AI、國產手機操作系統(tǒng)如何與生成式AI融合、云網一體如何助力AI算力網絡效率提升等議題都應沿著如何利用業(yè)已建立的比較優(yōu)勢去哺育生成式AI產業(yè)的思路去思考。
二是推動智能產業(yè)群協(xié)同發(fā)展。智能基礎設施的建設需要整合算法、算力和數(shù)據(jù)等要素,是數(shù)字基礎設施和數(shù)字資源體系的有機融合和升級。支持數(shù)字基礎設施運營企業(yè)向智能基礎設施運營企業(yè)升級,實施算力、數(shù)據(jù)、算法的一體化運營。在需求側,通過降低各行業(yè)使用生成式AI的成本,拉動應用、工程、運營等配套服務的發(fā)展。
三是堅定鼓勵商業(yè)模式創(chuàng)新。生成式AI產業(yè)面臨的問題歸根到底是價值創(chuàng)造和價值分配的問題,即商業(yè)模式。無論是打通移動互聯(lián)網生態(tài)還是推動產業(yè)協(xié)同發(fā)展,都旨在為生成式AI生態(tài)的發(fā)展創(chuàng)造一個更廣闊的環(huán)境和更堅實的基礎。這些比較優(yōu)勢能否有效轉化并彌補上述比較劣勢,商業(yè)模式起決定性作用。