2004年3月13日,在美國莫哈韋沙漠地區(qū)舉行了第一屆自動駕駛汽車比賽——DARPA大挑戰(zhàn)賽(DARPA Grand Challenge)。這是世界上第一個自動駕駛汽車長距離比賽,15支參加決賽的團隊在142英里(約228.5公里)的賽道中展開角逐。
最終,這場比賽沒有完賽者,甚至連接近完成的都也沒有。走得最遠的是卡內(nèi)基梅隆大學(xué)的紅之隊(Red Team),他們用悍馬沙暴(Humvee Sandstorm)行駛了7.4英里(約11.9公里),還不到全程的5%。
但就是這5%的路程,其象征意義非常顯著,可以說一個新的行業(yè)由此而生。
參加過第一屆比賽的Axion團隊軟件負責人梅蘭妮·杜馬斯·格林(Melanie Dumas Grimm)說:“這是從學(xué)術(shù)論文到走向?qū)嶋H應(yīng)用的第一步的轉(zhuǎn)折點,將被載入史冊。”
她自己也在這次比賽之后,成為了Waymo技術(shù)項目經(jīng)理,幫助該公司在鳳凰城、舊金山和洛杉磯等大都市部署Robotaxi。
曾擔任谷歌街景和自動駕駛汽車項目的高管,又在2018年擔任了自動駕駛礦用卡車初創(chuàng)公司Pronto首席執(zhí)行官和聯(lián)合創(chuàng)始人的安東尼·萊萬多夫斯基(Anthony Levandowski)也是首屆DARPA大挑戰(zhàn)賽的參賽者,那年他只有23歲。
他回憶說:“就像生活中的大多數(shù)事情一樣,第一次嘗試就做對的問題很難。沒有人贏得比賽,讓每個人都有信心可以再來一次,這讓人們更加磨煉了堅持不懈與不斷磨煉的品質(zhì)。”
馭勢科技CEO吳甘沙曾見證了2005年第二屆DARPA大挑戰(zhàn)賽,彼時他任職的英特爾公司直接贊助了卡耐基梅隆“紅之隊”,隨后又派了一支團隊加入到斯坦福斯坦利車的課題組。
這次挑戰(zhàn)賽的過程是“紅之隊”一路領(lǐng)先,但到中后程被斯坦利超越。英特爾參與的兩個車隊最終奪得了前兩名。
那是吳甘沙第一次接觸自動駕駛,他回憶說:“感覺當汽車變成無人駕駛時,每一塊平面、每一個空間、每一個功能都值得重新設(shè)計。”
而“紅之隊”的失敗讓他有了敬畏之心,認識到再牛的團隊、再高大上的自動駕駛,也受制于木桶原理,即使一個普通得不能再普通的零部件失效,也會讓自動駕駛一文不值。
DARPA大挑戰(zhàn)賽就像一個大樹,后來無數(shù)自動駕駛?cè)瞬哦际窃谶@里開枝散葉出來,又落到各個公司,谷歌、優(yōu)步、通用、福特等等,成為了培育一批又一批自動駕駛骨干的搖籃。
困境與瓶頸
在2009年Google X實驗室啟動自動駕駛項目后,硅谷涌現(xiàn)了一批自動駕駛初創(chuàng)企業(yè),也吸引大批風險投資和高科技人才匯聚于此。此后的十來年里,自動駕駛在巨量資金和大批頂尖人才的支持下,獲得了長足的發(fā)展。
隨著全球疫情肆虐,經(jīng)濟下行,自動駕駛行業(yè)也遭受頗多挫折:技術(shù)進展變緩、商業(yè)化落地艱難、投資人信心匱乏,這導(dǎo)致大批海外明星創(chuàng)業(yè)企業(yè)倒閉、上市公司合并、融資難以為繼。
今天,硅谷自動駕駛初創(chuàng)公司的高管們依然堅信,這項新興技術(shù)可以重新詮釋傳統(tǒng)的駕駛和移動方式。相比于美國每年近4.3萬人死于道路交通事故的現(xiàn)狀,自動駕駛系統(tǒng)將大幅提高安全性。
然而,麥肯錫公司(McKinsey & Co.)估計,盡管自動駕駛技術(shù)已經(jīng)投入了2040億美元,但如今的美國道路死亡人數(shù)幾乎與以前相同,而自動駕駛車輛廣泛普及、能夠行駛到任何公共道路可以到達的地方的承諾仍然難以實現(xiàn)。
對于近期自動駕駛遭到的冷遇,吳甘沙認為,科技的熱點是一直在變化的。能長期活得好的公司,不在于它抓住了一個熱點,而是它能抓住一連串的熱點。
任何一個長賽道的方向,一定不會一直在熱點上,而有很長的時間是在水下,參與者必須得不停地撲騰,去調(diào)整呼吸,才能活下去。其實自動駕駛已經(jīng)維持了五六年的熱點,現(xiàn)在肯定是在波谷,等到下一波波峰來了,它又會熱起來,沒準到那個時候可能大模型不熱了,又會有新的技術(shù)站出來。
對于融資困難,他認為,如果說一個初創(chuàng)企業(yè)估值不是高得離譜,同時業(yè)務(wù)又在快速發(fā)展,利潤現(xiàn)金流在不斷改善,在所處領(lǐng)域又具備壟斷性的領(lǐng)先優(yōu)勢,這些企業(yè)融到錢應(yīng)該不是問題。
輕舟智航CEO于騫則認為,現(xiàn)階段的核心問題還是在技術(shù)本身的突破,包括自動駕駛冰山以下的感知、規(guī)控等算法模型、數(shù)據(jù)閉環(huán)技術(shù)本身和研發(fā)范式的突破仍然是關(guān)鍵。數(shù)據(jù)怎么樣能很好地流轉(zhuǎn)起來,怎么樣更好地管理,把它做篩選、標注、訓(xùn)練以及大規(guī)模仿真的驗證,實現(xiàn)高效的數(shù)據(jù)閉環(huán),對于自動駕駛大范圍普及是非常關(guān)鍵的。
從成本角度看,實現(xiàn)高階自動駕駛所需車載傳感器的數(shù)量顯著增加,這些硬件最終都會體現(xiàn)在成本上。除了技術(shù)層面的瓶頸,法規(guī)和市場接受度也是自動駕駛商業(yè)化需要面對的挑戰(zhàn)。
因此,自動駕駛商業(yè)化需要政府、企業(yè)、科研機構(gòu)等多方共同努力,從政策、技術(shù)、市場等多個角度入手,推動自動駕駛技術(shù)的研發(fā)和應(yīng)用。
馬拉松和拳擊賽
波士頓咨詢集團(Boston Consulting Group)移動創(chuàng)新中心(Center for Mobility Innovation)聯(lián)合負責人奧古斯丁·魏格謝德(Augustin Wegscheider)仍然看好自動駕駛的未來,但他不再將發(fā)展與時間表掛鉤。
他說:“更明智的選擇是,我們只把它稱為‘未來’。”“描述大規(guī)模的場景,比準確說出它何時會發(fā)生要容易得多。”
其實,早在第一次DARPA大挑戰(zhàn)賽活動舉行時,就有人看出自動駕駛乘用車將面臨著艱難的發(fā)展過程。
“紅之隊”的領(lǐng)導(dǎo)者卡內(nèi)基梅隆大學(xué)機器人專家威廉·惠特克(William Whittaker)教授說,第一次大賽中車輛缺乏一致性,讓比賽感覺像是“星際迷航中的酒吧場景”。
曾有業(yè)界人士把自動駕駛比作攀登珠峰,一條路線是從尼泊爾出發(fā)的南坡,相對稍微平緩;另一條路線是從西藏出發(fā)的北坡,更為陡峭、崎嶇。
對應(yīng)著自動駕駛行業(yè)的兩條大的研發(fā)路徑:一條是以車企為主的漸進式策略,一般從L2開始,再逐步疊加高階功能;另一條是以科技互聯(lián)網(wǎng)企業(yè)為代表的跨越式策略,直接從L4、L5開始研發(fā)。而它們最終的目標都是登頂自動駕駛的頂峰——無人駕駛。
以Waymo為代表的“北坡”路線,即使Waymo有非常多的資源,很強大的技術(shù)實力,也難以突破北坡。相反,以特斯拉為代表的“南坡”漸進式路線從L2入手,通過輸出階段性的智駕產(chǎn)品為下一代產(chǎn)品積累數(shù)據(jù),迭代性的獲得盈利的同時,逐步上攻。這似乎讓所有人都看到了一條最終通往自動駕駛的可行路徑。
而漸進路線要滿足兩個要求,首先能商業(yè)化,有造血能力,養(yǎng)活自己,而不是長期靠風投來買單,其次是能不斷成長、到達終局。
吳甘沙將當下的自動駕駛發(fā)展總結(jié)為四點:
首先,他相信自動駕駛是一個解決了億萬人痛點,同時又具備萬億級規(guī)模的市場,所以毫無疑問還是一個非常理想的創(chuàng)業(yè)方向。
其次,現(xiàn)在自動駕駛行業(yè)目前是處在低谷當中,亟待技術(shù)突破和商業(yè)閉環(huán)的形成。
第三,自動駕駛的難是來源于它的本質(zhì),也就是99分等于0分,最后那一分可能是需要99%的時間和精力,所以自動駕駛一定是持久戰(zhàn),而正因為是持久戰(zhàn),創(chuàng)業(yè)公司才有生存機會。
第四,創(chuàng)業(yè)公司的發(fā)展一定要選用漸進式的技術(shù)路線和沿途下蛋的商業(yè)路線。
“自動駕駛是一個長賽道,參與者既要學(xué)會馬拉松,也要學(xué)會打拳擊賽。馬拉松能夠讓你一直跑下去,拳擊賽能夠讓你在終局時能有核心競爭力。”吳甘沙說。
因此,從創(chuàng)業(yè)公司的角度來說,得把戰(zhàn)略想清楚,找到合適的切入點,尋找那些既在巨頭的射程之外,又真正能為客戶解決高頻剛需問題的市場,只有這樣,才能夠有足夠的利潤支撐企業(yè)堅持下去。
佑駕創(chuàng)新公司CEO劉國清博士認為,如果自動駕駛的商業(yè)化進程和技術(shù)等級對應(yīng),漸進式地“沿途下蛋”,瓶頸不會很顯著。如今消費者越來越重視車輛中的智駕功能,恰恰證明了其商業(yè)化前景之廣闊。
他說:“L4、L5自動駕駛大規(guī)模商業(yè)化還須一段時間,我們看到國外的一批自動駕駛公司,熱度也不同程度的冷卻下來。這其中技術(shù)的成熟度只是一方面,我認為更關(guān)鍵的在于挖掘需求。如果沒有需求、或者是偽需求,就無法建立可持續(xù)的商業(yè)模式。”
大模型是新希望嗎
在吳甘沙看來,大模型技術(shù)對于未來自動駕駛走到終局,肯定是一個很重要的方向。
首先,大模型加深了對環(huán)境的理解。因為今天的自動駕駛其實本質(zhì)上還只做到了在場景里面確保不撞,但是缺乏對于場景的深刻理解能力,缺乏對于與其他的交通參與者的人性化互動。
第二,現(xiàn)在自動駕駛之所以這么累,因為它不收斂,永遠有沒見過的問題暴露出來。本質(zhì)上就是人工智能沒有出現(xiàn)涌現(xiàn)式的躍遷。這是因為今天車端能跑的算法,參數(shù)規(guī)模可能只有幾千萬或者是上億,而參數(shù)規(guī)模的局限,導(dǎo)致了它不可能具備涌現(xiàn)的能力,所以永遠不會收斂。如果車端處理的參數(shù)規(guī)模能達到10億級別,它的模型就會具備涌現(xiàn)躍遷的能力,也就能更快地接近終局了。
他認為,大模型其實已經(jīng)在一些方面起作用了:從短期來看,如果數(shù)據(jù)少,缺乏Corner case,大模型可以幫你生成;如果數(shù)據(jù)多,人來不及標注時,它能夠幫你標注;它還能通過知識的蒸餾,把大模型里面的知識變成一個車端能跑的小模型等。從中長期看,一是它將具備世界模型能力,對世界有更好的理解;二是它會實現(xiàn)涌現(xiàn)躍遷,解決一直不收斂的問題。
于騫也表示,首先,現(xiàn)在技術(shù)發(fā)展方向正在朝向數(shù)據(jù)定義階段發(fā)展,算法模型需要具備強大的數(shù)據(jù)學(xué)習(xí)和場景泛化能力,有效解決各類Corner Case。所以,未來幾年,智能駕駛更大的價值來自于數(shù)據(jù)。輕舟的研發(fā)范式也在從以模型為中心轉(zhuǎn)向以數(shù)據(jù)為中心。
最近端到端在國內(nèi)掀起新一輪技術(shù)革新風暴,成為智能駕駛技術(shù)競爭的全新制高點。一旦進入這個階段,輸入信號完全是原始的傳感器的信息,輸出就是轉(zhuǎn)向、剎車、油門這樣的控制命令,數(shù)據(jù)的重要性越來越大。尤其是AGI(Artificial General Intelligence,通用人工智能 )時代出現(xiàn)后,在數(shù)據(jù)規(guī)模方面,模型相比數(shù)據(jù)規(guī)模來講的重要性變得越來越小。
其次,生成式AI技術(shù)展現(xiàn)出了巨大的潛力。自動駕駛需要大量數(shù)據(jù)支持算法模型的訓(xùn)練,以適應(yīng)各種駕駛場景和復(fù)雜路況。然而,傳統(tǒng)的數(shù)據(jù)采集方法可能受限于實際道路條件和安全問題,無法獲取到大量多樣化的數(shù)據(jù)。生成式AI能夠生成肉眼無法分辨真假的圖像,為模型訓(xùn)練提供高質(zhì)量合成數(shù)據(jù),從而破解自動駕駛數(shù)據(jù)和測試難題。
從事AI研究20余年的瑞因凡(上海)智能科技有限公司聯(lián)合創(chuàng)始人、CEO韓東告訴汽車商業(yè)評論,大模型或者說生成式AI,對于自動駕駛肯定是有很大的推進作用,也是目前能看到的未來真正到達L5的唯一可能性。
但這不代表現(xiàn)在離這個目標很近,因為完全自動駕駛L5趨近于AGI。他認為,最終完全的自動駕駛不意味100%的安全,因為任何交通工具出行都有出事的概率。只要概率低到讓你覺得這是一個不可能碰上的小概率,其實大家就已經(jīng)無所謂了。
他覺得,現(xiàn)在類似GPT-4這種通用大模型,還在不斷迭代當中。假設(shè)算力不是瓶頸,做推理的速度足夠快,車端側(cè)變得可用,遇到任何路況,系統(tǒng)立刻就可以做出很正確的反應(yīng),還足夠便宜,那就可以實現(xiàn)自動駕駛了。但現(xiàn)在實現(xiàn)不了,主要因為使用大模型進行推理太貴。
比如說馬斯克的xAI公司最近剛剛開源的大模型Grok-1,擁有3140億參數(shù),是迄今為止參數(shù)量最大的開源大語言模型。如果你要把它跑起來,可能就要四五張英偉達A100 GPU,而一張A100售價就接近10萬元人民幣,很顯然這在車端不現(xiàn)實的。所以未來怎么樣讓車側(cè)的模型變得更小,更容易去做推理,更便宜更快,才是實現(xiàn)完全的自動駕駛的過程。
至于車端大模型需要多大的參數(shù)規(guī)模,他現(xiàn)在不太敢判斷,因為大家對于這種多模態(tài)模型的參數(shù)規(guī)模,并沒有一個特別清晰的認知。L5什么時間到達也比較難說,如果技術(shù)足夠成熟,安全性足夠高,他覺得應(yīng)該是10年到20年之內(nèi)的事情。
劉國清猜測,自動駕駛突破的關(guān)隘,不在是不是有另一項新技術(shù),而是在基礎(chǔ)設(shè)施和能源上。比如AI大模型的背后是巨大的算力,支持算力的是大量消耗的電力。“自動駕駛目前的車載算力也越來越大,可以預(yù)見的是,越往L5走、或者從車端到路端、從車端到云端……我們需要的算力也越來越大,因此需要巨量的計算技術(shù)設(shè)施和能源的支持。”他說。
曙光在哪兒初現(xiàn)
從行業(yè)的發(fā)展來看,汽車并不是DARPA大挑戰(zhàn)賽催生的唯一業(yè)務(wù)。按自動駕駛的發(fā)展來看,該賽事的血統(tǒng)跨越航空航天、采礦、農(nóng)業(yè)、卡車運輸、拖拉和其他領(lǐng)域,總價值達數(shù)百億美元。
農(nóng)業(yè)成為惠特克教授預(yù)見到的明確用例。現(xiàn)年75歲的惠特克在家鄉(xiāng)賓夕法尼亞州霍利迪斯堡附近的一個農(nóng)場里,一邊開發(fā)農(nóng)業(yè)機器人,一邊研究太空探索機器人,仍然激情澎湃。
根據(jù)市場研究公司Grand View Research的數(shù)據(jù),去年農(nóng)業(yè)機器人市場估計為115億美元,預(yù)計到2030年將以20.6%的年增長率增長。農(nóng)業(yè)巨頭約翰·迪爾(John Deere)提供一套自動化拖拉機選項,并把全自動拖拉機宣傳為“額外工人”,“從不遲到”,也不介意“通宵工作”。
采礦也是自動化駕駛系統(tǒng)的第一波實際應(yīng)用。去年8月,沃爾沃自動駕駛解決方案取得了里程碑式的進展,從挪威Velfjord的Bronnoy Kalk礦山拖運石灰石的7輛卡車上撤下了人類安全駕駛員。Grand View Research估計,到2023年,全球采礦自動化市場的價值超過50億美元。
據(jù)吳甘沙介紹,馭勢科技在機場和工廠的無人駕駛已經(jīng)實現(xiàn)了商業(yè)化的應(yīng)用。目前香港機場已累計投入50余臺馭勢科技無人駕駛車輛,已實現(xiàn)超過1000天的完全無人駕駛常態(tài)化運營,為機場提供全天候的無人物流和接駁服務(wù)。他認為,像在機場的自動駕駛應(yīng)用,現(xiàn)在還是溫和增長,但快的話2026年,慢的話可能2027年、2028年就要進入爆發(fā)的轉(zhuǎn)折點了。
他認為,自動駕駛的發(fā)展,要取決于幾件事:第一是技術(shù)靠譜,從技術(shù)上保障安全可靠的運營,不能按照平均值來去做技術(shù),而是要考慮到最復(fù)雜的場景;第二,需求必須是高頻剛需,提升利用率,可以替代人類司機;第三是賬要算得過來,也就是讓客戶省錢,讓自動駕駛企業(yè)賺錢。
于騫表示,2024年被認為是智能駕駛大年,是從電動化向智能化發(fā)展的關(guān)鍵時期。在大規(guī)模前裝量產(chǎn)領(lǐng)域,沿著“南坡”路線的漸進式模式,L2++級高階輔助駕駛會從高速NOA到城市NOA逐步普及。城市NOA是輔助駕駛的天花板也是無人駕駛的入門檻。
另一條沿著“北坡”路線的L4自動駕駛領(lǐng)域,自動駕駛的規(guī)模化應(yīng)用遵循從簡單場景到復(fù)雜場景,從低速場景到高速場景,從載貨到載人的原則。可能會最先在園區(qū)接駁、安防巡邏、物流配送、環(huán)衛(wèi)作業(yè)、公交、港口碼頭、智能礦山、無人零售等領(lǐng)域開展應(yīng)用普及,目前已經(jīng)在逐步走向商業(yè)化試點運營。
其中,自動駕駛公交不僅限于交通出行,而且可以成為連接乘客、交通與服務(wù)的智能體。自動駕駛小巴是中低速場景,乘客對車速的預(yù)期可控;走固定路線,更能確保行駛安全;多人出行,具有社會效益,有望成為公開道路上的L4自動駕駛最快實際落地場景。
在劉國清看來,如果從Gartner曲線的階段來看,自動駕駛目前已經(jīng)處于爬坡期,正在往成熟期進發(fā)。技術(shù)層面,BEV+Transformer將自動駕駛技術(shù)提升到新的高度,實現(xiàn)感知與決策一體化。市場層面,消費者認知和需求也在爆發(fā)。L3及以下的技術(shù)目前已經(jīng)規(guī)模化應(yīng)用在車輛上,L2功能更是幾乎成為新造車勢力的標配。而Robo-Taxi等L4業(yè)務(wù)也在多個城市落地開花。
從趨勢看,汽車消費市場里低階自動駕駛已經(jīng)開始普及了。在生活場景下,它能改變?nèi)藗兊鸟{乘體驗;而在生產(chǎn)場景下,自動駕駛?cè)绻艹蔀樯a(chǎn)工具,或者促進生產(chǎn)效率,也是會率先普及的。比如在限定區(qū)域內(nèi)的客運接駁、干線物流、最后一公里配送等等。