對于汽車的定義,不同的時代有不同的理解。
在汽車尚未普及的時代,李書福說“汽車就是四個輪子加一個沙發(fā)”,而如今,在AI等技術的加持下,汽車正成為繼手機之后下一個超級移動終端,用地平線創(chuàng)始人余凱的話說,現(xiàn)在的車就是“四個輪子上的超級計算中心”。
而要打造一臺行駛中的超級計算機,以此實現(xiàn)更強的智能駕駛能力,難度可想而知。
其中的關鍵就在于對于數(shù)據(jù)的利用,包括收集、存儲、標準、計算以及過程中的合規(guī)要求等等,而要建立這樣一個高效的數(shù)據(jù)運維體系,絕不是車企單打獨斗就可以實現(xiàn)的。
跨越鴻溝的隱秘代價
智能電動汽車的重心,正在加速倒向智能,尤其是智能駕駛。
當智能汽車開得越來越溜,能夠妥善處理更多復雜場景,它將贏得消費者更多的信任。來自一線銷售的反饋顯示,智能駕駛在影響消費者購車決策中的排名迅速上升,正在從錦上添花型需求轉向剛需。中信證券預計,L2+智能駕駛滲透率有望在今年達到8%。這意味著,作為一項創(chuàng)新技術,高階智能駕駛即將步入“跨越鴻溝”的階段——如果跨越不了,便化為一場泡沫;要是跨過去了,則能實現(xiàn)商業(yè)閉環(huán),成長為一項改變世界的重大技術。

而智駕跨越鴻溝實現(xiàn)商業(yè)閉環(huán)的前提是,實現(xiàn)數(shù)據(jù)閉環(huán),讓智能駕駛汽車從海量的數(shù)據(jù)中不斷地學習、持續(xù)增強能力。
不過絕大多數(shù)消費者不了解,甚至一部分車企業(yè)也沒意識到的一點是,數(shù)據(jù)閉環(huán)的門檻,其實并不比造車低。這是一個涉及環(huán)節(jié)眾多,所需資源甚廣的苦活累活,不僅僅需要車端研發(fā),更需要巨額的云端投入。
一般來說,智能駕駛數(shù)據(jù)閉環(huán)分為幾個環(huán)節(jié):數(shù)據(jù)在車端篩選采集后,傳輸并存儲在云端超算中心,而后數(shù)據(jù)會被標注,作為養(yǎng)料供算法模型訓練。算法模型訓練完成后,通常會進行仿真、驗證,檢驗訓練效果,最后再通過OTA,更新車端智駕算法。

在其中僅車端數(shù)據(jù)采集環(huán)節(jié),就需要解決數(shù)據(jù)合規(guī)、場景挖掘、計算資源調度等問題,需要一支專門團隊負責。而到了云端,資源的消耗更呈指數(shù)級增加。
比如特斯拉在車隊收集了數(shù)十億公里智能駕駛里程后,為了妥善利用數(shù)據(jù),決定自研單體計算能力達1 EFlops(每秒一百億億次浮點運算)的Dojo超算。
為此,特斯拉啟用了大量新芯片工藝、帶寬技術、供能/散熱技術,但代價不僅是技術不成熟屢次跳票,而且成本高、先期投入巨大。在2024年前,DOJO超算的搭建預計會消耗10億美元投資。
放眼到整個汽車行業(yè),能像特斯拉這樣財大氣粗的車企屈指可數(shù)。一方面,主機廠如今身負重任,一邊造車、一邊開發(fā)軟件算法已經是殫精竭慮、砸鍋賣鐵;另一方面,車市步入存量市場,價格戰(zhàn)導致的普遍低毛利,也在蠶食著主機廠的現(xiàn)金流。
手中沒啥余糧的車企,很難再獨力承擔云端設施的構建,迫切需要一種輕資產的模式實現(xiàn)智能駕駛數(shù)據(jù)閉環(huán)。與云服務商深入合作,便成為車企跨越智駕鴻溝的必經之路。
智能汽車的超級基建
今年初,伴隨著ChatGPT的大火,一段佳話也隨之流傳開:出于對OpenAI的信任,微軟不惜砍掉了自家部門的一部分研發(fā)資源,從其Azure云中騰出了上萬塊GPU訓練GPT3.5,促成了ChatGPT的騰飛。
這顯然給車企們生動地上了一課:云端算力的力大磚飛,是當下發(fā)展AI的“正確姿勢”。
于是,車企們還沒治好兩年前患上的車端算力饑渴癥,就又患上了云端算力焦慮癥。多家國內車企聯(lián)合云計算大廠進行“算力基建”,將云端算力儲備提升到了數(shù)百甚至上千PFlops(1PFlops即每秒浮點運算一千萬億次)。
擁有自主創(chuàng)新的云端訓練、在國內汽車云市場份額第一的華為也不落于人后。 7月7日, 華為云2000 PFlops單集群的昇騰AI云服務在烏蘭察布上線,將智駕云端算力的“基本計量單位”提升到了EFlops(1 EFlops=1000 PFlops,每秒一百億億次浮點運算)級。
不過,車企需要的汽車云,算力其實只是基礎。一朵能幫助車企建設、迭代智駕能力的智駕云,不僅應該是算力怪獸,也要同時滿足安全合規(guī)、降本增效、服務全面。

過去,車企對較敏感數(shù)據(jù)的上云多采用私有云,但它不能完全滿足智能駕駛的需求。
一方面,智能駕駛在法理上受《測繪法》約束,有更嚴苛的合規(guī)需求;另一方面智駕的數(shù)據(jù)量龐大,數(shù)據(jù)形式復雜多樣,涉及利益方更多,而智駕又處在劇變的關鍵節(jié)點,安全穩(wěn)定至關重要,因此適合專云專用。
以華為為例,7月21日華為云推出烏蘭察布汽車專區(qū),打造了特定的高性能數(shù)據(jù)中心,建立起更嚴謹?shù)娜謪^(qū)合規(guī)框架,并引入了圖商駐場辦公,讓車企在華為云汽車專區(qū)就能實現(xiàn)快速合規(guī)、全流程合規(guī)。
同時,汽車專區(qū)的多層安全防護體系和運維體系,也能保證云端的算力與服務持續(xù)穩(wěn)定地運行。比如算力2000 PFlops的計算集群,能保持一個月長穩(wěn)率90%狀態(tài)持續(xù)訓練。
而在保證安全合規(guī)的前提下, 行業(yè)一直希望加速智能駕駛的算法訓練。迭代越快越多,能力越強,贏得市場的希望就越大。
但一個常見的現(xiàn)象是:車端數(shù)據(jù)收集能力強大,云端的算法訓練能力強大,但中間的數(shù)據(jù)帶寬、存取、預處理性能卻往往成為瓶頸。
2023年,自動駕駛向云端傳輸?shù)臄?shù)據(jù)可能會達到8000PB,可以塞滿80萬個企業(yè)級硬盤;一次算法訓練的預熱元數(shù)據(jù)量達到10億條,需要4天時間準備。這容易造成算力等數(shù)據(jù)的空轉浪費。
為解決這一瓶頸,華為汽車云啟用了AI云存儲服務,在1000Gbit/s數(shù)據(jù)專線、分級智能存儲、近GPU加速等技術支持下,能夠做到24小時內路采數(shù)據(jù)入云,10億條元數(shù)據(jù)預熱時間降至5小時。
而更智能的云存儲不僅可以實現(xiàn)數(shù)據(jù)存儲20%的降本,它對算法訓練的提速實際上也變相提升了費效比。在特定案例中,華為云最快已經可以支持智能駕駛算法模型的天級更新,單次訓練更新的成本得以降低。
算法訓練的極速狂飆離不開華為云搭建的自動駕駛開發(fā)平臺。傳統(tǒng)上,一家企業(yè)要搭建自己的自動駕駛開發(fā)平臺需要3個月時間,但華為云基于長期服務汽車行業(yè)經驗,本身建立了自動駕駛開發(fā)平臺,不僅可以免除部分基礎工作,還對幾乎每一個環(huán)節(jié)都進行了優(yōu)化加速。
不過,行業(yè)內不同企業(yè)對智駕的投入以及具備的能力有分化,市場上有需求一條龍服務的車企,希望快速建立智駕能力與數(shù)據(jù)閉環(huán);也有希望在某一模塊引入行業(yè)優(yōu)秀方案、與自身能力結合的車企。
在這種背景下,有靈活商業(yè)模式的云服務廠商能夠獲得更多青睞。像華為云,其自動駕駛開發(fā)平臺就提供一站式與模塊式部署兩種方式,由合作伙伴靈活選擇。
由此,智能汽車需要的云,其實要兼顧穩(wěn)、快、全。要滿足這些條件,企業(yè)不僅要做算力基建,也要做軟件基建,還要進行生態(tài)基建,這實質上決定了市場會持續(xù)收斂,只有少數(shù)云計算大廠才能陪車企跨越智駕的鴻溝。
加速智駕的秘密武器
不過,智駕要跨越的鴻溝依然險峻。
今年,智能駕駛迎來了規(guī)?;M城元年,北上廣深的城市高階智駕被相繼點亮,更多二線城市也“開城”在即。但開疆拓土之際,智能駕駛也不可避免地直面長尾困境。
眼下,頭部企業(yè)的城市高階智駕能夠在大部分時間表現(xiàn)順利,一些品牌表示智駕系統(tǒng)已經可以實現(xiàn)數(shù)十公里無接管,僅在少數(shù)時候、少數(shù)場景表現(xiàn)不力——比如在非標準紅綠燈下,智駕車輛可能會誤識別、爆沖。
然而對于大多數(shù)消費者,這些偶發(fā)但可能致命的功能失效,足以摧毀他們的信任。
智駕要跨越鴻溝,必須攻克持續(xù)出現(xiàn)的長尾場景。但這些場景將耗費比以往更多的工程資源,最好的方式是行業(yè)合力突破。
7月21日,在電動汽車百人會牽頭下,華為與合作伙伴發(fā)起了“自動駕駛關鍵技術攻堅倡議活動”,對十大難點技術進行技術攻關。其中引入矚目的一點是,“AI大模型在智能駕駛的應用”。
眼下,國內主流云計算廠商重點發(fā)力的大模型,以語言類大模型為主。但在智能駕駛中,數(shù)據(jù)主要是圖像,語言類大模型很難有效賦能。而在這個月,華為云發(fā)布了盤古大模型3.0,它的特點是能夠將行業(yè)know-how與大模型能力結合,解決細分行業(yè)、細分領域的難題。
在盤古基礎模型之上,華為云提供了豐富的行業(yè)開發(fā)套件。協(xié)助自動駕駛算法公司,陸續(xù)開發(fā)了場景生成大模型,場景理解大模型,預標注大模型,多模態(tài)檢索大模型等場景模型,大大提升了數(shù)據(jù)處理效率。

其中,場景理解大模型與多模態(tài)檢索大模型配合,可以快速挖掘有價值的數(shù)據(jù),加速建立智駕的場景庫;預標注大模型則自動化地對數(shù)據(jù)進行標注,不僅標注速度倍增,標注成本也將比人工標注更低。
而場景生成大模型,則是華為開發(fā)NeRF神經輻射場網絡技術的成果,它能夠以更低的成本、更高的準確度與自由度,對自動駕駛的算法研發(fā)進行仿真,其仿真精度最高可達厘米級,也支持按需編輯場景中的元素。
有了場景生成大模型的支持,車企能夠以假亂真地生成現(xiàn)實中很難收集的罕見場景或者所需的Corner Case,有目的性地、可掌握地定向錘煉智駕算法對長尾場景的應對能力,省錢、省時地提升智駕表現(xiàn)。
為克服大模型訓練難度大、耗時長的問題, 華為云配套了ModelArt AI 三大加速服務,對數(shù)據(jù)加載、模型訓練、模型推理同時加速。受益于此,禾多科技在同華為的合作中,模型訓練速度提升了280%。
尾聲
今年4月,奇績創(chuàng)壇創(chuàng)始人陸奇分享了他的大模型世界觀。在他看來,自動駕駛很可能會是第一項“讓執(zhí)行無處不在”的AGI,將更顯著地改變物理世界。
如今,行業(yè)距離它似乎只差臨門一腳,但實際上又有著極高的勢壘需要逾越。無論如何,這項史無前例的超級工程,必然需要車端與云端,以史無前例的方式緊密配合。