在一路高歌猛進之后,大模型最近似乎有點累了。scaling law驅動的參數(shù)上升斜度呈現(xiàn)出趨緩跡象,訓練與推理的價格戰(zhàn)也如火如荼,技術創(chuàng)新的狂熱期也許臨近尾聲。
率先提出“技術成熟度”曲線的Jackie Fenn曾指出,創(chuàng)新活動受人的本性和技術演進的內在規(guī)律雙重影響——鐘形曲線描述炒作的影響,S形曲線反映技術發(fā)展軌跡,二者相互作用不斷將創(chuàng)新推向“命運的岔路口”。
當下,大模型正處于這樣的節(jié)點。伴隨鋪天蓋地的炒作告一段落,大模型前行的路口上掛著五花八門的標識:選擇開源還是閉源,主攻ToC抑或ToB,繼續(xù)“卷”技術參數(shù)與拼命降使用門檻哪個優(yōu)先,追逐通用智能的夢想和扎根行業(yè)場景的實踐到底能否“兼容”?
這些問題都沒有標準答案,此刻的抉擇需要大智慧。曾多次面臨戰(zhàn)略決策考驗的“經(jīng)營之神”稻盛和夫給出的建議是,“堅持做難而正確的事”。在大模型領域,其實也有上述理念的踐行者,盤古大模型就是選擇“難而正確”道路的典型代表。
所謂“正確”是指能準確判斷大模型在復雜內外部環(huán)境下亟待解決的主要矛盾,認識到由千行萬業(yè)組成的ToB市場才是大模型施展身手的主賽道;而“難”則是指行業(yè)智能化轉型水深浪大,在復雜、多元的應用場景謀求突破,將大模型的技術創(chuàng)新能力真正轉化為新質生產(chǎn)力,可謂任重而道遠。
華為常務董事、華為云CEO張平安一旦踏上這條路,就不會停下腳步。在華為開發(fā)者大會2024(HDC 2024)舉辦期間,華為云重磅發(fā)布盤古大模型5.0,在全系列、多模態(tài)、強思維三方面帶來全新升級,并推出大模型混合云十大創(chuàng)新技術,為大模型在行業(yè)市場加速落地注入澎湃動力。尤值一提的是,盤古大模型積極應對傳統(tǒng)和新興行業(yè)場景的各類高難度挑戰(zhàn),在“難而正確”的路上樹立起一座座里程碑。

從某種意義上講,“難”是“五彩斑斕的黑”,其總是轉化為不同維度或系數(shù)的障礙。盤古大模型跨越“欄桿”的方法與路徑,值得業(yè)界借鑒。
高復雜性的“難”:大模型如何破解“薛定諤的貓”
事實上,很多行業(yè)場景相當于一個復雜系統(tǒng),其中的變量眾多且關系錯綜,難以用線性的推理找到解決方案。在打開“盒子”之前,里面的“貓”可能處在“生死疊加”的未知狀態(tài),這對大模型的算法和精度提出前所未有的要求。
在鋼鐵行業(yè),高爐被稱作AI落地最難的應用場景。其一,高爐是個5000m3的高溫超大黑箱反應器,固液氣三相并存,物理化學變化繁多;其二,高爐煉鐵過程涉及的變量類型混雜,變量之間有多重相關性;其三,只能通過外部傳感器間接感知爐內變化,數(shù)據(jù)采集存在較大誤差;其四,各變量的反應周期也不同,高時滯性和多時滯性互相耦合。
作為全球規(guī)模最大的鋼鐵企業(yè),寶鋼股份與華為云深度合作,將盤古大模型應用于高爐場景,對爐溫、鐵水溫度、硅含量等爐況進行仿真,從而輔助高爐精準控制,充分利用每一分能源,降低能源成本。
面對多維數(shù)據(jù)復雜度高的難題,華為云采用頻域多尺度算法,讓模型更加魯棒;為了解決高時滯多時滯耦合問題,華為云以時序信息增強算法來捕捉時序關系;為了減少采集數(shù)據(jù)誤差,華為云采用機理+數(shù)據(jù)融合驅動預測模型,二者并行交叉驗證,顯著增強模型精度。
實踐表明,高爐每降低10℃的溫度波動,每噸鐵水可減少1kg焦炭消耗,成本約降3元?;诒P古大模型高爐爐況預測,指導高爐生產(chǎn)調控,能大幅提升爐內工況的穩(wěn)定性,預計每年可為寶鋼降本逾10億元。

盤古大模型上線寶武鋼鐵集團1880熱軋生產(chǎn)線
此外,上海寶武鋼鐵熱軋生產(chǎn)線每次調整生產(chǎn)鋼板的種類和尺寸,都需要工程師重新優(yōu)化7道精軋機組的300多個參數(shù),耗時約5天。盤古大模型能對最優(yōu)參數(shù)進行預測,顯著降低熱軋生產(chǎn)線調優(yōu)時間,并提高預測精度和鋼板成材率。目前,盤古大模型已在寶鋼1880熱軋生產(chǎn)線上線,預測精度提高5%以上,鋼板成材率提升0.5%,預計每年可多產(chǎn)鋼板2萬余噸,年收益達9000余萬元。

若以復雜性衡量應用場景的AI落地難度,鋼鐵行業(yè)的高爐場景、熱軋場景只是冰山一角,高鐵行業(yè)的故障檢測、氣象領域的高分辨率預報等場景同樣蘊藏著世界級的高難挑戰(zhàn)。
在高鐵故障檢測場景,盤古高鐵大模型借助一雙“盤古眼”,解決了巡檢工作量巨大、故障形態(tài)龐雜、高鐵場景故障樣本稀缺且開發(fā)成本高等難題,能精準識別一列動車的3.2萬個項點,覆蓋8大類、350+種復雜故障,故障識別準確率可達99%,幫助高鐵提升運營效率,降低成本,減少人工在凌晨時段去巡檢的艱辛作業(yè)。
大型城市的高分辨率氣象預報是公認的高難度系數(shù)應用。盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預報方法的AI預測模型,能秒級提供全球氣象預報,并通過融合區(qū)域高質量氣象數(shù)據(jù)集不斷優(yōu)化預測能力,使降雨量預測精度增強20%。華為云在分辨率為25公里的全球模型基礎上,融合區(qū)域高質量氣象數(shù)據(jù)集,升級了分辨率分別為1公里、3公里、5公里的區(qū)域預報能力,包含氣溫、降雨、風速等氣象要素。
高差異化與適應性的“難”:大模型突圍傳統(tǒng)痛點和新興樊籬
如果說高復雜性體現(xiàn)了“難”的深度,那么千行萬業(yè)數(shù)智化轉型帶來的差異化特征則折射出“難”的廣度——大模型既要幫助傳統(tǒng)行業(yè)“重做一遍”,又必須探尋新興場景的破局之道,這需要其具備適應不同環(huán)境的能力與全面均衡的水平。
相關統(tǒng)計顯示,目前國內傳統(tǒng)行業(yè)中AI滲透率超過10%的只有電子等少數(shù)行業(yè),媒體、醫(yī)藥、石化等行業(yè)的滲透率在5%~10%,建筑等行業(yè)則低于5%。大模型無疑是加速AI在傳統(tǒng)行業(yè)落地的助推器,但針對各個行業(yè)的需求痛點找到適宜的解決方案殊非易事。
以媒體行業(yè)為例:傳統(tǒng)的運作方式已無法適應新環(huán)境的要求,重塑內容生產(chǎn)與應用的新模式迫在眉睫。盤古媒體大模型以語音生成、視頻生成、AI翻譯等維度為突破口:在語音生成方面,只需幾句話、幾秒鐘的聲音,即可實現(xiàn)個性化語音生成以及情感化表達;在視頻生成方面,通過訓練幾十張?zhí)囟缹W風格的圖片,輸入實拍視頻即可按需時長生成穩(wěn)定的動漫視頻;在AI翻譯方面,可保留原始角色的音色、情感、語氣,并借助AI將視頻翻譯為目標語言。
不難看出,大模型正在為傳統(tǒng)行業(yè)提供嶄新的生產(chǎn)力工具,很多行業(yè)的“玩法”將由此徹底改變。在歷史悠久的建筑與工業(yè)設計等領域,盤古大模型的“魔法棒”同樣大顯神威:依托可控高質量視頻生成和3D重建等關鍵技術,盤古大模型為建筑設計構建全新的解決方案,并讓工業(yè)設計的3D建模生成質量實現(xiàn)從玩具級到工業(yè)級的蛻變。
與對傳統(tǒng)行業(yè)“點石成金”相比,大模型在新興應用場景擁有更寬闊的舞臺。在自動駕駛領域,盤古大模型重塑訓練數(shù)據(jù)的積累方式,從過去的建模仿真升級到AI生成,讓自動駕駛模型學習到更多的人類駕駛規(guī)律,更好地應對復雜的行車環(huán)境,解決了自動駕駛數(shù)據(jù)集泛化生成、難例生成等業(yè)界難題。
按照難度級別劃分新興場景,具身智能堪稱通用人工智能的終極形態(tài),是大模型想要摘取的“皇冠上的明珠”。盤古具身智能大模型以云助端,一腦多形,賦能端側機器人設備。它能讓機器人完成10步以上的復雜任務規(guī)劃,并在執(zhí)行中實現(xiàn)多場景泛化和多任務處理。除了人形機器人,盤古具身智能大模型還賦能多種形態(tài)的工業(yè)機器人和服務機器人,更具顛覆性的未來圖景值得期待。
高創(chuàng)新性的“難”:大模型探索底座升級與方案落地新路徑
從某種意義上講,大模型的底層創(chuàng)新能力將決定其向上的高度。只有核心技術與落地路徑兩個維度相輔相成,才能充分釋放大模型的潛能,為千行萬業(yè)的數(shù)智化躍遷提供最佳底座。
早在2021年4月,華為云就正式發(fā)布包括NLP和CV兩種形態(tài)的盤古大模型,此時距離生成式AI火爆全球還有一年半的時間。其后,華為云又推出科學計算大模型、藥物分子大模型、礦山大模型、氣象大模型,集大成的盤古大模型3.0于2023年7月問世。
顯而易見,盤古大模型始終扮演著引領者的角色,每一次創(chuàng)新突破都是大模型進化的風向標。近日,華為云重磅發(fā)布盤古大模型5.0,實現(xiàn)全系列、多模態(tài)、強思維三大創(chuàng)新升級,繼續(xù)在“難而正確”的道路上邁出堅實的一大步。
全系列是大模型適配紛繁業(yè)務場景的不二之選。盤古5.0以不同參數(shù)規(guī)格的模型滿足各類場景需求:十億級參數(shù)的Pangu E系列可支撐手機、PC等端側的智能應用;百億級參數(shù)的Pangu P系列單卡可推,適用于低時延的推理場景;千億級參數(shù)的Pangu U系列適用于處理復雜任務;萬億級參數(shù)的Pangu S系列超級大模型能幫助企業(yè)處理更為復雜的跨領域多任務。
多模態(tài)是大模型精準理解和重構物理世界的必由之路。盤古大模型5.0能更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高分辨率;在內容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術,聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更符合物理規(guī)律的多模態(tài)內容。
強思維是大模型真正成為行業(yè)助手的關鍵要素。盤古5.0將思維鏈技術與策略搜索深度結合,顯著提升數(shù)學能力、復雜任務規(guī)劃能力和工具調用能力。思維鏈可幫助智能體更好地理解和預測環(huán)境變化,而策略搜索則是智能體適應這些變化并做出決策的過程。兩者共同作用,將促使企業(yè)客戶能在復雜環(huán)境中進行有效的學習和決策。
從AI落地的角度看,大模型底層能力的躍升固然具有決定性作用,但部署方式和落地路徑的優(yōu)化同樣不可或缺。在華為開發(fā)者大會2024期間,華為云開創(chuàng)性地推出大模型混合云十大創(chuàng)新技術,借助AI-Native存儲、增強AI網(wǎng)絡、算子加速、多樣性算力調度、云邊協(xié)同、數(shù)據(jù)工程、統(tǒng)一數(shù)據(jù)編碼、精細視覺神經(jīng)網(wǎng)絡、無感斷點續(xù)訓、安全護欄等方面的協(xié)同發(fā)力,打通大模型應用落地進程中的主要堵點,為行業(yè)智能化之旅掃清了“最后一公里”的障礙。
人間正道是滄桑。在“難而正確”的漫漫征途上,難免還會有荊棘或險灘,而以盤古大模型為代表的開路先鋒將篳路藍縷以啟山林,櫛風沐雨砥礪前行。多年以后,站在行業(yè)智能化的高峰回望來時路,大模型留下的腳印會是最美的風景。