隨著5G的規(guī)模商用以及AI技術(shù)在各行各業(yè)的逐步普及,新型智能應(yīng)用及終端正對(duì)體驗(yàn)、時(shí)延、帶寬、安全等數(shù)字業(yè)務(wù)的關(guān)鍵要素提出全新的挑戰(zhàn),而邊緣計(jì)算正在成為應(yīng)對(duì)挑戰(zhàn)的核心手段。據(jù)Gartner預(yù)測(cè),到2022年,邊緣計(jì)算將成為所有數(shù)字業(yè)務(wù)的必要需求。
在今年3月結(jié)束的華為開(kāi)發(fā)者大會(huì)2020(Cloud)上,華為云智能邊緣平臺(tái)IEF首席架構(gòu)師張琦深度解讀了十萬(wàn)邊緣節(jié)點(diǎn)的管理技術(shù),以及如何通過(guò)云原生技術(shù)和邊緣計(jì)算結(jié)合,構(gòu)建邊緣計(jì)算實(shí)戰(zhàn)場(chǎng)景中所需的業(yè)務(wù)下沉、云邊協(xié)同及離線自治等關(guān)鍵能力。
從“Cloud Native”到“Edge Native”的挑戰(zhàn)
標(biāo)準(zhǔn)的邊云協(xié)同模型,對(duì)Cloud Native技術(shù)有六大協(xié)同訴求:服務(wù)協(xié)同,業(yè)務(wù)管理協(xié)同、應(yīng)用管理協(xié)同、智能協(xié)同、數(shù)據(jù)協(xié)同,以及云邊的資源協(xié)同。

舉例來(lái)說(shuō),應(yīng)對(duì)智能協(xié)同的需求,可采用“云上訓(xùn)練,邊緣推理”的思路:
云端,人工智能服務(wù)利用海量計(jì)算資源,完成海量數(shù)據(jù)預(yù)處理及半自動(dòng)化標(biāo)注、大規(guī)模分布式訓(xùn)練、自動(dòng)化模型生成;
邊緣側(cè),邊緣服務(wù)將云上訓(xùn)練好的AI應(yīng)用以容器或函數(shù)形式推送到邊緣節(jié)點(diǎn),提供邊云傳輸通道,聯(lián)動(dòng)邊緣和云端的數(shù)據(jù),支撐AI應(yīng)用實(shí)現(xiàn)邊云智能協(xié)同,同時(shí)提供升級(jí)、監(jiān)控、日志等運(yùn)維能力;
邊緣AI容器/函數(shù)加載模型,實(shí)時(shí)從設(shè)備獲取數(shù)據(jù),通過(guò)推理進(jìn)行瑕疵檢測(cè),根據(jù)結(jié)果調(diào)整生產(chǎn)設(shè)備的參數(shù),提升良品率。邊緣產(chǎn)生的數(shù)據(jù)和推理結(jié)果周期上傳到云上,用于持續(xù)模型訓(xùn)練和生產(chǎn)分析。
然而在此之上,“Edge Native”應(yīng)用的一系列特殊需求,如極致的輕量化、離線自治及故障自愈及超大規(guī)模節(jié)點(diǎn)管理等,對(duì)Cloud Native技術(shù)提出了更高的要求:

1.極致的輕量化:端側(cè)設(shè)備由于資源有限,對(duì)邊緣計(jì)算平臺(tái)的資源占用往往有較強(qiáng)約束。通過(guò)對(duì)已有框架的插件化實(shí)現(xiàn)以及實(shí)施輕量化改造(裁剪邊緣側(cè)不適用場(chǎng)景、重寫模塊等),加上容器引擎的輕量化實(shí)現(xiàn),可以有效提升邊緣業(yè)務(wù)并發(fā)啟動(dòng)速度,并大幅降低穩(wěn)態(tài)下的內(nèi)存占用;
2.離線自治及故障自愈:工業(yè)制造、交通等領(lǐng)域經(jīng)常會(huì)有邊緣節(jié)點(diǎn)離線的場(chǎng)景,要保證業(yè)務(wù)高可靠,離線節(jié)點(diǎn)需要具備故障遷移、多實(shí)例運(yùn)行以及本地恢復(fù)等能力。實(shí)現(xiàn)思路:依據(jù)先預(yù)選、再優(yōu)選的方式基于調(diào)度優(yōu)先級(jí)構(gòu)建邊緣部署優(yōu)選樹(shù);再依據(jù)調(diào)度優(yōu)先級(jí)的順序?qū)Ω邇?yōu)先級(jí)節(jié)點(diǎn)進(jìn)行監(jiān)控,決策是否接管調(diào)度;最后依據(jù)邊緣部署優(yōu)選樹(shù)進(jìn)行節(jié)點(diǎn)調(diào)度決策傳遞,當(dāng)本節(jié)點(diǎn)接管調(diào)度決策后,依據(jù)設(shè)置好的調(diào)度策略對(duì)應(yīng)用在本節(jié)點(diǎn)進(jìn)行調(diào)度;
3.大規(guī)模節(jié)點(diǎn)管理:一方面是南北向大流量沖擊問(wèn)題,如何在帶寬有限的情況下保證邊云信息交互,以及并發(fā)操作帶來(lái)的DB過(guò)載,需要設(shè)計(jì)得當(dāng)?shù)倪呍葡?yōu)化、系統(tǒng)保護(hù)以及流程優(yōu)化策略;另一方面,出于成本考慮,云邊通道的帶寬往往非常小,在中心云側(cè)做大規(guī)模邊緣應(yīng)用分發(fā)將造成災(zāi)難性的擁塞,此時(shí)則需要建立邊緣鏡像加速站點(diǎn),自動(dòng)同步主鏡像倉(cāng)庫(kù)中選定的鏡像,利用邊緣側(cè)本地大帶寬向同一區(qū)域的邊緣節(jié)點(diǎn)提供鏡像下載服務(wù)。
實(shí)際場(chǎng)景如高速公路收費(fèi)管理,該場(chǎng)景涉及超大規(guī)模邊緣節(jié)點(diǎn)的管理和運(yùn)維,同時(shí)要求具備邊緣故障自愈以及分權(quán)分域管理的能力?;谌A為云智能邊緣平臺(tái)IEF構(gòu)建的端邊云協(xié)同方案,實(shí)現(xiàn)了十萬(wàn)級(jí)邊緣節(jié)點(diǎn)快速接入、百萬(wàn)級(jí)應(yīng)用邊云協(xié)同,且支持邊緣節(jié)點(diǎn)自治,以及部聯(lián)網(wǎng)中心-省聯(lián)網(wǎng)中心-路段公司-路段分公司-路段-收費(fèi)站6級(jí)權(quán)限管理模式。該方案還可靈活擴(kuò)展,未來(lái)可向V2X車路協(xié)同和自動(dòng)駕駛演進(jìn)。
KubeEdge:源于實(shí)踐,貢獻(xiàn)開(kāi)源

KubeEdge來(lái)源于華為云IEF團(tuán)隊(duì)在邊緣計(jì)算領(lǐng)域的實(shí)踐,是CNCF(Cloud Native Computing Foundation,云原生計(jì)算基金會(huì))的正式項(xiàng)目,也是唯一的智能邊緣計(jì)算項(xiàng)目,當(dāng)前已被Kubernetes IoT Edge工作組作為邊緣計(jì)算參考架構(gòu),并已吸引60+家企業(yè)關(guān)注和貢獻(xiàn)(如ARM、京東、中國(guó)移動(dòng)、聯(lián)通、浙大等),成為產(chǎn)業(yè)界構(gòu)建邊云協(xié)同架構(gòu)的參考架構(gòu)主要選項(xiàng)之一。
KubeEdge發(fā)展至今經(jīng)歷了三個(gè)階段:
v0.1-0.3:KubeEdge宣布開(kāi)源,成為業(yè)界首個(gè)基于k8s的開(kāi)源邊緣計(jì)算架構(gòu),支持開(kāi)放云邊協(xié)同、容器部署、邊緣設(shè)備管理以及輕量化部署等特性;
v1.0:KubeEdge的里程碑版本,全面支持端、邊、云協(xié)同,支持EdgeMesh服務(wù)網(wǎng)格、EdgeSite邊緣輕量級(jí)集群以及CRI集成,并引入了Quic協(xié)議;
v1.1:該版本將Kubernetes容器存儲(chǔ)標(biāo)準(zhǔn)CSI帶到了邊緣,支持對(duì)象校驗(yàn)組件、單擊一鍵啟動(dòng)KubeEdge集群工具以及DockerShim;
未來(lái):更多的邊緣設(shè)備協(xié)議支持、云邊協(xié)同的效率、可靠性……
KubeEdge項(xiàng)目的發(fā)展離不開(kāi)社區(qū)的力量,當(dāng)前社區(qū)誠(chéng)摯邀請(qǐng)廣大開(kāi)發(fā)者的加入,歡迎每一位貢獻(xiàn)者的參與。
新基建背景下,數(shù)字化轉(zhuǎn)型及智能化升級(jí)正當(dāng)時(shí)。在這場(chǎng)聲勢(shì)浩大的建設(shè)潮流中,企業(yè)和組織的業(yè)務(wù)形態(tài)將發(fā)生巨變,并觸發(fā)技術(shù)領(lǐng)域的新一輪更迭,其中云原生技術(shù)與邊緣計(jì)算將起到不可忽視的作用。華為云智能邊緣平臺(tái)IEF希望與廣大伙伴及開(kāi)發(fā)者一同,構(gòu)筑面向未來(lái)、領(lǐng)先的邊緣解決方案,共贏萬(wàn)物互聯(lián)的智能新時(shí)代。