五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

CCE通過集成Volcano提供高性能計(jì)算能力。

Volcano是基于Kubernetes的批處理系統(tǒng)。Volcano提供了一個(gè)針對(duì)BigData和AI場景下,通用、可擴(kuò)展、高性能、穩(wěn)定的原生批量計(jì)算平臺(tái),方便AI、大數(shù)據(jù)、基因、渲染等諸多行業(yè)通用計(jì)算框架接入,提供高性能任務(wù)調(diào)度引擎,高性能異構(gòu)芯片管理,高性能任務(wù)運(yùn)行管理等能力。

應(yīng)用場景1:多類型作業(yè)混合部署

隨著各行各業(yè)的發(fā)展,涌現(xiàn)出越來越多的領(lǐng)域框架來支持業(yè)務(wù)的發(fā)展,這些框架都在相應(yīng)的業(yè)務(wù)領(lǐng)域有著不可替代的作用,例如Spark,Tensorflow,F(xiàn)link等。在業(yè)務(wù)復(fù)雜性能不斷增加的情況下,單一的領(lǐng)域框架很難應(yīng)對(duì)現(xiàn)在復(fù)雜的業(yè)務(wù)場景,因此現(xiàn)在普遍使用多種框架達(dá)成業(yè)務(wù)目標(biāo)。但隨著各個(gè)領(lǐng)域框架集群的不斷擴(kuò)大,以及單個(gè)業(yè)務(wù)的波動(dòng)性,各個(gè)子集群的資源浪費(fèi)比較嚴(yán)重,越來越多的用戶希望通過統(tǒng)一調(diào)度系統(tǒng)來解決資源共享的問題。

Volcano在Kubernetes之上抽象了一個(gè)批量計(jì)算的通用基礎(chǔ)層,向下彌補(bǔ)Kubernetes調(diào)度能力的不足,向上提供靈活通用的Job抽象。Volcano通過提供多任務(wù)模板功能實(shí)現(xiàn)了利用Volcano Job描述多種作業(yè)類型(Tensorflow、Spark、MPI、PyTorch等),并通過Volcano統(tǒng)一調(diào)度系統(tǒng)實(shí)現(xiàn)多種作業(yè)混合部署,解決集群資源共享問題。

應(yīng)用場景2:多隊(duì)列場景調(diào)度優(yōu)化

用戶在使用集群資源的時(shí)候通常會(huì)涉及到資源隔離與資源共享,Kubernetes中沒有隊(duì)列的支持,所以它在多個(gè)用戶或多個(gè)部門共享一個(gè)機(jī)器時(shí)無法做資源共享。但不管在HPC還是大數(shù)據(jù)領(lǐng)域中,通過隊(duì)列進(jìn)行資源共享都是基本的需求。

在通過隊(duì)列做資源共享時(shí),CCE提供了多種機(jī)制??梢詾殛?duì)列設(shè)置weight值,集群通過計(jì)算該隊(duì)列weight值占所有weight總和的比例來給隊(duì)列劃分資源;另外也可以為隊(duì)列設(shè)置資源的Capability值,來確定該隊(duì)列能夠使用的資源上限。

例如下圖中,通過這兩個(gè)隊(duì)列去共享整個(gè)集群的資源,一個(gè)隊(duì)列獲得40%的資源,另一個(gè)隊(duì)列獲得60%的資源,這樣可以把兩個(gè)不同的隊(duì)列映射到不同的部門或者是不同的項(xiàng)目中。并且在一個(gè)隊(duì)列里如果有多余的空閑資源,可以把這些空閑資源分配給另外一個(gè)隊(duì)列里面的作業(yè)去使用。

應(yīng)用場景3:多種高級(jí)調(diào)度策略

當(dāng)用戶向Kubernetes申請(qǐng)容器所需的計(jì)算資源(如CPU、Memory、GPU等)時(shí),調(diào)度器負(fù)責(zé)挑選出滿足各項(xiàng)規(guī)格要求的節(jié)點(diǎn)來部署這些容器。通常,滿足各項(xiàng)要求的節(jié)點(diǎn)并非唯一,且水位(節(jié)點(diǎn)已有負(fù)載)各不相同,不同的分配方式最終得到的分配率存在差異,因此,調(diào)度器的一項(xiàng)核心任務(wù)就是以最終資源利用率最優(yōu)的目標(biāo)從眾多候選機(jī)器中挑出最合適的節(jié)點(diǎn)。

下圖為Volcano scheduler調(diào)度流程,首先將API server中的Pod、PodGroup信息加載到scheduler cache中。Scheduler周期被稱為session,每個(gè)scheduler周期會(huì)經(jīng)歷OpenSession,調(diào)用Action,CloseSession三個(gè)階段。其中OpenSession階段加載用戶配置的scheduler plugin中實(shí)現(xiàn)的調(diào)度策略;調(diào)用Action階段逐一調(diào)用配置的action以及在OpenSession階段加載的調(diào)度策略;CloseSession為清理階段。

Volcano scheduler通過插件方式提供了多種調(diào)度Action(例如enqueue,allocate,preempt,reclaim,backfill)以及調(diào)度策略(例如gang,priority,drf,proportion,binpack等),用戶可以根據(jù)實(shí)際業(yè)務(wù)需求進(jìn)行配置。通過實(shí)現(xiàn)Scheduler提供的接口也可以方便靈活的進(jìn)行定制化開發(fā)。

應(yīng)用場景4:高精度資源調(diào)度

Volcano 在支持AI,大數(shù)據(jù)等作業(yè)的時(shí)候提供了高精度的資源調(diào)度策略,例如在深度學(xué)習(xí)場景下計(jì)算效率非常重要。以TensorFlow計(jì)算為例,配置“ps”和“worker”之間的親和性,以及“ps”與“ps”之間的反親和性,可使“ps”和“worker”盡量調(diào)度到同一臺(tái)節(jié)點(diǎn)上,從而提升“ps”和“worker”之間進(jìn)行網(wǎng)絡(luò)和數(shù)據(jù)交互的效率,進(jìn)而提升計(jì)算效率。然而Kubernetes默認(rèn)調(diào)度器在調(diào)度Pod過程中,僅會(huì)檢查Pod與現(xiàn)有集群下所有已經(jīng)處于運(yùn)行狀態(tài)Pod的親和性和反親和性配置是否沖突或吻合,并不會(huì)考慮接下來可能會(huì)調(diào)度的Pod造成的影響。

Volcano提供的Task-topology算法是一種根據(jù)Job內(nèi)task之間親和性和反親和性配置計(jì)算task優(yōu)先級(jí)和Node優(yōu)先級(jí)的算法。通過在Job內(nèi)配置task之間的親和性和反親和性策略,并使用task-topology算法,可優(yōu)先將具有親和性配置的task調(diào)度到同一個(gè)節(jié)點(diǎn)上,將具有反親和性配置的Pod調(diào)度到不同的節(jié)點(diǎn)上。同樣是處理親和性和反親和性配置對(duì)Pod調(diào)度的影響,task-topology算法與Kubernetes默認(rèn)調(diào)度器處理的不同點(diǎn)在于,task-topology將待調(diào)度的Pods作為一個(gè)整體進(jìn)行親和性和反親和性考慮,在批量調(diào)度Pod時(shí),考慮未調(diào)度Pod之間的親和性和反親和性影響,并通過優(yōu)先級(jí)施加到Pod的調(diào)度進(jìn)程中。

應(yīng)用場景5:在線離線作業(yè)混合部署

當(dāng)前很多業(yè)務(wù)有波峰和波谷,部署服務(wù)時(shí),為了保證服務(wù)的性能和穩(wěn)定性,通常會(huì)按照波峰時(shí)需要的資源申請(qǐng),但是波峰的時(shí)間可能很短,這樣在非波峰時(shí)段就有資源浪費(fèi)。另外,由于在線作業(yè)SLA要求較高,為了保證服務(wù)的性能和可靠性,通常會(huì)申請(qǐng)大量的冗余資源,因此,會(huì)導(dǎo)致資源利用率很低、浪費(fèi)比較嚴(yán)重。將這些申請(qǐng)而未使用的資源(即申請(qǐng)量與使用量的差值)利用起來,就是資源超賣。超賣資源適合部署離線作業(yè),離線作業(yè)通常關(guān)注吞吐量,SLA要求不高,容忍一定的失敗。在線作業(yè)和離線作業(yè)混合部署在Kubernetes集群中將有效的提升集群整體資源利用率。

目前Kubernetes的默認(rèn)調(diào)度器是以Pod為單位進(jìn)行調(diào)度的,不區(qū)分Pod中運(yùn)行的業(yè)務(wù)類型。因此無法滿足混部場景對(duì)資源分配的特殊要求。針對(duì)上述問題,Volcano實(shí)現(xiàn)了基于應(yīng)用模型感知的智能調(diào)度算法,根據(jù)用戶提交的作業(yè)類型,針對(duì)其應(yīng)用模型對(duì)資源的訴求和整體應(yīng)用負(fù)載的情況,優(yōu)化調(diào)度方式,通過資源搶占,分時(shí)復(fù)用等機(jī)制減少集群資源的空閑比例。

價(jià)值

面向AI計(jì)算的容器服務(wù),采用高性能GPU計(jì)算實(shí)例,并支持多容器共享GPU資源,在AI計(jì)算性能上比通用方案提升3~5倍以上,并大幅降低了AI計(jì)算的成本,同時(shí)幫助數(shù)據(jù)工程師在集群上輕松部署計(jì)算應(yīng)用,您無需關(guān)心復(fù)雜的部署運(yùn)維,專注核心業(yè)務(wù),快速實(shí)現(xiàn)從0到1快速上線。

優(yōu)勢(shì)

CCE通過集成Volcano,在高性能計(jì)算、大數(shù)據(jù)、AI等領(lǐng)域有如下優(yōu)勢(shì):

●多種類型作業(yè)混合部署:支持AI、大數(shù)據(jù)、HPC作業(yè)類型混合部署。

●多隊(duì)列場景調(diào)度優(yōu)化:支持分隊(duì)列調(diào)度,提供隊(duì)列優(yōu)先級(jí)、多級(jí)隊(duì)列等復(fù)雜任務(wù)調(diào)度能力。

●多種高級(jí)調(diào)度策略:支持gang-scheduling、公平調(diào)度、資源搶占、GPU拓?fù)涞雀呒?jí)調(diào)度策略。

●多任務(wù)模板:支持單一Job多任務(wù)模板定義,打破Kubernetes原生資源束縛,Volcano Job描述多種作業(yè)類型(Tensorflow、MPI、PyTorch等)。

●作業(yè)擴(kuò)展插件配置:在提交作業(yè)、創(chuàng)建Pod等多個(gè)階段,Controller支持配置插件用來執(zhí)行自定義的環(huán)境準(zhǔn)備和清理的工作,比如常見的MPI作業(yè),在提交前就需要配置SSH插件,用來完成Pod資源的SSH信息配置。

●在線離線業(yè)務(wù)混部:支持集群內(nèi)在離線作業(yè)混部以及節(jié)點(diǎn)CPU和內(nèi)存資源超賣,提升集群整體資源利用率。

建議搭配使用

GPU加速云服務(wù)器 + 彈性負(fù)載均衡ELB + 對(duì)象存儲(chǔ)服務(wù)OBS

圖1 AI計(jì)算

云容器引擎CCE

以容器為核心的云原生技術(shù)是企業(yè)數(shù)字化和智能化的一次進(jìn)化,沒有云原生,就沒有真正的數(shù)字化和智能化

三大加速 打造飛躍性的容器集群

三大加速 打造飛躍性的容器集群

隨著容器的全面規(guī)?;瘧?yīng)用,企業(yè)對(duì)容器性能、彈性、調(diào)度能力提出了更高的要求,華為云CCE Turbo從計(jì)算、網(wǎng)絡(luò)和調(diào)度三方面全方位加速,更好應(yīng)對(duì)業(yè)務(wù)全面容器化的訴求。

  • 計(jì)算加速
  • 業(yè)界獨(dú)家實(shí)現(xiàn)容器100%卸載,服務(wù)器資源和性能雙零損耗。

  • 網(wǎng)絡(luò)加速
  • 采用獨(dú)創(chuàng)的容器直通網(wǎng)絡(luò),讓兩層網(wǎng)絡(luò)變成一層,端到端連通時(shí)間縮短一半,有效支撐業(yè)務(wù)秒級(jí)擴(kuò)容千容器。

  • 調(diào)度加速
  • 通過感知AI、大數(shù)據(jù)、WEB業(yè)務(wù)的不同特征,以及應(yīng)用模型、網(wǎng)絡(luò)拓?fù)涞?,?shí)現(xiàn)業(yè)務(wù)混合部署、智能調(diào)度,還自動(dòng)優(yōu)化任務(wù)調(diào)度策略,實(shí)現(xiàn)1萬容器/秒的大規(guī)模并發(fā)調(diào)度能力。

云容器引擎優(yōu)勢(shì)

為什么選擇華為云云容器引擎 CCE

  • 簡單易用

    一鍵創(chuàng)建容器集群,一站式部署和運(yùn)維容器應(yīng)用,無需再自行搭建容器運(yùn)行環(huán)境,真正實(shí)現(xiàn)開箱即用

    一鍵創(chuàng)建容器集群,一站式部署和運(yùn)維容器應(yīng)用,無需再自行搭建容器運(yùn)行環(huán)境,真正實(shí)現(xiàn)開箱即用

  • 混合部署

    支持虛擬機(jī)與裸金屬服務(wù)器混合、支持GPU、NPU等異構(gòu)節(jié)點(diǎn)的混合部署,基于高性能網(wǎng)絡(luò)模型提供全方位、多場景、安全穩(wěn)定的容器運(yùn)行環(huán)境

    支持虛擬機(jī)與裸金屬服務(wù)器混合、支持GPU、NPU等異構(gòu)節(jié)點(diǎn)的混合部署,基于高性能網(wǎng)絡(luò)模型提供全方位、多場景、安全穩(wěn)定的容器運(yùn)行環(huán)境

  • 安全可靠

    集群控制面支持3 Master HA,集群內(nèi)節(jié)點(diǎn)和應(yīng)用支持跨AZ部署

    支持安全容器,提供虛擬機(jī)級(jí)別的安全性

    私有集群,完全由用戶掌控,并提供基于角色的細(xì)粒度權(quán)限控制(RBAC)

    集群控制面支持3 Master HA,集群內(nèi)節(jié)點(diǎn)和應(yīng)用支持跨AZ部署

    支持安全容器,提供虛擬機(jī)級(jí)別的安全性

    私有集群,完全由用戶掌控,并提供基于角色的細(xì)粒度權(quán)限控制(RBAC)

  • 開放兼容

    云原生基金會(huì)(CNCF)初創(chuàng)成員和白金會(huì)員,Kubernetes社區(qū)技術(shù)指導(dǎo)委員會(huì)席位。CNCF首批認(rèn)證的Kubernetes服務(wù)提供商,完全兼容開源社區(qū)原生版本

    云原生基金會(huì)(CNCF)初創(chuàng)成員和白金會(huì)員,Kubernetes社區(qū)技術(shù)指導(dǎo)委員會(huì)席位。CNCF首批認(rèn)證的Kubernetes服務(wù)提供商,完全兼容開源社區(qū)原生版本

云容器引擎相關(guān)文檔

國內(nèi)容器云視頻幫助

了解容器基礎(chǔ)使用方法

19:38

了解容器基礎(chǔ)使用方法

介紹Kubernetes基本概念

30:20

介紹Kubernetes基本概念

使用控制臺(tái)部署WordPress

17:21

使用控制臺(tái)部署WordPress

使用Deployment調(diào)度Pod

17:16

使用Deployment調(diào)度Pod