【論文信息】
Skadi: Building a Distributed Runtime for Data Systems in Disaggregated Data Centers.
【作者信息】
Cunchen Hu, Chenxi Wang, Sa Wang, Ninghui Sun, Yungang Bao, Jieru Zhao, Sanidhya Kashyap, Pengfei Zuo, Xusheng Chen, Liangliang Xu, Qin Zhang, Hao Feng, Yizhou Shan.
【論文簡(jiǎn)介】
數(shù)據(jù)密集型系統(tǒng)一直是公有云上的最重要的負(fù)載之一。在過(guò)去十幾年里,公有云廠商一直用三個(gè)原則在保持?jǐn)?shù)據(jù)密集型系統(tǒng)運(yùn)行的高性價(jià)比:用分離式架構(gòu)來(lái)讓資源獨(dú)立伸縮,用異構(gòu)加速來(lái)加速負(fù)載,以及用無(wú)服務(wù)器計(jì)算來(lái)進(jìn)一步降低運(yùn)行開(kāi)銷(xiāo)。雖然這些原則獨(dú)立都運(yùn)行得很好,但暫時(shí)無(wú)法和諧地共存。在這篇文章中,我們提出一個(gè)分布式運(yùn)行時(shí)來(lái)解決存在的一些缺陷。這個(gè)分布式運(yùn)行時(shí)分為兩層,它有一個(gè)多級(jí)訪問(wèn)層,對(duì)外呈現(xiàn)聲明式API,它的下層是一個(gè)呈現(xiàn)分布式任務(wù)API的GP無(wú)服務(wù)器平臺(tái)。這個(gè)分布式運(yùn)行時(shí)將是數(shù)據(jù)系統(tǒng)與硬件之間的狹窄腰部。分布式運(yùn)行時(shí)的用戶可以不用感知數(shù)據(jù)的布局、并發(fā)、分解狀態(tài)以及底層硬件的狀態(tài)。
