華為云存儲創(chuàng)新Lab論文被USENIX ATC’2022接收,提出云數(shù)據(jù)中心中微秒級的超低時延Membership Service
??????USENIX 年度技術會議(USENIX Annual Technical Conference,USENIX ATC)是計算機系統(tǒng)領域的著名學術會議,USENIX ATC’2022將于2022年7月11日-13日在加州的卡爾斯巴德召開,本次共投稿393篇論文,接收64篇,接收率為16.3%。華為云存儲創(chuàng)新Lab和EPFL合作完成的uKharon論文以全部正分(3分及以上)被接收,這也是華為云存儲創(chuàng)新Lab連續(xù)兩年在USENIX ATC上發(fā)表論文。
【論文信息】
Rachid Guerraoui (EPFL), Antoine Murat (EPFL), Javier Picorel (Huawei), Athanasios Xygkis (EPFL), Huabing Yan (Huawei), Pengfei Zuo (Huawei). “uKharon: A Membership Service for Microsecond Applications”. USENIX Annual Technical Conference, Carlsbad, CA, USA, July 2022.
【論文簡介】
現(xiàn)代數(shù)據(jù)中心網(wǎng)絡讓諸如數(shù)據(jù)存儲和消息隊列等分布式應用進入了微秒時代。除了在微秒級別構建服務之外,這些分布式應用的一大挑戰(zhàn)是能夠在故障出現(xiàn)的時候快速改變成員節(jié)點進行故障切換??焖俪蓡T變化對于延遲敏感服務尤為重要,例如分析和交易系統(tǒng),因為這是許多云商應用的容錯核心。在微服務架構這一云服務構建的新標準下,單個用戶請求會被轉化成高扇出的服務交互請求,這導致在傳統(tǒng)架構下不常見的服務重配置事件和服務錯誤在微服務架構下更頻繁的發(fā)生,從而讓用戶請求頻繁地經(jīng)歷由于容錯和服務重配置帶來的高延遲。
為了解決上述問題,我們提出了一個微秒級別的成員服務 uKharon。uKharon 能在 50 微秒內檢測應用的成員變化并進行故障切換。uKharon 包含多級故障檢測、單邊共識引擎和成員租約服務三個部分,所有操作都通過RDMA 完成。我們基于 HERD 構建了一個多副本鍵值存儲 uKharon-KV 來展示 uKharon 的能力。uKharon-KV 能在 1.26 微秒內對小請求進行復制,比現(xiàn)有方法快 13%。同時 uKharon-KV 能在 53 微秒內做到故障切換,與現(xiàn)有工作相比有 10 倍的性能提升。