華為云存儲(chǔ)創(chuàng)新Lab論文被存儲(chǔ)領(lǐng)域頂級(jí)會(huì)議FAST’2022接收,提出并實(shí)現(xiàn)一種面向持久化內(nèi)存全單邊RDMA分布式事務(wù)系統(tǒng)
FAST是存儲(chǔ)系統(tǒng)領(lǐng)域的頂級(jí)會(huì)議,入選中國計(jì)算機(jī)協(xié)會(huì)(CCF)推薦A類國際會(huì)議列表,本次共投稿130篇論文,接收28篇,錄用率21.5%。華為云存儲(chǔ)創(chuàng)新實(shí)驗(yàn)室MemArts團(tuán)隊(duì)和華中科大華宇教授團(tuán)隊(duì)合作提出首個(gè)面向分離式內(nèi)存設(shè)計(jì)的分布式事務(wù)系統(tǒng)FORD。
【論文信息】
Ming Zhang, Yu Hua, Pengfei Zuo, Lurong Liu, "FORD: Fast One-sided RDMA-based Distributed Transactions for Disaggregated Persistent Memory", in Proceedings of the 20th USENIX Conference on File and Storage Technologies (FAST), 2022.
【論文簡(jiǎn)介】
在云數(shù)據(jù)中心中,分離式持久內(nèi)存技術(shù)(Disaggregated Persistent Memory, DPM)通過構(gòu)建一個(gè)可擴(kuò)展的遠(yuǎn)端內(nèi)存池來提升資源利用率和故障隔離性。另外,分布式事務(wù)在云數(shù)據(jù)中心應(yīng)用中被廣泛使用。但是,由于DPM中極其有限的計(jì)算資源和PM的低帶寬特性,現(xiàn)有面向獨(dú)立服務(wù)器設(shè)計(jì)的分布式事務(wù)系統(tǒng)很難高效運(yùn)行在DPM上。
為了解決這一難題,本文提出一個(gè)面向DPM設(shè)計(jì)的分布式事務(wù)系統(tǒng)FORD。FORD使用全單邊RDMA來處理事務(wù),事務(wù)操作不會(huì)涉及到PM池中弱的計(jì)算資源。為了減少全單邊RDMA的RTT數(shù),F(xiàn)ORD把讀和加鎖操作打包在一個(gè)請(qǐng)求中來消除事務(wù)處理過程中l(wèi)ocking和validation階段的開銷。為了加速事務(wù)提交,F(xiàn)ORD使用并行undo日志和數(shù)據(jù)可見性控制來實(shí)現(xiàn)一個(gè)RTT內(nèi)更新所有的遠(yuǎn)端副本。另外,F(xiàn)ORD選擇性地發(fā)起RDMA flush來減少數(shù)據(jù)持久化的性能開銷。實(shí)驗(yàn)顯示,相對(duì)于state-of-the-art的工作,F(xiàn)ORD提升了2.2倍的事務(wù)吞吐量、減少了58.4%的事務(wù)執(zhí)行時(shí)延。
【論文鏈接】
FORD: Fast One-sided RDMA-based Distributed Transactions for Disaggregated Persistent Memory