華為云GaussDB數據庫精彩亮相VLDB 2025,多篇論文成功入選
2025-09-12
數據庫領域頂級國際會議VLDB 2025在英國倫敦盛大舉行。會議聚集了全球數據庫領域的頂尖專家學者,共同分享前沿研究成果,探討未來發(fā)展趨勢。華為共18篇論文成功入選,并在多場活動中帶來精彩分享。
華為高斯實驗室主任 王磊發(fā)表了題為《Unified AI-Native & Cloud-Native Database Platform for Data+AI Era》的演講,分享了GaussDB在與AI、云原生等新技術融合下的技術創(chuàng)新,表示在AI與云原生時代下,GaussDB積極融合新技術趨勢,構建了具備自監(jiān)控、自診斷、自調優(yōu)能力的智能運維系統,推出了向量數據庫以及智能問答系統,并基于云原生技術實現了透明多寫架構、智能路由等能力,而未來,GaussDB還將致力于打造一體化的數據平臺,助力企業(yè)實現數字化與智能化一體化應用,賦能千行萬業(yè)數智化升級。
在入選論文中,GaussDB的兩篇亮點論文《GaussDB-Vector: A Large-Scale Persistent Real-Time Vector Database for LLM Applications》、《GRewriter: Practical Query Rewriting with Automatic Rule Set Expansion in GaussDB》分別對當前業(yè)界重點關注的向量數據庫、查詢重寫技術的創(chuàng)新進行了解析。
論文一:《GaussDB-Vector: A Large-Scale Persistent Real-Time Vector Database for LLM Applications》
向量數據庫作為解決大語言模型(LLM)短板的基礎工具,得到了廣泛應用。然而,現有向量數據庫要么僅適用于低延遲內存搜索的小眾應用場景,要么雖具備完善的數據管理能力,卻要犧牲性能。
而該論文提出的高性能、實時持久化向量數據庫GaussDB,在低延遲可擴展搜索、實時插入與刪除、高可用性、大規(guī)模分布式搜索以及向標混合過濾搜索等方面都有卓越表現。這些特性專為基于圖的向量索引而設計,基于創(chuàng)新的存儲架構,優(yōu)化了I/O操作,適配各種數據集大小和維度,并輔以創(chuàng)新的緩沖策略,進一步減輕了I/O負擔。此外,GaussDB-Vector還支持量化算法、并行搜索,以及SIMD、GPU和NPU硬件加速,來進一步提升查詢速度。實驗結果表明,GaussDB的性能可提升1至5倍。
論文二:《GRewriter: Practical Query Rewriting with Automatic Rule Set Expansion in GaussDB》
對數據庫而言,高效重寫各類復雜多樣的查詢至關重要。GaussDB此前的查詢重寫器在擴展性方面的局限,不僅會加大提煉通用性強、適用范圍廣的重寫規(guī)則的難度,還會增加規(guī)則編碼集成到系統中的成本。
該論文創(chuàng)新性地提出了GaussDB的新型可擴展查詢重寫器:GRewriter。GRewriter部署在現有優(yōu)化器之上,能夠探索有效的重寫規(guī)則,支持多種規(guī)則并存,且可根據具體查詢場景動態(tài)選擇適配規(guī)則。為了實現重寫引擎與具體規(guī)則的解耦,論文設計了一種新的規(guī)則描述語言G-DSL,用于定義重寫規(guī)則,為了提高重寫效率,GRewriter引入了新型的規(guī)則索引結構與重寫歷史緩存機制。
GRewriter中的規(guī)則由離線規(guī)則生成器生成。該生成器采用創(chuàng)新的枚舉技術與全新的等價性定理,能夠高效發(fā)現經過形式驗證的規(guī)則,表達能力遠超以往研究中的原型系統。為方便實際運維操作,GRewriter還支持通過通用SQL接口進行手動規(guī)則編寫與交互式規(guī)則管理。
目前,GRewriter已經集成到GaussDB中,并逐步向客戶推廣。GRewriter為GaussDB配備了超過一百條規(guī)則,而性能開銷卻微乎其微(低于1%)。這些新的重寫規(guī)則顯著提升了ERP系統和銀行交易系統的查詢性能——生產查詢延遲從26秒縮短至17毫秒,降低了99.9%。
會議期間,由克里特理工大學和雅典娜研究中心、清華大學、Microsoft研究院、華為云聯合組織并由華為贊助的首屆“Industrial Data Systems Research (IDSR) Workshop”順利召開。會議匯集了多位領先的行業(yè)研究人員和從業(yè)者,共同探討工業(yè)數據系統領域的最新趨勢、研究成果,以及當前面臨的挑戰(zhàn)和未來研究方向。
多年來,華為云GaussDB通過深入的產學研合作與持續(xù)的國際交流,不斷提升在全球學術與產業(yè)界的影響力,此次亮相也成為現場關注與討論的焦點之一。未來,華為將繼續(xù)攜手全球伙伴,共同推動數據庫技術的進步與產業(yè)生態(tài)的繁榮,為企業(yè)數智化發(fā)展構建堅實可靠的數據根基。