dli簡介

什么是DLI

數(shù)據(jù)湖探索 (Data Lake Insight,簡稱DLI)是完全兼容Apache Spark和Apache Flink生態(tài),實現(xiàn)批流一體的Serverless 大數(shù)據(jù) 計算分析服務(wù)。DLI支持多模引擎,企業(yè)僅需使用SQL或程序就可輕松完成異構(gòu)數(shù)據(jù)源的批處理、流處理、內(nèi)存計算、機器學(xué)習(xí)等,挖掘和探索數(shù)據(jù)價值。

功能優(yōu)勢

純SQL操作

DLI提供標準SQL接口,用戶僅需使用SQL便可實現(xiàn)海量數(shù)據(jù)查詢分析。

存算分離

DLI的存儲和計算解耦,分開申請和計費,降低成本的同時,提高了資源利用率。

企業(yè)級多租戶

支持計算資源按租戶隔離,數(shù)據(jù)權(quán)限控制到隊列、作業(yè),幫助企業(yè)實現(xiàn)部門間的數(shù)據(jù)共享和權(quán)限管理。

DLI核心引擎:Spark+Flink

Spark是用于大規(guī)模數(shù)據(jù)處理的統(tǒng)一分析引擎,聚焦于查詢計算分析。DLI在開源Spark基礎(chǔ)上進行了大量的性能優(yōu)化與服務(wù)化改造,不僅兼容Apache Spark生態(tài)和接口,性能較開源提升了2.5倍,在小時級即可實現(xiàn)EB級數(shù)據(jù)查詢分析。

Flink是一款分布式的計算引擎,可以用來做批處理,即處理靜態(tài)的 數(shù)據(jù)集 、歷史的數(shù)據(jù)集;也可以用來做流處理,即實時地處理一些實時數(shù)據(jù)流,實時地產(chǎn)生數(shù)據(jù)的結(jié)果。DLI在開源Flink基礎(chǔ)上進行了特性增強和安全增強,提供了數(shù)據(jù)處理所必須的Stream SQL特性。

DLI服務(wù)架構(gòu):Serverless

DLI是無服務(wù)器化的大數(shù)據(jù)查詢分析服務(wù),其優(yōu)勢在于:

按量計費:真正的按使用量(掃描量/CU時)計費,不運行作業(yè)時0費用。

自動擴縮容:根據(jù)業(yè)務(wù)負載,對計算資源進行預(yù)估和自動擴縮容。