華為云計(jì)算 云知識(shí) GaussDB(DWS) 與Hive的差別
GaussDB(DWS) 與Hive的差別

GaussDB(DWS)與Hive在功能上存在一定的差異,主要體現(xiàn)在以下幾個(gè)方面:

Hive是基于Hadoop MapReduce的 數(shù)據(jù)倉庫 ,GaussDB(DWS)是基于Postgres的MPP的數(shù)據(jù)倉庫。

Hive的數(shù)據(jù)在HDFS中存儲(chǔ),GaussDB(DWS)的數(shù)據(jù)可以在本地存儲(chǔ),也可以通過外表的形式通過OBS進(jìn)行存儲(chǔ)。

Hive不支持索引,GaussDB(DWS)支持索引,所以查詢速度GaussDB(DWS)更快。

Hive不支持存儲(chǔ)過程,GaussDB(DWS)支持存儲(chǔ)過程,使用場(chǎng)景更廣泛。

GaussDB(DWS)比Hive對(duì)SQL的支持更豐富,包括函數(shù)、自定義函數(shù)、存儲(chǔ)過程。

Hive不支持事務(wù),GaussDB(DWS)支持完整事務(wù)。

在數(shù)據(jù)可靠性方面,Hive和GaussDB(DWS)均支持副本,可靠性基本一致。

在性能上,GaussDB(DWS)極大地優(yōu)于Hive。

GaussDB(DWS)和Hive基于各自的功能特點(diǎn),在應(yīng)用場(chǎng)景上,Hive僅用于離線分析場(chǎng)景,GaussDB(DWS)適用于在線分析場(chǎng)景及AD-Hoc(即席查詢)場(chǎng)景。