選擇分布列的時(shí)候,一般遵循下面三個(gè)原則:
1.盡量選擇離散值比較多的列,保證數(shù)據(jù)均勻分布。分布均勻是為了避免木桶效應(yīng),各個(gè)DN對(duì)等執(zhí)行。
2.在滿足第一條原則的情況下,不要選擇存在常量過(guò)濾的列。
3.滿足前兩條原則的情況下,盡量選擇關(guān)聯(lián)字段或聚合字段做分布列,這種方式是為了避免數(shù)據(jù)節(jié)點(diǎn)之間數(shù)據(jù)重分布,降低IO的開(kāi)銷(xiāo)從而提升關(guān)聯(lián)操作和聚合操作的性能。

- 分布式云原生有哪些優(yōu)勢(shì)_為什么選擇華為云云原生_分布式云原生
- 分布式消息隊(duì)列是什么_分布式消息隊(duì)列好處_消息隊(duì)列-華為云
- 華為云分布式存儲(chǔ)_分布式存儲(chǔ)有哪些功能_專屬分布式存儲(chǔ)服務(wù)與云硬盤(pán)的區(qū)別
- 分布式消息基本概念_消息隊(duì)列_分布式系統(tǒng)-華為云
- GaussDB數(shù)據(jù)庫(kù)服務(wù)_GaussDB選擇分布鍵原則_華為高斯數(shù)據(jù)庫(kù)服務(wù)
- 分布式消息服務(wù)有哪些_分布式消息服務(wù)哪個(gè)好_分布式消息-華為云