Hadoop

Hadoop是一個分布式系統框架。用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序,充分利用了集群的高速運算和存儲。 Hadoop能夠對大量數據以可靠的、高效的、可伸縮的方式進行分布式處理。Hadoop是可靠的,因為它假設計算單元和存儲會失敗,因此維護多個工作數據副本,確保對失敗節(jié)點重新分布處理;Hadoop是高效的,因為它以并行的方式工作,從而加快處理速度;Hadoop是可伸縮的,能夠處理PB級數據。 Hadoop主要由HDFS、MapReduce、Yarn等服務組成。

MapReduce服務 (MapReduce Service)提供租戶完全可控的企業(yè)級 大數據 集群云服務,輕松運行Hadoop、Spark、HBase、Kafka、Storm等大數據組件。

華為云推薦

MapReduce服務 https://support.huaweicloud.com/mrs/index.html