一、傳統(tǒng) 大數(shù)據(jù) 平臺Lambda架構(gòu):
兩條數(shù)據(jù)流獨(dú)立處理:
1.實時流,多采用Flink,Storm或者Spark Streaming
2.批處理,如采用MapReduce,Spark SQL等
關(guān)鍵問題:
1.計算結(jié)果容易不一致,如批計算的結(jié)果更全面,與流計算有差異
2.IoT時代數(shù)據(jù)量巨大,夜間批計算時間窗可能不夠3.數(shù)據(jù)源一旦變化,適配工作量巨大。
二、一種改良的大數(shù)據(jù)平臺架構(gòu)Kappa
一條數(shù)據(jù)流統(tǒng)一處理:
1.改進(jìn)流計算來解決批量數(shù)據(jù)處理的問題,統(tǒng)一業(yè)務(wù)處理邏輯
2.如需重新計算,需重啟一個流計算實例
關(guān)鍵問題:
1.流式處理對于高吞吐的歷史數(shù)據(jù)處理存在瓶頸,很難適合IoT數(shù)據(jù)量
2.開發(fā)周期長,不同數(shù)據(jù)格式都要開發(fā)不同的streaming程序
3.成本高,很依賴高性能存儲如 redis ,hbase等。

三、Apache IoTDB項目
以處理IoT時序數(shù)據(jù)為核心:
1.基于時序優(yōu)化的文件存儲格式TsFile,可與HDFS同步
2.提供數(shù)據(jù)模型能力(物的層次結(jié)構(gòu))
3.融入主流生態(tài),如Hadoop, Spark, and Grafana等
4.高壓縮低成本,存儲在硬盤上的成本<$0.23/GB (Azure 約$3/GB)
關(guān)鍵問題:
1.通過JDBC接口與云端DB互通,有功能局限
四、以模型驅(qū)動的IoTA架構(gòu)
云邊協(xié)同,模型驅(qū)動的分析架構(gòu):
1.貫穿整體業(yè)務(wù)始終的數(shù)據(jù)模型,一致體驗,去ETL化
2.邊緣計算SDK,邊緣側(cè)可部署數(shù)據(jù)分析邏輯,增強(qiáng)時效性
關(guān)鍵問題:
1.期望構(gòu)建標(biāo)準(zhǔn)化的數(shù)據(jù)模型,達(dá)到去ETL化的效果,可能需要較長時間的演化2.并未完全解決流批分離處理架構(gòu)下分析結(jié)果可能不一。

最新文章
- 數(shù)據(jù)治理中心_數(shù)據(jù)架構(gòu)_數(shù)據(jù)架構(gòu)使用示例-華為云
- GaussDB架構(gòu)_GaussDB數(shù)據(jù)庫架構(gòu)_高斯數(shù)據(jù)庫架構(gòu)-華為云
- 物聯(lián)網(wǎng)應(yīng)用有哪些_IoT物聯(lián)網(wǎng)平臺的功能_物聯(lián)網(wǎng)設(shè)備管理平臺
- 軟件開發(fā)生產(chǎn)線_軟件開發(fā)生產(chǎn)線有哪些_軟件開發(fā)生產(chǎn)線工具
- 軟件開發(fā)生產(chǎn)線是什么_軟件開發(fā)流程是怎樣的
- 設(shè)備接入IOTDA平臺可以用哪些模式