檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
結(jié)構(gòu)化數(shù)據(jù) 上傳結(jié)構(gòu)化數(shù)據(jù) 搜索結(jié)構(gòu)化數(shù)據(jù)文件 父主題: 歷史API
方案架構(gòu) 針對傳統(tǒng)企業(yè)在大數(shù)據(jù)場景面臨的問題,華為云提供了基于對象存儲服務(wù)OBS作為統(tǒng)一數(shù)據(jù)湖存儲的大數(shù)據(jù)存算分離方案。 圖1 基于OBS的華為云大數(shù)據(jù)存算分離方案 華為云大數(shù)據(jù)存算分離方案基于對象存儲服務(wù)OBS的大容
確保備份數(shù)據(jù)和容災(zāi)數(shù)據(jù)安全的最后一道防線。沒有災(zāi)備演練的數(shù)據(jù)備份和數(shù)據(jù)容災(zāi)方案,都是不完整的,因為無法保障備份和容災(zāi)的數(shù)據(jù)一定可用。非結(jié)構(gòu)化數(shù)據(jù)一般來說有NAS和對象兩種存儲方式,存儲方式不同,數(shù)據(jù)量、小文件數(shù)量、日數(shù)據(jù)變化量的不同,都會影響到數(shù)據(jù)備份和數(shù)據(jù)容災(zāi)的技術(shù)方案。對象存
上傳結(jié)構(gòu)化數(shù)據(jù) 功能介紹 將結(jié)構(gòu)化數(shù)據(jù)文件上傳到對象存儲服務(wù)OBS中進行結(jié)構(gòu)化數(shù)據(jù)批處理功能。 URI POST /v1/koosearch/repos/{repo_id}/structured-data 表1 路徑參數(shù) 參數(shù) 是否必選 參數(shù)類型 描述 repo_id 是 String
結(jié)構(gòu)化數(shù)據(jù) 上傳結(jié)構(gòu)化數(shù)據(jù) 搜索結(jié)構(gòu)化數(shù)據(jù)文件 下載結(jié)構(gòu)化數(shù)據(jù)失敗條目 父主題: API
華為云數(shù)據(jù)脫敏服務(wù)是否支持非結(jié)構(gòu)化數(shù)據(jù)脫敏?
的數(shù)據(jù)同步。 圖1 跨系統(tǒng)業(yè)務(wù)數(shù)據(jù)集成與轉(zhuǎn)換架構(gòu)圖 ROMA Connect的數(shù)據(jù)集成直接讀取業(yè)務(wù)系統(tǒng)A中數(shù)據(jù)庫的數(shù)據(jù),并根據(jù)集成任務(wù)的配置,篩選出指定數(shù)據(jù)并進行數(shù)據(jù)轉(zhuǎn)換,然后把轉(zhuǎn)換后的數(shù)據(jù)寫入到業(yè)務(wù)系統(tǒng)B的數(shù)據(jù)庫中。
深刻的幾個咖啡店剛看到你離開的煩惱困惑奶粉
使用“源端/目的端雙寫方案”方案遷移增量對象數(shù)據(jù) 操作場景 本章節(jié)指導用戶使用“源端/目的端雙寫方案”方案遷移增量對象數(shù)據(jù)。此方案優(yōu)勢在于可以確保業(yè)務(wù)零中斷。 主要遷移步驟如下所示: 用戶在全量遷移前,需配置業(yè)務(wù)同時向源端
下載結(jié)構(gòu)化數(shù)據(jù)失敗條目 功能介紹 下載結(jié)構(gòu)化數(shù)據(jù)失敗條目。 URI GET /v1/{project_id}/applications/{application_id}/uni-search/{repo_id}/structured-data/download-fail/{file_id}
驗證方案 如果您采用了OBS大數(shù)據(jù)最佳實踐,并且參考上文的指導完成配置后,可參考本節(jié)內(nèi)容進行測試,驗證大數(shù)據(jù)方案的效果。 本文以ARM架構(gòu)的鯤鵬服務(wù)器結(jié)合OBS存算分離方案,采取Hive on MR、Spark兩個引擎為例,進行驗證。 測試資源配置
方案架構(gòu) 圖1 方案架構(gòu) 說明: 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。 方案優(yōu)勢 通過對增值稅發(fā)票圖片預(yù)處
數(shù)據(jù)集成 數(shù)據(jù)集成主要包含三塊:離線集成,實時集成,集成任務(wù)。 圖1 數(shù)據(jù)集成 離線集成 主要為結(jié)構(gòu)化集成和非結(jié)構(gòu)化集成兩種,結(jié)構(gòu)化集成主要是離線集成部署方式,非結(jié)構(gòu)化集成為API部署方式。 結(jié)構(gòu)化集成 圖2 結(jié)構(gòu)化集成 集成作業(yè) 圖3 集成作業(yè) 任務(wù)名稱:自定義數(shù)據(jù) 需求類型:目前只支持新增
云盤的方案如表1所示。 存儲空間受限 數(shù)據(jù)上云:將OBS作為數(shù)據(jù)存儲池。OBS提供海量、安全、高可靠、低成本的數(shù)據(jù)存儲能力,可供用戶存儲任意類型和大小的數(shù)據(jù)。
知識庫在向量數(shù)據(jù)庫中存儲的ID,具有唯一性。 約束限制: 不涉及 取值范圍: 1~64個字符,只能包含數(shù)字、字母、中劃線和下劃線。 默認取值: 不涉及 表2 Query參數(shù) 參數(shù) 是否必選 參數(shù)類型 描述 file_name 是 String 參數(shù)解釋: 結(jié)構(gòu)化數(shù)據(jù)的文件名。 約束限制:
使用"多次同步方案"遷移增量對象數(shù)據(jù) 操作場景 本章節(jié)指導用戶使用"多次同步方案"遷移增量對象數(shù)據(jù)。 主要遷移步驟如下所示: 使用OMS完成源端數(shù)據(jù)的全量遷移。 多次增量遷移數(shù)據(jù),減少源端和目的端數(shù)據(jù)差異。
瞬息多變的市場節(jié)奏。 海量數(shù)據(jù)平臺可支持PB級數(shù)據(jù)存儲和億級數(shù)據(jù)秒級檢索。 軟硬件加速感知算法訓練和仿真需要使用大量GPU資源,Octopus依托華為自研軟硬件能力提供的強大算力支持,滿足每天百萬公里仿真測試和算法訓練。 自動化標
用的管理,以及工業(yè)數(shù)據(jù)的采集、轉(zhuǎn)發(fā)、處理和存儲;在云端部署的管理控制臺實現(xiàn)對工業(yè)數(shù)據(jù)采集軟件的配置,以及流式數(shù)據(jù)業(yè)務(wù)邏輯的部署和升級。該方案可以實現(xiàn)工業(yè)數(shù)據(jù)在邊緣端的低時延、高吞吐和高安全地處理,是一套實現(xiàn)工業(yè)數(shù)字轉(zhuǎn)型的理想方案。 方案架構(gòu)
以顯著減少磁盤上的存儲。使用DLI可輕松將CSV格式數(shù)據(jù)轉(zhuǎn)換為Parquet格式數(shù)據(jù)。 方案架構(gòu) 將CSV格式的數(shù)據(jù)上傳到對象存儲服務(wù)OBS,使用DLI將CSV數(shù)據(jù)轉(zhuǎn)換為Parquet數(shù)據(jù),并將轉(zhuǎn)換后的Parquet數(shù)據(jù)存儲到OBS中。
非結(jié)構(gòu)化數(shù)據(jù)創(chuàng)建圖譜 創(chuàng)建圖譜簡介 創(chuàng)建信息抽取模型 使用自定義抽取模型創(chuàng)建圖譜 父主題: 使用場景