檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
950808 轉(zhuǎn) 1
預(yù)約咨詢
工單提交
我有建議
未實名認(rèn)證
已實名認(rèn)證
自動文字識別OCR提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。華為云OCR產(chǎn)品優(yōu)勢? 文字識別精度高:采用先進(jìn)的自研深度學(xué)習(xí)算法,結(jié)合億萬級海量標(biāo)注數(shù)據(jù)樣本訓(xùn)練,針對各種業(yè)務(wù)場景優(yōu)化?自動文字識別穩(wěn)定服務(wù):華為云OCR成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實踐,經(jīng)受過復(fù)雜場景考驗? 自動文字識別支持復(fù)雜場景:證件支持復(fù)雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景? 自動文字識別簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強(qiáng),使用方便
自動文字識別OCR提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。
華為云OCR產(chǎn)品優(yōu)勢
? 文字識別精度高:采用先進(jìn)的自研深度學(xué)習(xí)算法,結(jié)合億萬級海量標(biāo)注數(shù)據(jù)樣本訓(xùn)練,針對各種業(yè)務(wù)場景優(yōu)化
?自動文字識別穩(wěn)定服務(wù):華為云OCR成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實踐,經(jīng)受過復(fù)雜場景考驗
? 自動文字識別支持復(fù)雜場景:證件支持復(fù)雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景
? 自動文字識別簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強(qiáng),使用方便
支持表格、文檔、網(wǎng)絡(luò)圖片、健康碼、核酸檢測記錄等任意格式圖片上文字信息的自動化識別,自適應(yīng)分析各種版面和表格,快速實現(xiàn)各種文檔電子化
支持身份證、駕駛證、行駛證、護(hù)照等證件圖片上有效信息的自動識別和關(guān)鍵字段結(jié)構(gòu)化提取
支持增值稅發(fā)票、機(jī)動車銷售發(fā)票、火車票、出租車發(fā)票等各種發(fā)票以及發(fā)票驗真,支持圖片及PDF、OFD文檔上有效信息的自動識別和結(jié)構(gòu)化提取。
支持物流面單、醫(yī)療化驗單據(jù)等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識別,助力行業(yè)自動化效率提升
? OCR服務(wù)通過RestFul API調(diào)用,計費以Https請求返回的狀態(tài)碼為準(zhǔn),當(dāng)返回狀態(tài)碼為2xx(如200/201)時,表示調(diào)用成功并進(jìn)行扣費。
? OCR服務(wù)通過套餐包計費方式,來降低調(diào)用成本,從絕大部分客戶的使用來看,客戶上傳錯誤樣本導(dǎo)致計費的占比非常非常小,幾乎可忽略不計。
? 在客戶使用OCR能力,進(jìn)行二次開發(fā)時,可以盡可能的通過頁面可視化提醒等方式,引導(dǎo)使用者盡量拍攝符合人眼易于識別的圖片,以保障數(shù)據(jù)質(zhì)量提升同時識別準(zhǔn)確率。
? 由于圖片的輸入非常開放,因此為了避免惡意攻擊,在公有云上對有效識別的信息(即便部分不準(zhǔn))也會計費,類似于在通話質(zhì)量不佳時通常也是要求計費。
? OCR服務(wù)只支持調(diào)用一次接口識別一張圖片,批量識別需要進(jìn)行二次開發(fā),編碼循環(huán)調(diào)用API,實現(xiàn)批量調(diào)用服務(wù)識別圖片。
?OCR提取之后返回的結(jié)果是JSON格式,需要用戶通過編程,將結(jié)果保存為Word、TXT、pdf格式。
文字識別服務(wù)屬于公有云服務(wù),線上用戶資源共享,并發(fā)量會根據(jù)線上用戶的調(diào)用情況動態(tài)調(diào)整。
如遇到突發(fā)高峰導(dǎo)致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法:
?通過重試機(jī)制,在代碼里檢查返回值,碰到并發(fā)錯誤可以延時一小段時間(如2-5s)重試請求.
?后端檢查上一個請求結(jié)果,上一個請求返回之后再發(fā)送下一個請求,避免請求過于頻繁。
目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具體請參考文字識別服務(wù)《SDK參考》手冊,該手冊詳細(xì)介紹了SDK支持的版本及使用方法。
? OCR服務(wù)SDK供用戶免費下載,并依據(jù)API調(diào)用次數(shù)進(jìn)行收費。
? 使用OCR服務(wù)時,如果您需要使用華為云對象存儲服務(wù)(OBS)中的數(shù)據(jù),請開通對象存儲服務(wù)OBS授權(quán),可在控制臺進(jìn)行開通。
?OCR服務(wù)支持IAM細(xì)粒度劃分策略。可以為子用戶設(shè)置OCR服務(wù)的使用權(quán)限,詳細(xì)權(quán)限說明和配置過程請參見權(quán)限管理。
目前OCR服務(wù)不支持上傳圖片后直接導(dǎo)出結(jié)果,需要通過調(diào)用API的方式使用。具體操作請參考《文字識別服務(wù)快速入門》。
文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。
如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。
同時,您也可以不使用華為云存儲,使用公網(wǎng)http/https url傳入圖片。
? 增值稅發(fā)票識別API支持使用pdf、ofd文件進(jìn)行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進(jìn)行識別。
文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。
通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據(jù)和報表的電子化,恢復(fù)結(jié)構(gòu)化信息。
智能分類識別服務(wù)可以一次性對同張圖片中的多個卡證、票據(jù)進(jìn)行檢測和識別,并返回每個卡證、票據(jù)的類別及結(jié)構(gòu)化數(shù)據(jù)。本文還將介紹更多智能分類文字識別
身份證識別:自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等全部信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準(zhǔn)確識別身份證信息。
增值稅發(fā)票識別:通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來
計費項:按API調(diào)用次數(shù)計費,計費價格請參見價格計算器。只有調(diào)用成功才會計算調(diào)用次數(shù),其中返回的2xx狀態(tài)碼表示調(diào)用成功,調(diào)用失敗不計費。
OCR提供兩種計費方式下不同區(qū)域、不同應(yīng)用場景的文字識別服務(wù),含功能場景包括不僅限于以下類別:通用文字識別、機(jī)動車銷售發(fā)票識別、行駛證識別、發(fā)票驗真等數(shù)十種文字識別服務(wù),價格表請參見文字識別價格詳情。
OCR以公有云服務(wù)為主,線上用戶資源共享,并發(fā)量會根據(jù)線上用戶的調(diào)用情況動態(tài)調(diào)整。如遇到突發(fā)高峰導(dǎo)致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法
若套餐包提前使用完,您需要進(jìn)行手動續(xù)費,防止欠費影響您的業(yè)務(wù)正常使用。套餐包到期后,您可以手動續(xù)費以延長套餐包的有效期,也可以提前設(shè)置到期自動續(xù)費。續(xù)費相關(guān)操作,請參見續(xù)費管理。
本節(jié)定義了文字識別服務(wù)上報云監(jiān)控服務(wù)的監(jiān)控指標(biāo)的命名空間,監(jiān)控指標(biāo)列表和維度定義,用戶可以通過云監(jiān)控服務(wù)提供管理控制臺或API接口來檢索文字識別服務(wù)產(chǎn)生的監(jiān)控指標(biāo)和告警信息。
文字識別是指對圖像文件的打印字符進(jìn)行檢測識別,將圖像中的文字轉(zhuǎn)換成可編輯的文本格式。OCR通過API提供服務(wù)能力,用戶需要通過編程來處理識別結(jié)果。
本章節(jié)通過網(wǎng)絡(luò)圖片識別API介紹如何解讀調(diào)API返回的JSON格式識別結(jié)果。請參照API參考“響應(yīng)參數(shù)”章節(jié)比對查看。以下圖識別結(jié)果為例,講解圖片內(nèi)容如何與API的返回字段對應(yīng)。
文字識別OCR使用SDK
06:38
文字識別 OCR使用API
03:04
7*24
多渠道服務(wù)支持
備案
提供免費備案服務(wù)
專業(yè)服務(wù)
云業(yè)務(wù)全流程支持
退訂
享無憂退訂服務(wù)
建議反饋
優(yōu)化改進(jìn)建議
售前咨詢熱線
sales@huaweicloud.com
beian@huaweicloud.com
partner@huaweicloud.com
關(guān)注我們
4000 955 988
950808
華為云微信
掃描二維碼
華為云微信小程序
華為云微博
華為云App
掃描下載華為云App
增值電信業(yè)務(wù)經(jīng)營許可證:B1.B2-20200593 | 域名注冊服務(wù)機(jī)構(gòu)許可:黔D3-20230001 | 代理域名注冊服務(wù)機(jī)構(gòu):新網(wǎng)、西數(shù)