檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
950808 轉 1
預約咨詢
工單提交
我有建議
未實名認證
已實名認證
什么是圖片文字識別轉換?圖片文字識別轉換是指將圖片、掃描件或PDF、OFD文檔中的打印字符進行檢測識別成可編輯的文本格式,以JSON格式返回識別結果。為什么選擇華為云文字識別OCR?文字識別OCR提供在線文字識別服務,將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據識別、定制模板識別、通用表格文字識別等。識別精度高:采用先進的自研深度學習算法,結合億萬級海量標注數據樣本訓練,針對各種業(yè)務場景優(yōu)化。穩(wěn)定服務:華為云OCR成功應用于各類場景,基于華為等企業(yè)客戶的長期實踐,經受過復雜場景考驗。支持復雜場景:證件支持復雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景。簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便。
什么是圖片文字識別轉換?
圖片文字識別轉換是指將圖片、掃描件或PDF、OFD文檔中的打印字符進行檢測識別成可編輯的文本格式,以JSON格式返回識別結果。
為什么選擇華為云文字識別OCR?
文字識別OCR提供在線文字識別服務,將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據識別、定制模板識別、通用表格文字識別等。
識別精度高:采用先進的自研深度學習算法,結合億萬級海量標注數據樣本訓練,針對各種業(yè)務場景優(yōu)化。
穩(wěn)定服務:華為云OCR成功應用于各類場景,基于華為等企業(yè)客戶的長期實踐,經受過復雜場景考驗。
支持復雜場景:證件支持復雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景。
簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便。
通用類OCR(General OCR),支持表格識別、文檔識別、網絡圖片識別、手寫文字識別、智能分類識別、健康碼識別、核酸檢測記錄識別等任意格式圖片上文字信息的自動化識別,自適應分析各種版面和表格,快速實現各種文檔電子化。
按次計費,提供多種規(guī)格的預付費套餐包。
證件類OCR(Card OCR),支持身份證識別、行駛證識別、駕駛證識別、護照識別、營業(yè)執(zhí)照識別、銀行卡識別、道路運輸證識別、車牌識別、名片識別、VIN碼識別、道路運輸從業(yè)資格證識別等卡證圖片上有效信息的自動識別和關鍵字段結構化提取。
票據類OCR(Receipt OCR),支持增值稅發(fā)票識別、機動車銷售發(fā)票識別、出租車發(fā)票識別、火車票識別、定額發(fā)票識別、車輛通行費發(fā)票識別、飛機行程單識別以及發(fā)票驗真;支持圖片及PDF、OFD文檔上有效信息的自動識別和結構化提取。
行業(yè)類(Domain OCR),支持物流電子面單識別、保險單識別、財務報表識別、醫(yī)療化驗單據識別等多種行業(yè)特定類型圖片的結構化信息提取和識別,助力行業(yè)自動化效率提升。
文字識別使用簡介
服務以開放API(Application Programming Interface,應用程序編程接口)的方式提供文字識別能力,用戶調用API接口需要具備一定的編程開發(fā)基礎,文字識別后返回的結果為JSON格式,用戶需要通過編程來處理識別結果。
文字識別功能體驗與試用
在開通文字識別 OCR 前,請先使用 OCR體驗館 體驗服務功能。該方式無需編程,只需在網頁端上傳圖片,即可體驗識別效果。開通OCR后,默認按API調用次數進行收費。說明:使用OCR體驗館前,請先注冊華為云帳號,并實名認證。
在開通文字識別 OCR 前,請先使用 OCR體驗館 體驗服務功能。該方式無需編程,只需在網頁端上傳圖片,即可體驗識別效果。開通OCR后,默認按API調用次數進行收費。
文字識別使用流程
使用文字識別服務前需注冊華為云賬號,并實名認證。第一步:開通文字識別OCR服務;第二步,準備數據;第三步,調用API或SDK;最后,獲取識別結果。用戶需要具備編程能力,熟悉Java、Python、iOS、Android、Node.js編程語言。
文字識別 開通服務
在“總覽”頁面,選擇需要使用的服務,在操作列單擊“開通服務”。服務開通成功后,開通狀態(tài)將顯示為“已開通”。如果您需要使用存儲在對象存儲服務(OBS)上的數據,請在開通服務頁面進行服務授權。
文字識別 準備數據
受技術與成本多種因素制約,文字識別服務存在一些約束限制。只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片;支持圖像任意角度的水平旋轉;圖像各邊的像素大小在15px到8192px之間等。
文字識別 在線調試
文字識別 API Explorer 在線調試工具提供API的檢索、調試、代碼示例生成功能。同時,集成開發(fā)環(huán)境CloudIDE,可完成代碼的構建、調試、運行。前提:已注冊帳號,并實名認證,帳號不能處于異常狀態(tài)。
文字識別 本地調用
該接口可以識別表格圖片中的文字內容,并將識別結果以JSON格式返回給用戶。返回結果包含兩類:純文本區(qū)(text)和表格區(qū)(table),并返回表格結構(row, column)和文本信息。
文字識別 解讀識別結果
本章節(jié)通過網絡圖片識別API介紹如何解讀調API返回的JSON格式識別結果。調用成功后,在“JSON返回結果”中,可見result字段,包含了圖片中的文字塊數目、文字塊排列順序、具體文本內容、所在位置等信息。
文字識別 識別結果后處理
提取特定字段導入Excle需開通身份證識別,安裝OCR Python SDK。并執(zhí)行pip install xlsxwriter命令安裝依賴包,登錄訪問秘鑰頁面,獲取AK、SK??梢孕略鲈L問秘鑰,或使用已有的訪問秘鑰。
文字識別 OCR SDK使用指導
06:38
文字識別 OCR API使用指導
03:04
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經理
活動時間: 2020年8月12日-2020年9月11日
目前文字識別 OCR 服務不支持上傳圖片后直接導出結果,需要通過調用API的方式使用。具體操作請參考《文字識別服務快速入門》。
文字識別 OCR 不支持讀取視頻流數據,您可將視頻流進行提取幀圖片操作,提取出圖片后進行識別,或者使用 視頻內容分析VCR 提取視頻中的文字信息。
通用表格識別支持將表格內容轉換成可編輯的Excel格式,傳入參數return_excel為true時,將返回的表格轉換為Microsoft Excel對應的base64編碼,可用Python函數 base64.b64decode 解碼后保存為.xlsx文件。
文字識別服務支持輸入圖片的base64編碼或圖片的url路徑。
如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(OBS)中,使用OBS提供的圖片url。
同時,您也可以不使用華為云存儲,使用公網http/https url傳入圖片。
增值稅發(fā)票識別API支持使用pdf、ofd文件進行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉換為圖片進行識別。pdf轉圖片識別示例請參見 識別結果后處理。
不支持離線使用,調用SDK必須能夠訪問公網才可以的,因為文字識別 OCR 接口部署在華為云云端,所以需要您的網絡可以訪問公網才可以調用服務接口。
不支持判斷身份證的真假,該服務可以識別身份證圖片中的文字內容,并將識別的結果以json格式返回給用戶。
目前已經支持增值稅專用發(fā)票和增值稅普通發(fā)票(含電子普通發(fā)票)。卷式發(fā)票和通行費發(fā)票即將上線,并且支持發(fā)票備注、監(jiān)制章、專用章、發(fā)票聯次等字段。具體請參見 增值稅發(fā)票識別 章節(jié)。
使用文字識別 OCR 服務時,如果您需要使用華為云對象存儲服務(OBS)中的數據,請開通對象存儲服務OBS授權,可在控制臺進行開通。
文字識別 OCR 服務支持IAM細粒度劃分策略??梢詾樽佑脩粼O置文字識別 OCR 服務的使用權限。
1、文字識別 OCR 服務堅持“華為云始終把可信作為產品質量的第一要素”的理念,我們基于安全、合規(guī)、隱私、韌性、透明,為您提供有技術、有未來、值得信賴的云服務。
2、文字識別 OCR 服務承諾用戶識別的圖片與識別結果全部不作任何形式留存,識別返回后立即釋放。
7*24
多渠道服務支持
備案
提供免費備案服務
專業(yè)服務
云業(yè)務全流程支持
退訂
享無憂退訂服務
建議反饋
優(yōu)化改進建議
售前咨詢熱線
sales@huaweicloud.com
beian@huaweicloud.com
partner@huaweicloud.com
關注我們
4000 955 988
950808
華為云微信
掃描二維碼
華為云微信小程序
華為云微博
華為云App
掃描下載華為云App
增值電信業(yè)務經營許可證:B1.B2-20200593 | 域名注冊服務機構許可:黔D3-20230001 | 代理域名注冊服務機構:新網、西數