檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
通用文字識別 功能介紹 識別圖片上的文字信息,以JSON格式返回識別的文字和坐標。支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別。 支持中英文以及部分繁體字。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 通用文字示例圖 約束與限制
通用表格識別是否支持導出為excel格式 通用表格識別支持將表格內(nèi)容轉(zhuǎn)換成可編輯的Excel格式,傳入?yún)?shù)return_excel為true時,將返回的表格轉(zhuǎn)換為Microsoft Excel對應的base64編碼,可用Python函數(shù) base64.b64decode解碼后保存為
OCR服務識別結果可以轉(zhuǎn)化為Word、TXT、pdf嗎 OCR提取之后返回的結果是JSON格式,需要用戶通過編程,將結果保存為Word、TXT、pdf格式。 父主題: API使用類
方式: OCR體驗館:直接在網(wǎng)頁上傳圖片,系統(tǒng)自動返回識別后的文本。 如果您沒有開發(fā)基礎,想快速體驗OCR服務,OCR體驗館提供了在線網(wǎng)頁調(diào)用方式,該方式無需編碼,直接在網(wǎng)頁上傳圖片,即可返回識別結果。 華為云API Explorer:使用華為云API調(diào)試工具調(diào)用OCR服務。 如
None 服務介紹 文字識別 OCR 文字識別技術簡介 01:46 文字識別技術簡介 快速入門 文字識別 OCR 使用SDK 06:38 SDK使用指導 文字識別 OCR 使用API 03:04 API使用指導 問題排查 文字識別 OCR 獲取Token時帳密報錯 03:53 獲取Token時帳密報錯
OCR服務支持上傳圖片后直接導出結果嗎 目前OCR服務不支持上傳圖片后直接導出結果,需要通過調(diào)用API的方式使用。具體操作請參考《文字識別服務快速入門》。 父主題: 產(chǎn)品咨詢類
文字識別服務等級協(xié)議請參見華為云服務等級協(xié)議。 OCR能力 通用類 OCR 通用類OCR(General OCR),支持表格、文檔、網(wǎng)絡圖片等任意格式圖片上文字信息的自動化識別,自適應分析各種版面和表格,快速實現(xiàn)各種文檔電子化。 證件類 OCR 證件類OCR(Card OCR),支持身份證、駕駛證、行
OCR服務可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結果后處理。 父主題: 產(chǎn)品咨詢類
證件類 證件類OCR(Card OCR),支持身份證識別、行駛證識別、駕駛證識別、護照識別、銀行卡識別、營業(yè)執(zhí)照識別、名片識別、車牌識別、VIN碼識別、道路運輸證識別、道路運輸從業(yè)資格證識別等卡證圖片上有效信息的自動識別和關鍵字段結構化提取。 證件類OCR(Card OCR),支持身
手寫文字識別 功能介紹 識別文檔中的手寫文字、印刷文字信息,并將識別的結構化結果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 手寫文字示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
識別圖片上的文字信息,支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別 網(wǎng)絡圖片識別 識別網(wǎng)絡圖片中的文字信息,支持印刷體、藝術字、豎行文本等文字識別 智能分類識別 檢測定位圖片上指定要識別的票證的文字信息 手寫文字識別 識別圖片中的手寫文字信息 應用場景 紙質(zhì)文件電子化 快遞單自動填寫 合同錄入與審核 企業(yè)歷史文件與報表電子化歸檔
return_excel 否 Boolean 是否返回表格轉(zhuǎn)換Microsoft Excel的Base64編碼字段??蛇x值包括: true: 返回'excel'字段,表示xlsx格式的表格識別結果的Base64編碼 false: 不返回。默認為false 對返回的Excel編碼,可用Python函數(shù)
對接OCR實現(xiàn)圖片上文字識別功能 背景信息 文字識別(Optical Character Recognition,簡稱OCR)以開放API的方式提供給用戶,用戶使用Python、Java等編程語言調(diào)用OCR服務API將圖片識別成文字,幫助用戶自動采集關鍵數(shù)據(jù),打造智能化業(yè)務系統(tǒng),提升業(yè)務效率
3850個漢字類別。標注信息包括了 文字行的邊界框 文字單字的邊界框 是否遮擋,扭曲 是打印文字或者手寫文字等 OCR面臨的挑戰(zhàn) 漢字字符識別 漢字字符的識別難度相比較英文字符要更大,字符的識別過程可以近似為分類,引文字符的分類數(shù)遠小于漢字單字的數(shù)量,所以分類
類識別、護照識別等功能。 API文檔 API概覽 申請服務 通用表格識別 智能分類識別 身份證識別 護照識別 營業(yè)執(zhí)照識別 火車票識別 增值稅發(fā)票識別 飛機行程單識別 06 SDK 文字識別軟件開發(fā)工具包(Optical Character Recognition Software
飛機行程單識別 自動識別飛機行程單的全部信息,一次掃描即可識別旅客姓名、有效身份證件號碼、訂單號、票價等全部信息。 定額發(fā)票識別 自動識別定額發(fā)票的全部信息,一次掃描即可識別發(fā)票號碼、發(fā)票代碼、地址、發(fā)票金額等全部信息。 火車票識別 自動識別火車票的全部信息,一次掃描即可識別一張車票的ID、檢票口信息、車次等全部信息。
文字識別SDK簡介 文字識別SDK概述 文字識別(Optical Character Recognition,簡稱OCR)將圖片或掃描件中的文字識別成可編輯的文本??纱嫒斯や浫?,提升業(yè)務效率。支持身份證、駕駛證、行駛證、發(fā)票、通用表格、通用文字等場景文字識別。 文字識別以開放API(Application
自定義OCR基于豐富的文字識別算法和行業(yè)知識積累,幫助客戶快速構建滿足不同業(yè)務場景需求的文字識別服務,實現(xiàn)多種版式圖像的文字信息結構化提取。
身份證識別 功能介紹 識別身份證圖片中的文字內(nèi)容,并將識別的結果以JSON格式返回給用戶。支持身份證翻拍、PS、模糊、反光、邊框完整性、邊框內(nèi)異物遮擋、復印件和臨時身份證告警功能。 該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 身份證信息核驗請使用人證核身服務。
識別類型 是 可識別的圖片類型, 當前僅支持通用文字識別??芍С謷呙栉募?、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別。 識別結果存儲目錄 是 指定識別結果存儲的OBS目錄。
使用OCR服務需要的權限 使用OCR服務時,如果您需要使用華為云對象存儲服務(OBS)中的數(shù)據(jù),請開通對象存儲服務OBS授權,可在控制臺進行開通。 OCR服務支持IAM細粒度劃分策略??梢詾樽佑脩粼O置OCR服務的使用權限。 父主題: 權限類
車牌識別 功能介紹 識別輸入圖片中的車牌信息,并以JSON格式返回其坐標和內(nèi)容。 該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 車牌示例圖 支持車牌信息、車牌顏色識別,支持雙行車牌識別,支持單張圖片內(nèi)多個車牌識別。 目前支持車牌類型含小型汽車
給子賬戶授予權限請參考權限管理。 圖4 設置用戶組 開通服務: 單擊“控制臺”>“服務列表”,找到“文字識別OCR”,進入文字識別控制臺。 圖5 文字識別控制臺 在文字識別控制臺“總覽”頁面,選擇對應產(chǎn)品的“終端節(jié)點”。不同區(qū)域OCR產(chǎn)品部署情況請參考終端節(jié)點。 圖6 終端節(jié)點 選擇產(chǎn)品類別,如:通用類、證
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行駛
文字識別的監(jiān)控指標 功能說明 本節(jié)定義了文字識別服務上報云監(jiān)控服務的監(jiān)控指標的命名空間,監(jiān)控指標列表和維度定義,用戶可以通過云監(jiān)控服務提供管理控制臺或API接口來檢索文字識別服務產(chǎn)生的監(jiān)控指標和告警信息。 命名空間 SYS.OCR 監(jiān)控指標詳情 表1 OCR支持的監(jiān)控指標 指標ID