檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
網(wǎng)絡(luò)圖片識別 功能介紹 識別網(wǎng)絡(luò)圖片中的文字內(nèi)容,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持橫向、豎向、藝術(shù)字識別,支持字體分類和長圖檢測。 該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 網(wǎng)絡(luò)圖片示例圖 約束與限制 支持中英文及部分中文繁體字。
通用文字識別 功能介紹 識別圖片上的文字信息,以JSON格式返回識別的文字和坐標(biāo)。支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別。 支持中英文以及部分繁體字。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 通用文字示例圖 約束與限制
在華為云Astro輕應(yīng)用中,通過應(yīng)用與OCR對接,可實(shí)現(xiàn)圖片或掃描件中文字識別功能。例如,識別某用戶上傳到華為OBS上的身份證圖片的全部信息。 前提條件 已申請身份證識別服務(wù),具體操作請參見開通文字識別服務(wù)。
None 服務(wù)介紹 文字識別 OCR 文字識別技術(shù)簡介 01:46 文字識別技術(shù)簡介 快速入門 文字識別 OCR 使用SDK 06:38 SDK使用指導(dǎo) 文字識別 OCR 使用API 03:04 API使用指導(dǎo) 問題排查 文字識別 OCR 獲取Token時(shí)帳密報(bào)錯(cuò) 03:53 獲取Token時(shí)帳密報(bào)錯(cuò)
獲取漢字轉(zhuǎn)拼音 將文本轉(zhuǎn)換為拼音,支持全拼和縮寫。 輸入?yún)?shù) 用戶配置獲取漢字轉(zhuǎn)拼音執(zhí)行動(dòng)作,相關(guān)參數(shù)說明如表2所示。 表2 獲取漢字轉(zhuǎn)拼音輸入?yún)?shù)說明 參數(shù) 必填 說明 示例值/默認(rèn)值 文本內(nèi)容 是 輸入文本內(nèi)容。
pdf轉(zhuǎn)圖片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg:
對接OCR實(shí)現(xiàn)圖片上文字識別功能 背景信息 文字識別(Optical Character Recognition,簡稱OCR)以開放API的方式提供給用戶,用戶使用Python、Java等編程語言調(diào)用OCR服務(wù)API將圖片識別成文字,幫助用戶自動(dòng)采集關(guān)鍵數(shù)據(jù),打造智能化業(yè)務(wù)系統(tǒng),提升業(yè)務(wù)效率
識別圖片上的文字信息,支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別 網(wǎng)絡(luò)圖片識別 識別網(wǎng)絡(luò)圖片中的文字信息,支持印刷體、藝術(shù)字、豎行文本等文字識別 智能分類識別 檢測定位圖片上指定要識別的票證的文字信息 手寫文字識別 識別圖片中的手寫文字信息 應(yīng)用場景 紙質(zhì)文件電子化 快遞單自動(dòng)填寫 合同錄入與審核 企業(yè)歷史文件與報(bào)表電子化歸檔
類識別、護(hù)照識別等功能。 API文檔 API概覽 申請服務(wù) 通用表格識別 智能分類識別 身份證識別 護(hù)照識別 營業(yè)執(zhí)照識別 火車票識別 增值稅發(fā)票識別 飛機(jī)行程單識別 06 SDK 文字識別軟件開發(fā)工具包(Optical Character Recognition Software
文字識別服務(wù)等級協(xié)議請參見華為云服務(wù)等級協(xié)議。 OCR能力 通用類 OCR 通用類OCR(General OCR),支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片上文字信息的自動(dòng)化識別,自適應(yīng)分析各種版面和表格,快速實(shí)現(xiàn)各種文檔電子化。 證件類 OCR 證件類OCR(Card OCR),支持身份證、駕駛證、行
手寫文字識別 功能介紹 識別文檔中的手寫文字、印刷文字信息,并將識別的結(jié)構(gòu)化結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 手寫文字示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
OCR服務(wù)可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進(jìn)行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進(jìn)行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結(jié)果后處理。 父主題: 產(chǎn)品咨詢類
單擊添加多個(gè)模板,針對每個(gè)模板,選擇模板類型,并且上傳圖片。 “上傳圖片”:單擊“上傳圖片”區(qū)域,或鼠標(biāo)直接拖拽圖片至“上傳圖片”區(qū)域,上傳本地一張圖片作為模板,用于業(yè)務(wù)場景的文字結(jié)構(gòu)化識別。 “修改模板名稱”:單擊圖片右側(cè)的,在彈出的輸入框中輸入新的模板名稱,單擊“確認(rèn)”。 “刪除模板”:單擊圖片右側(cè)“刪除”,在彈出的確認(rèn)刪除對話框中單擊“確認(rèn)”。
上傳模板圖片 在使用單模板工作流開發(fā)應(yīng)用之前,必須確保需要識別的圖片都屬于同一類型的模板。同一類模板的圖片,它們有相同的版面排布,且要識別的文字類型和位置均要求固定。如果您的圖片具有多種模板,請考慮使用“多模板工作流”。 確認(rèn)模板類型后,要準(zhǔn)備一張文字清晰的圖作為模板圖片,模板圖中要
文字識別SDK簡介 文字識別SDK概述 文字識別(Optical Character Recognition,簡稱OCR)將圖片或掃描件中的文字識別成可編輯的文本??纱嫒斯や浫?,提升業(yè)務(wù)效率。支持身份證、駕駛證、行駛證、發(fā)票、通用表格、通用文字等場景文字識別。 文字識別以開放API(Application
細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 通用表格示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 圖像中識別區(qū)域有效占比超過80%,保證整張表格及其邊緣包含在圖像內(nèi)。
文字識別 OCR 文字識別 OCR 文字識別(Optical Character Recognition,簡稱OCR)提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。支持通用類識別、證件類識別、票據(jù)類識別、行業(yè)類識別和智能文檔解析,具備高精度、高性能的全文識別和高階結(jié)構(gòu)化識別能力。
如何獲取圖片base64編碼 OCR服務(wù)的輸入圖片參數(shù)是圖片的base64編碼,介紹如何將本地圖片,轉(zhuǎn)換為base64編碼。您也可以使用在線的圖片轉(zhuǎn)base64工具。 Python示例: 使用時(shí),需要將代碼的d:\demo.jpg替換為實(shí)際圖片路徑。 import base64 with
使用OCR服務(wù)是否必須使用華為云存儲圖片 文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。 如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。 關(guān)于OBS的使用請參考配置OBS訪問權(quán)限。 OCR識別OBS私有桶中
車牌識別 功能介紹 識別輸入圖片中的車牌信息,并以JSON格式返回其坐標(biāo)和內(nèi)容。 該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 車牌示例圖 支持車牌信息、車牌顏色識別,支持雙行車牌識別,支持單張圖片內(nèi)多個(gè)車牌識別。 目前支持車牌類型含小型汽車
身份證信息核驗(yàn)請使用人證核身服務(wù)。 圖1 身份證示例圖 身份證識別支持中華人民共和國居民身份證識別。 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 支持中華人民共和國居民身份證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到
信創(chuàng)新研究,華為云OCR服務(wù)已正式通過AIC4 Type 1審計(jì)認(rèn)證,華為云將持續(xù)為廣大客戶提供值得信賴的可信AI服務(wù)。 產(chǎn)品列表 增值稅發(fā)票識別 識別增值稅發(fā)票關(guān)鍵字段信息,結(jié)構(gòu)化輸出結(jié)果。支持圖片及PDF、OFD文檔識別。 機(jī)動(dòng)車銷售發(fā)票識別 自動(dòng)分類識別機(jī)動(dòng)車銷售發(fā)票和二手車銷售發(fā)票上的關(guān)鍵字段
圖片質(zhì)量類報(bào)錯(cuò)處理辦法 問題現(xiàn)象 調(diào)用文字識別API時(shí),產(chǎn)生以下圖片質(zhì)量類報(bào)錯(cuò)。 錯(cuò)誤碼AIS.0102:圖片格式不支持。 錯(cuò)誤碼AIS.0103:圖片尺寸不滿足要求。 錯(cuò)誤碼AIS.0104:非支持的圖片類型或圖片質(zhì)量差。 解決方法 請參考產(chǎn)品介紹 > 約束與限制章節(jié)檢查圖片的格式、像素是否符合規(guī)范。
證件類 證件類OCR(Card OCR),支持身份證識別、行駛證識別、駕駛證識別、護(hù)照識別、銀行卡識別、營業(yè)執(zhí)照識別、名片識別、車牌識別、VIN碼識別、道路運(yùn)輸證識別、道路運(yùn)輸從業(yè)資格證識別等卡證圖片上有效信息的自動(dòng)識別和關(guān)鍵字段結(jié)構(gòu)化提取。 證件類OCR(Card OCR),支持身