檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
OCR服務(wù)可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進(jìn)行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進(jìn)行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結(jié)果后處理。 父主題: 產(chǎn)品咨詢類
支持常見網(wǎng)絡(luò)圖片如:手機(jī)截圖、電腦截圖、電商產(chǎn)品圖及廣告設(shè)計(jì)圖等互聯(lián)網(wǎng)圖片。 圖像各邊的像素大小在15到30000px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 圖像中有效文字圖片占比超過60%,避免有效文字圖片占比過小。 支持圖像中有效文字圖片的任意角度的水平旋轉(zhuǎn)(需開啟方向檢測)。 文字識別服務(wù)屬
等問題,對文字定位和識別的準(zhǔn)確度是巨大的挑戰(zhàn)。 逐一擊破 華為云OCR通過圖像預(yù)處理、表單文字定位、證件文字定位與信息抽取、后處理集成學(xué)習(xí)技術(shù),對以上挑戰(zhàn)一一擊破,并取得了明顯的效果。 首先,在圖像預(yù)處理技術(shù)方面,針對蓋章和錯(cuò)行的問題,用最新的深度學(xué)習(xí)模型,直接分離文字、表格線與
定額發(fā)票識別 功能介紹 識別定額發(fā)票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 定額發(fā)票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
OCR服務(wù)支持批量識別嗎 OCR服務(wù)只支持調(diào)用一次接口識別一張圖片,批量識別需要進(jìn)行二次開發(fā),編碼循環(huán)調(diào)用API,實(shí)現(xiàn)批量調(diào)用服務(wù)識別圖片。 父主題: API使用類
Recognition,簡稱OCR)操作權(quán)限權(quán)。 操作步驟 在文字識別控制臺左側(cè)導(dǎo)航欄選擇“自定義OCR”。 默認(rèn)進(jìn)入“我的應(yīng)用”頁簽。 圖1 文字識別控制臺 在“我的應(yīng)用”頁簽下,單擊“創(chuàng)建應(yīng)用”。 進(jìn)入“創(chuàng)建應(yīng)用”頁面。 圖2 創(chuàng)建應(yīng)用 您也可以單擊“我的工作流”,切換至“我的工作流”頁簽,選擇工作流并單擊卡片中的“創(chuàng)建應(yīng)用”。
ox的預(yù)測類別和真實(shí)類別間的交叉熵?fù)p失優(yōu)化學(xué)習(xí)。圖4 CUTIE模型架構(gòu)2. 基于圖結(jié)構(gòu)的文檔圖片關(guān)鍵信息提取技術(shù) 基于圖結(jié)構(gòu)的方法是將文檔圖片看作是由文本切片(text segment)組成的圖結(jié)構(gòu),并利用神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí)出各文本切片間的關(guān)系來提取出文檔的關(guān)鍵信息內(nèi)容。2
OCR文字識別服務(wù)計(jì)費(fèi)可以按照項(xiàng)目來分別計(jì)費(fèi)嗎 可以。 OCR支持通過企業(yè)項(xiàng)目管理(EPS)對不同用戶組和用戶的資源使用進(jìn)行分賬。 詳情請參考API接口文檔里的Enterprise-Project-Id參數(shù)。 父主題: 計(jì)費(fèi)FAQ
VIN碼識別 功能介紹 識別圖片中的車架號信息,并將識別結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 VIN碼示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小
單擊添加多個(gè)模板,針對每個(gè)模板,選擇模板類型,并且上傳圖片。 “上傳圖片”:單擊“上傳圖片”區(qū)域,或鼠標(biāo)直接拖拽圖片至“上傳圖片”區(qū)域,上傳本地一張圖片作為模板,用于業(yè)務(wù)場景的文字結(jié)構(gòu)化識別。 “修改模板名稱”:單擊圖片右側(cè)的,在彈出的輸入框中輸入新的模板名稱,單擊“確認(rèn)”。 “刪除模板”:單擊圖片右側(cè)“刪除”,在彈出的確認(rèn)刪除對話框中單擊“確認(rèn)”。
泰國車牌識別 功能介紹 識別泰國車牌圖片中的車牌信息,返回識別結(jié)果和車牌的區(qū)域位置信息。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 泰國車牌示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大
文字識別:一般包括文字信息的采集、信息的分析與處理、信息的分類判別等幾個(gè)部分。信息采集 將紙面上的文字灰度變換成電信號,輸入到計(jì)算機(jī)中去。信息采集由文字識別機(jī)中的送紙機(jī)構(gòu)和光電變換裝置來實(shí)現(xiàn),有飛點(diǎn)掃描、攝像機(jī)、光敏元件和激光掃描等光電變換裝置。信息分析和處理 對變換后的電信號消
營業(yè)執(zhí)照識別 功能介紹 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 營業(yè)執(zhí)照示例圖 圖2 營業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
火車票識別 功能介紹 識別火車票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 火車票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
圖片質(zhì)量類報(bào)錯(cuò)處理辦法 問題現(xiàn)象 調(diào)用文字識別API時(shí),產(chǎn)生以下圖片質(zhì)量類報(bào)錯(cuò)。 錯(cuò)誤碼AIS.0102:圖片格式不支持。 錯(cuò)誤碼AIS.0103:圖片尺寸不滿足要求。 錯(cuò)誤碼AIS.0104:非支持的圖片類型或圖片質(zhì)量差。 解決方法 請參考產(chǎn)品介紹 > 約束與限制章節(jié)檢查圖片的格式、像素是否符合規(guī)范。
使用流程簡介 文字識別是指對圖像中的打印字符進(jìn)行檢測識別,通過調(diào)用API,識別圖片中的文字,并返回JSON格式的識別結(jié)果。 使用流程 圖1 使用流程 使用前必讀 用戶需要具備編程能力,熟悉Java、Python、iOS、Android、Node.js編程語言。 OCR服務(wù)需要用戶通
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“通用單模
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“多模板分
上傳模板圖片 在使用單模板工作流開發(fā)應(yīng)用之前,必須確保需要識別的圖片都屬于同一類型的模板。同一類模板的圖片,它們有相同的版面排布,且要識別的文字類型和位置均要求固定。如果您的圖片具有多種模板,請考慮使用“多模板工作流”。 確認(rèn)模板類型后,要準(zhǔn)備一張文字清晰的圖作為模板圖片,模板圖中要
requirements. 圖片尺寸不滿足要求。 請檢查圖片尺寸,各服務(wù)支持圖片尺寸請參考使用限制。 AIS.0104 The image is not supported or the image quality is poor. 非支持的圖片類型或圖片質(zhì)量差。 請檢查圖片類型與圖片質(zhì)量。 請檢查調(diào)用的接口是否正確。