檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
FF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。 只支持識別銀行卡正面,不支持識別背面。 只支持識別85.60×53.98 mm常規(guī)大小的銀行卡,不支持迷你卡和形狀不規(guī)則的異形卡。 支持圖像中銀行卡任意角度的水平旋轉(zhuǎn)。
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險單的掃描圖片及手機照片進行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。 支持圖像中行程單任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光等干擾的圖片但影響識別精度。 調(diào)用方法 請參見如何調(diào)用API。 前提條件 在使用之前,
營業(yè)執(zhí)照識別 功能介紹 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 營業(yè)執(zhí)照示例圖 圖2 營業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。 圖像中發(fā)票區(qū)域有效占比超過25%,保證整張發(fā)票內(nèi)容及其邊緣包含在圖像內(nèi)。 支持少量扭曲,扭曲后圖像中的發(fā)票長寬比與實際發(fā)票相差不超過10%。 支持圖像中出租車發(fā)票任意角度的水平旋轉(zhuǎn)。
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“通用單模
支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。 圖像中發(fā)票區(qū)域有效占比超過25%。 支持圖像中車輛通行費發(fā)票任意角度的水平旋轉(zhuǎn)。 目前只支持中華人民共和國境內(nèi)的車輛通行費發(fā)票識別。
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“多模板分
VIN碼識別 功能介紹 識別圖片中的車架號信息,并將識別結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 VIN碼示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在1
泰國車牌識別 功能介紹 識別泰國車牌圖片中的車牌信息,返回識別結(jié)果和車牌的區(qū)域位置信息。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 泰國車牌示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大
1.2.8 文字識別計算機文字識別,俗稱光學(xué)字符識別(Optical Character Recognition),是利用光學(xué)掃描技術(shù)將票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計算機輸入技術(shù)。該技術(shù)可應(yīng)用于如表1-4所示
DF默認(rèn)識別第一頁,或者您可以指定要識別的頁碼。 圖像各邊的像素大小在15px到8192px之間。單個圖片、PDF文件其對應(yīng)的Base64編碼不超過10MB。 支持單圖多印章識別。 支持圖像中印章任意角度的水平旋轉(zhuǎn)。 支持圓形章、橢圓章、方形章、三角章和菱形章的檢測和識別。 能處
如何選購合適的API 文字識別服務(wù)(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡(luò)圖片識別:識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息。
身份證識別可以判斷身份證真假么 不支持判斷身份證的真假,該服務(wù)可以識別身份證圖片中的文字內(nèi)容,并將識別的結(jié)果以json格式返回給用戶。 父主題: 產(chǎn)品咨詢類
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
識別結(jié)果容易漏字或多識別出內(nèi)容怎么辦? 識別結(jié)果是根據(jù)識別區(qū)來進行提取的,識別區(qū)的位置和大小均會影響識別結(jié)果。 若結(jié)果漏字,可能是由于識別區(qū)太小導(dǎo)致的,需在相應(yīng)模板的"框選識別區(qū)"頁面,把漏字的識別區(qū)調(diào)大一些。 若多識別出文字,可能是識別區(qū)太大,將周邊無關(guān)的文字也框進來了,需將識別區(qū)改小一點。
網(wǎng)絡(luò)圖片識別 智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗真 機動車銷售發(fā)票識別 出租車發(fā)票識別 火車票識別 定額發(fā)票識別 車輛通行費發(fā)票識別 飛機行程單識別 電子面單識別
OCR服務(wù)需要用戶通過調(diào)用API接口,將圖片或掃描件中的文字識別成可編輯的文本,然后返回JSON格式的識別結(jié)果,用戶需要通過編碼將識別結(jié)果對接到業(yè)務(wù)系統(tǒng)或保存為TXT、Excel等格式。 關(guān)于文字識別的相關(guān)聲明請參見文字識別服務(wù)聲明。 文字識別服務(wù)等級協(xié)議請參見華為云服務(wù)等級協(xié)議。
OpenCV在TEXT擴展模塊中支持場景文字識別,最早的場景文字檢測是基于級聯(lián)檢測器實現(xiàn),OpenCV中早期的場景文字檢測是基于極值區(qū)域文本定位與識別、最新的OpenCV3.4.x之后的版本添加了卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)場景文字檢測,后者的準(zhǔn)確性與穩(wěn)定性比前者有了很大的改觀,不再是雞肋算法,是可以應(yīng)用到實際場景中的。值得
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行