檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
文字識別的監(jiān)控指標(biāo) 功能說明 本節(jié)定義了文字識別服務(wù)上報(bào)云監(jiān)控服務(wù)的監(jiān)控指標(biāo)的命名空間,監(jiān)控指標(biāo)列表和維度定義,用戶可以通過云監(jiān)控服務(wù)提供管理控制臺或API接口來檢索文字識別服務(wù)產(chǎn)生的監(jiān)控指標(biāo)和告警信息。 命名空間 SYS.OCR 監(jiān)控指標(biāo)詳情 表1 OCR支持的監(jiān)控指標(biāo) 指標(biāo)ID
提取圖片中的文字暗水印 功能介紹 對已嵌入文字暗水印的圖片進(jìn)行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務(wù)以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
道路運(yùn)輸從業(yè)資格證識別 功能介紹 識別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。
IFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 圖像中名片的有效占比超過60%,保證整張名片內(nèi)容包含在圖像內(nèi)。 支持圖像中名片的任意角度的水平旋轉(zhuǎn)(需開啟方向檢測)。 能處理反光、暗光、防偽標(biāo)識等干擾的圖片但影響識別精度。
駕駛證識別 功能介紹 識別駕駛證圖片中主頁與副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制
只支持中國大陸行駛證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在100px到8000px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 圖像中行駛證區(qū)域有效占比超過50%,保證整張行駛證內(nèi)容及其邊緣包含在圖像內(nèi)。 支持圖像中行駛證任意角度的水平旋轉(zhuǎn)。
智能分類識別 功能介紹 自動(dòng)分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。
通用表格識別是否支持導(dǎo)出為excel格式 通用表格識別支持將表格內(nèi)容轉(zhuǎn)換成可編輯的Excel格式,傳入?yún)?shù)return_excel為true時(shí),將返回的表格轉(zhuǎn)換為Microsoft Excel對應(yīng)的base64編碼,可用Python函數(shù) base64.b64decode解碼后保存為
tesseract是谷歌的一個(gè)對圖片進(jìn)行識別的開源框架,免費(fèi)使用,現(xiàn)在已經(jīng)支持中文,而且識別率非常高,這里簡要來個(gè)helloworld級別的認(rèn)識 下載地址:http://code.google.com/p/tesseract-ocr/downloads/detail
認(rèn)證”。 圖1 統(tǒng)一身份認(rèn)證 單擊“創(chuàng)建用戶”,并設(shè)置IAM賬戶的用戶名、密碼,創(chuàng)建IAM用戶。 圖2 創(chuàng)建用戶 圖3 設(shè)置用戶名、密碼 給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5
保險(xiǎn)單識別 功能介紹 識別保險(xiǎn)單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險(xiǎn)單的掃描圖片及手機(jī)照片進(jìn)行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 發(fā)票驗(yàn)真API請參見發(fā)票驗(yàn)真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
護(hù)照識別 功能介紹 識別護(hù)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國普通電子護(hù)照的全字段識別。中國-港澳臺地區(qū)、外國護(hù)照支持護(hù)照下方兩行國際標(biāo)準(zhǔn)化的機(jī)讀碼識別,并可從中提取7個(gè)關(guān)鍵字段信息。該接口的使用限制請參見約束與限
圖解文字識別
智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護(hù)照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運(yùn)輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗(yàn)真 機(jī)動(dòng)車銷售發(fā)票識別 出租車發(fā)票識別 火車票識別 定額發(fā)票識別 車輛通行費(fèi)發(fā)票識別 飛機(jī)行程單識別 電子面單識別
開始使用 1、網(wǎng)絡(luò)圖片識別:支持圖片格式等約束信息詳網(wǎng)絡(luò)圖片識別文檔 2、電子面單識別:支持圖片格式等約束信息詳電子面單識別文檔 登錄對象存儲服務(wù) OBS控制臺,在桶列表選擇快速部署 步驟三創(chuàng)建的用于上傳快遞圖片的OBS桶,可直接上傳圖片或上傳壓縮包(支持zip及tar格式),如果上傳
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動(dòng)車銷售發(fā)票識別 自動(dòng)識別機(jī)動(dòng)車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字
只支持中國大陸道路運(yùn)輸證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 支持圖像中道路運(yùn)輸證任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光、防偽標(biāo)識等干擾的圖片但影響識別精度。 調(diào)用方法
如何選購合適的API 文字識別服務(wù)(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡(luò)圖片識別:識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息。
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行