檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
智能分類識別 功能介紹 自動分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標、結(jié)構(gòu)化識別的內(nèi)容以及對應的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。
FF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。 圖像中名片的有效占比超過60%,保證整張名片內(nèi)容包含在圖像內(nèi)。 支持圖像中名片的任意角度的水平旋轉(zhuǎn)(需開啟方向檢測)。 能處理反光、暗光、防偽標識等干擾的圖片但影響識別精度。
只支持中國大陸道路運輸證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。 支持圖像中道路運輸證任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光、防偽標識等干擾的圖片但影響識別精度。 調(diào)用方法
page2pix(self, doc, page, trans): """ 根據(jù)給定的參數(shù),解析當前頁作為圖片數(shù)據(jù) """ # 獲取指定頁面的pdf格式,注意:頁面參數(shù)是事先解析出來的,不然會存在問題。 return doc[page].getPixmap(matrix=trans
識別輸入圖片中的車牌信息,并返回其坐標和內(nèi)容 文字識別 識別圖片上的文字信息,返回識別的文字和坐標。支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場景的文字識別。 手寫文字識別 識別文檔中的手寫文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。 車輛通行費發(fā)票識別 識別車輛通行費發(fā)票中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 銀行卡識別
如何選購合適的API 文字識別服務(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡圖片識別:識別網(wǎng)絡圖片內(nèi)的所有文字及其對應位置信息。
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
tesseract是谷歌的一個對圖片進行識別的開源框架,免費使用,現(xiàn)在已經(jīng)支持中文,而且識別率非常高,這里簡要來個helloworld級別的認識 下載地址:http://code.google.com/p/tesseract-ocr/downloads/detail
提取圖片中的文字暗水印 功能介紹 對已嵌入文字暗水印的圖片進行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
道路運輸從業(yè)資格證識別 功能介紹 識別道路運輸從業(yè)資格證上的關鍵文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 圖1 道路運輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行
網(wǎng)絡圖片識別 智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗真 機動車銷售發(fā)票識別 出租車發(fā)票識別 火車票識別 定額發(fā)票識別 車輛通行費發(fā)票識別 飛機行程單識別 電子面單識別
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險單的掃描圖片及手機照片進行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。
圖解文字識別
認證”。 圖1 統(tǒng)一身份認證 單擊“創(chuàng)建用戶”,并設置IAM賬戶的用戶名、密碼,創(chuàng)建IAM用戶。 圖2 創(chuàng)建用戶 圖3 設置用戶名、密碼 給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設置用戶組 開通服務: 單擊“控制臺”>“服務列表”,找到“文字識別OCR”,進入文字識別控制臺。 圖5
通過該服務,可以同時識別出圖片中包含的不同傾角正臉及側(cè)臉。 圖1 人臉檢測示意圖 人臉比對 通過對人臉區(qū)域的特征進行對比,該服務可以返回給用戶兩張圖片中人臉的相似度。如果兩張圖片中包含多張人臉,則在兩張圖片中選取最大的人臉進行相似度比對。 圖2 人臉比對示意圖 人臉搜索 人臉搜索
發(fā)票識別與驗真 方案概述 資源和成本規(guī)劃 實施步驟
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進一步處理,節(jié)省大量的人工錄入成本。 機動車銷售發(fā)票識別 自動識別機動車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字
定額發(fā)票識別 功能介紹 識別定額發(fā)票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 定額發(fā)票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務。 約束與限制 支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
為連接器的名稱,“url”取值是圖片的URL, “front”表示識別的是身份證正面。 單擊腳本編輯器頁面上方的,保存腳本。 保存成功后,單擊,運行腳本。 不用設置輸入?yún)?shù),直接單擊測試窗口右上角的。 在輸出參數(shù)頁簽,檢查是否識別出身份證上文字信息。 識別出身份證上的文字信息,表明成功調(diào)用連接器。