檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
識別機動車銷售發(fā)票圖片中的文字內容,并將識別的結果返回給用戶。該增值稅發(fā)票僅限于中華人民共和國境內使用的增值稅發(fā)票。 火車票識別 識別火車票中的文字信息,并返回識別的結構化結果。 營業(yè)執(zhí)照識別 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并返回識別的結構化結果。 身份證識別 識別身份證圖片
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行駛
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內容,并將識別的結果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調用智能分類識別服務。 約束與限制 只支持中國大陸行駛證的識別。
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預處理、表格提取、文字提取、文字識別、結構化信息輸出等一系列技術化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進一步處理,節(jié)省大量的人工錄入成本。 機動車銷售發(fā)票識別 自動識別機動車銷售發(fā)票圖片內的文本內容,并返回結構
問:OCR服務識別結果可以轉化為Word或者TXT嗎?答:OCR提取之后返回的結果是JSON格式,需要用戶通過編程,將結果保存為Word或者TXT格式。
現(xiàn)了多種字體和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機和印刷體英文數(shù)字識別機。70年代主要研究文字識別的基本理論和研制高性能的文字識別機,并著重于漢字識別的研究。
智能分類識別 功能介紹 自動分類識別17+種票證,支持指定票證的結構化識別和印章檢測,并以JSON格式返回識別的結構化結果。 接口以列表形式返回圖片上要識別票證的位置坐標、結構化識別的內容以及對應的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。
導請參見OCR服務使用簡介章節(jié)。 圖1 護照示例圖 如果圖片中包含多張卡證票據(jù),請調用智能分類識別服務。 約束與限制 支持中國大陸護照的全字段識別。 支持含有完整機讀碼的中國-港澳臺地區(qū)及外國護照識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像
信創(chuàng)新研究,華為云OCR服務已正式通過AIC4 Type 1審計認證,華為云將持續(xù)為廣大客戶提供值得信賴的可信AI服務。 產(chǎn)品列表 增值稅發(fā)票識別 識別增值稅發(fā)票關鍵字段信息,結構化輸出結果。支持圖片及PDF、OFD文檔識別。 機動車銷售發(fā)票識別 自動分類識別機動車銷售發(fā)票和二手車銷售發(fā)票上的關鍵字段
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結構化結果。支持對多種不同版式名片進行結構化信息提取。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
1.2.8 文字識別計算機文字識別,俗稱光學字符識別(Optical Character Recognition),是利用光學掃描技術將票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的計算機輸入技術。該技術可應用于如表1-4所示
道路運輸從業(yè)資格證識別 功能介紹 識別道路運輸從業(yè)資格證上的關鍵文字信息,并返回識別的結構化結果。 圖1 道路運輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。
整的端到端OCR流程: (1)準備一張含有文字的原圖; (2)對原圖進行文字位置的檢測,檢測結果可能是水平矩形框,也可能是傾斜矩形框; (3)從原圖中把文字框對應的圖片切下來,并旋轉正,得到水平的文字塊切片圖; (4)對每個文字塊切片圖依次進行字符識別,每個切片圖
Sliding Line Point Regression for Shape Robust Scene Text Detection扭曲形狀文字檢測:傳統(tǒng)文本檢測方法主要關注四邊形文本,為了檢測自然場景中任意形狀的文本,論文提出了新的方法——滑線點回歸SLPR。SLPR將文本行邊緣
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結構化結果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
發(fā)票識別與驗真 方案概述 資源和成本規(guī)劃 實施步驟
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結構化結果返回給用戶。支持對多板式保險單的掃描圖片及手機照片進行結構化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。
size的大小workers8int是是workers的數(shù)量height64int是是網(wǎng)絡輸入圖片的高度width256int是是網(wǎng)絡輸入圖片的寬度voc_typeALLCASES_SYMBOLSString是否表示識別的類別包括大小寫字母數(shù)字以及標點符號archResNet_ASTERStrin
文字識別能離線嗎
文字塊的區(qū)域位置 文字塊的區(qū)域位置。 文字塊識別結果 文字塊識別結果。 圖片朝向 圖片朝向。 檢測到的文字塊數(shù)目 檢測到的文字塊數(shù)目。 身份證識別 識別身份證圖片中的文字內容,并將識別的結果返回給用戶。 輸入?yún)?shù) 用戶配置身份證識別執(zhí)行動作,相關參數(shù)說明如表5所示。 表5 身份證識別輸入?yún)?shù)說明