檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
參考表16。 表16 文字識別輸出參數(shù)說明 參數(shù) 說明 識別文字塊列表 識別文字塊列表,輸出順序從左到右,先上后下。 文字塊識別結(jié)果 文字塊識別結(jié)果。 手寫文字識別 識別文檔中的手寫文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。 輸入?yún)?shù) 用戶配置手寫文字票識別執(zhí)行動作,相關(guān)參數(shù)說明如表17所示。
智能分類識別 功能介紹 自動分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。
飛機(jī)行程單識別 自動識別飛機(jī)行程單的全部信息,一次掃描即可識別旅客姓名、有效身份證件號碼、訂單號、票價等全部信息。 定額發(fā)票識別 自動識別定額發(fā)票的全部信息,一次掃描即可識別發(fā)票號碼、發(fā)票代碼、地址、發(fā)票金額等全部信息。 火車票識別 自動識別火車票的全部信息,一次掃描即可識別一張車票的ID、檢票口信息、車次等全部信息。
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
圖解文字識別
問:OCR服務(wù)識別結(jié)果可以轉(zhuǎn)化為Word或者TXT嗎?答:OCR提取之后返回的結(jié)果是JSON格式,需要用戶通過編程,將結(jié)果保存為Word或者TXT格式。
現(xiàn)了多種字體和手寫體文字識別機(jī),其識別精度和機(jī)器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機(jī)和印刷體英文數(shù)字識別機(jī)。70年代主要研究文字識別的基本理論和研制高性能的文字識別機(jī),并著重于漢字識別的研究。
護(hù)照識別 功能介紹 識別護(hù)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國普通電子護(hù)照的全字段識別。中國-港澳臺地區(qū)、外國護(hù)照支持護(hù)照下方兩行國際標(biāo)準(zhǔn)化的機(jī)讀碼識別,并可從中提取7個關(guān)鍵字段信息。該接口的使用限制請參見約束與限
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3
道路運輸從業(yè)資格證識別 功能介紹 識別道路運輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 圖1 道路運輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
3850個漢字類別。標(biāo)注信息包括了 文字行的邊界框 文字單字的邊界框 是否遮擋,扭曲 是打印文字或者手寫文字等 OCR面臨的挑戰(zhàn) 漢字字符識別 漢字字符的識別難度相比較英文字符要更大,字符的識別過程可以近似為分類,引文字符的分類數(shù)遠(yuǎn)小于漢字單字的數(shù)量,所以分類
發(fā)票識別與驗真 方案概述 資源和成本規(guī)劃 實施步驟
Sliding Line Point Regression for Shape Robust Scene Text Detection扭曲形狀文字檢測:傳統(tǒng)文本檢測方法主要關(guān)注四邊形文本,為了檢測自然場景中任意形狀的文本,論文提出了新的方法——滑線點回歸SLPR。SLPR將文本行邊緣
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險單的掃描圖片及手機(jī)照片進(jìn)行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
出租車發(fā)票識別 支持識別全國各主要城市的出租車票的全字段信息識別 火車票識別 支持對火車票上的主要字段進(jìn)行結(jié)構(gòu)化識別,包括車票號碼、始發(fā)站、目的站、車次、日期、票價、席別、姓名等 定額發(fā)票識別 支持對定額發(fā)票中的發(fā)票代碼、發(fā)票號碼、金額信息、發(fā)票地址等信息的結(jié)構(gòu)化識別 車輛通行費發(fā)票識別
了。使用服務(wù): OCR通用文字識別服務(wù)如何解決: 軟件運行于后臺,創(chuàng)建鉤子實時監(jiān)聽鼠標(biāo)右鍵動作,若判斷到出現(xiàn)圈題動作,程序?qū)⒆詣釉诤笈_定位到鼠標(biāo)圈住的坐標(biāo)區(qū)域,并且轉(zhuǎn)換為base64圖片編碼,接著調(diào)用華為云OCR通用文字識別服務(wù),實現(xiàn)圖片轉(zhuǎn)文字功能,接下來只需再次
OCR服務(wù)可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進(jìn)行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進(jìn)行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結(jié)果后處理。 父主題: 產(chǎn)品咨詢類
調(diào),具體參見ModelArts AI Gallery算法Aster使用指南。訓(xùn)練后生成的模型可直接在ModelArts平臺部署成在線服務(wù)。對于英文識別任務(wù),一般采用Accuracy作為評價指標(biāo):對于網(wǎng)絡(luò)預(yù)測的字符串以及對應(yīng)的gt,需要先進(jìn)行歸一化(去掉除字母和數(shù)字以外的字符,并統(tǒng)
表4 文字識別輸出參數(shù)說明 參數(shù) 說明 識別文字塊列表 識別文字塊列表,輸出順序從左到右,先上后下。 文字 文字。 文字塊的區(qū)域位置 文字塊的區(qū)域位置。 文字塊識別結(jié)果 文字塊識別結(jié)果。 圖片朝向 圖片朝向。 檢測到的文字塊數(shù)目 檢測到的文字塊數(shù)目。 身份證識別 識別身份證圖片