檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
OCR服務(wù)支持上傳圖片后直接導(dǎo)出結(jié)果嗎 目前OCR服務(wù)不支持上傳圖片后直接導(dǎo)出結(jié)果,需要通過(guò)調(diào)用API的方式使用。具體操作請(qǐng)參考《文字識(shí)別服務(wù)快速入門(mén)》。 父主題: 產(chǎn)品咨詢(xún)類(lèi)
圖解文字識(shí)別
基本概念、云服務(wù)簡(jiǎn)介、專(zhuān)有名詞解釋?zhuān)?文字識(shí)別服務(wù) OCR:文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱(chēng)OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測(cè)識(shí)別成可編輯的文本格式,以JSON格式返回識(shí)別結(jié)果。 對(duì)象存儲(chǔ)服務(wù) OBS:對(duì)象存儲(chǔ)服務(wù)(Object
如何選購(gòu)合適的API 文字識(shí)別服務(wù)(OCR)提供四種類(lèi)型的API:通用類(lèi)、證件類(lèi)、票據(jù)類(lèi)、智能分類(lèi)。 通用類(lèi) 通用表格識(shí)別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識(shí)別:提取圖片內(nèi)的文字及其對(duì)應(yīng)位置信息。 手寫(xiě)文字識(shí)別:識(shí)別手寫(xiě)文字、印刷文字信息。 網(wǎng)絡(luò)圖片識(shí)別:識(shí)別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對(duì)應(yīng)位置信息。
定額發(fā)票識(shí)別 功能介紹 識(shí)別定額發(fā)票中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 定額發(fā)票示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類(lèi)識(shí)別服務(wù)。 約束與限制 支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。
是否支持從非華為云存儲(chǔ)中讀取圖片 OCR服務(wù)支持讀取公網(wǎng)http和https的圖片地址,如果使用非華為云存儲(chǔ),請(qǐng)確保相應(yīng)的圖片可以通過(guò)公網(wǎng)進(jìn)行訪問(wèn)。 父主題: API使用類(lèi)
如何提高識(shí)別速度 識(shí)別速度與圖片大小有關(guān),圖片大小會(huì)影響網(wǎng)絡(luò)傳輸、圖片base64解碼等處理過(guò)程的時(shí)間,因此建議在圖片文字清晰的情況下,適當(dāng)壓縮圖片的大小,以便降低圖片識(shí)別時(shí)間。推薦上傳JPG圖片格式。 根據(jù)實(shí)踐經(jīng)驗(yàn),一般建議證件類(lèi)的小圖(文字少)在1M以下,A4紙大小的密集文檔大圖在2M以下。
1對(duì)1咨詢(xún) 通用類(lèi)文字識(shí)別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識(shí)別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識(shí)別 1對(duì)1咨詢(xún) 智能分類(lèi)文字識(shí)別 檢測(cè)定位圖片上指定要識(shí)別的票證的文字信息 表格的文字與表格信息識(shí)別,可轉(zhuǎn)換成能編輯的Excel 1對(duì)1咨詢(xún) 證件類(lèi)文字識(shí)別 身份證、駕駛證、行
文字 文字。 文字塊的區(qū)域位置 文字塊的區(qū)域位置。 文字塊識(shí)別結(jié)果 文字塊識(shí)別結(jié)果。 圖片朝向 圖片朝向。 檢測(cè)到的文字塊數(shù)目 檢測(cè)到的文字塊數(shù)目。 身份證識(shí)別 識(shí)別身份證圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果返回給用戶(hù)。 輸入?yún)?shù) 用戶(hù)配置身份證識(shí)別執(zhí)行動(dòng)作,相關(guān)參數(shù)說(shuō)明如表5所示。
FunctionGraph,用于實(shí)現(xiàn)調(diào)用文字識(shí)別服務(wù)業(yè)務(wù)邏輯,當(dāng)收到OBS上傳圖片通知后,自動(dòng)調(diào)用文字識(shí)別 OCR服務(wù)進(jìn)行電子面單識(shí)別、網(wǎng)絡(luò)圖片識(shí)別并將結(jié)果存放在OBS桶內(nèi)。 使用文字識(shí)別 OCR,提供電子面單識(shí)別和網(wǎng)絡(luò)圖片識(shí)別。用戶(hù)只需要將電子面單圖片或含有收/寄件信息的截圖上傳至OBS桶,即可自動(dòng)識(shí)別提取收/
不動(dòng)產(chǎn)證識(shí)別 功能介紹 識(shí)別不動(dòng)產(chǎn)證中的文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類(lèi)識(shí)別服務(wù)。 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
火車(chē)票識(shí)別 功能介紹 識(shí)別火車(chē)票中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 火車(chē)票示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類(lèi)識(shí)別服務(wù)。 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。
銀行卡識(shí)別 功能介紹 識(shí)別銀行卡上的關(guān)鍵文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 銀行卡示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類(lèi)識(shí)別服務(wù)。 約束與限制 只支持識(shí)別JPG、JPEG、PNG、BMP、TIFF格式圖片。
票據(jù)類(lèi) 功能介紹 增值稅發(fā)票識(shí)別 通過(guò)對(duì)增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識(shí)別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識(shí)別出來(lái),用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票識(shí)別 自動(dòng)識(shí)別機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字
財(cái)務(wù)報(bào)表識(shí)別 功能介紹 識(shí)別用戶(hù)上傳的表格圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果返回給用戶(hù)。 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中識(shí)別區(qū)域有效占
營(yíng)業(yè)執(zhí)照識(shí)別 功能介紹 識(shí)別營(yíng)業(yè)執(zhí)照首頁(yè)圖片中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 營(yíng)業(yè)執(zhí)照示例圖 圖2 營(yíng)業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
電子面單識(shí)別 OCR電子面單識(shí)別已于2025.09.04正式下架,為避免影響您目前的業(yè)務(wù),請(qǐng)您及時(shí)進(jìn)行相關(guān)遷移工作,詳見(jiàn)下架公告。 功能介紹 識(shí)別用戶(hù)上傳的電子面單圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果以JSON格式返回給用戶(hù)。 圖1 電子面單示例圖 約束與限制 電子面單支持的版式以樣例為準(zhǔn)。
為連接器的名稱(chēng),“url”取值是圖片的URL, “front”表示識(shí)別的是身份證正面。 單擊腳本編輯器頁(yè)面上方的,保存腳本。 保存成功后,單擊,運(yùn)行腳本。 不用設(shè)置輸入?yún)?shù),直接單擊測(cè)試窗口右上角的。 在輸出參數(shù)頁(yè)簽,檢查是否識(shí)別出身份證上文字信息。 識(shí)別出身份證上的文字信息,表明成功調(diào)用連接器。
高/行876 這樣就算是將圖片打開(kāi)了,下一步中心切割圖片中心切割圖片的目的就是,將長(zhǎng)方形圖片切割為正方形圖片,正方形的邊長(zhǎng)等于長(zhǎng)方形的高首先圖片的數(shù)字表示結(jié)構(gòu)是這樣的然后我們裁剪為中間的正方形,就是:行的信息全要列的信息要居中部分顏色信息全要體現(xiàn)到數(shù)組上就是[ : , col_start
目的 識(shí)別手寫(xiě)數(shù)字圖片是深度學(xué)習(xí)的print(“Hello world!”),是入門(mén)級(jí)別的小實(shí)驗(yàn),主要是熟悉卷積神經(jīng)網(wǎng)絡(luò)的開(kāi)發(fā)流程。本次用到的依然是經(jīng)典的minist數(shù)據(jù)集,不過(guò)事先分出了訓(xùn)練集和測(cè)試集并轉(zhuǎn)換成csv格式。 網(wǎng)絡(luò)結(jié)構(gòu)和流程 1.結(jié)構(gòu)簡(jiǎn)述 由