檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
1審計(jì)認(rèn)證,華為云將持續(xù)為廣大客戶(hù)提供值得信賴(lài)的可信AI服務(wù)。 產(chǎn)品列表 增值稅發(fā)票識(shí)別 識(shí)別增值稅發(fā)票關(guān)鍵字段信息,結(jié)構(gòu)化輸出結(jié)果。支持圖片及PDF、OFD文檔識(shí)別。 機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票識(shí)別 自動(dòng)分類(lèi)識(shí)別機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票和二手車(chē)銷(xiāo)售發(fā)票上的關(guān)鍵字段 出租車(chē)發(fā)票識(shí)別 支持識(shí)別全國(guó)各主要城市的出租車(chē)票的全字段信息識(shí)別 火車(chē)票識(shí)別
護(hù)照識(shí)別 功能介紹 識(shí)別護(hù)照首頁(yè)圖片中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國(guó)普通電子護(hù)照的全字段識(shí)別。中國(guó)-港澳臺(tái)地區(qū)、外國(guó)護(hù)照支持護(hù)照下方兩行國(guó)際標(biāo)準(zhǔn)化的機(jī)讀碼識(shí)別,并可從中提取7個(gè)關(guān)鍵字段信息。該接口的使用限制請(qǐng)參見(jiàn)約束與限
認(rèn)證”。 圖1 統(tǒng)一身份認(rèn)證 單擊“創(chuàng)建用戶(hù)”,并設(shè)置IAM賬戶(hù)的用戶(hù)名、密碼,創(chuàng)建IAM用戶(hù)。 圖2 創(chuàng)建用戶(hù) 圖3 設(shè)置用戶(hù)名、密碼 給子賬戶(hù)授予權(quán)限請(qǐng)參考權(quán)限管理。 圖4 設(shè)置用戶(hù)組 開(kāi)通服務(wù): 單擊“控制臺(tái)”>“服務(wù)列表”,找到“文字識(shí)別OCR”,進(jìn)入文字識(shí)別控制臺(tái)。 圖5
了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識(shí)別結(jié)果,本示例中,識(shí)別出2個(gè)文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照?qǐng)D片文字從上到下、從左到右排列。
1對(duì)1咨詢(xún) 通用類(lèi)文字識(shí)別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識(shí)別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識(shí)別 1對(duì)1咨詢(xún) 智能分類(lèi)文字識(shí)別 檢測(cè)定位圖片上指定要識(shí)別的票證的文字信息 表格的文字與表格信息識(shí)別,可轉(zhuǎn)換成能編輯的Excel 1對(duì)1咨詢(xún) 證件類(lèi)文字識(shí)別 身份證、駕駛證、行
圖解文字識(shí)別
智能分類(lèi)識(shí)別 功能介紹 自動(dòng)分類(lèi)識(shí)別17+種票證,支持指定票證的結(jié)構(gòu)化識(shí)別和印章檢測(cè),并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識(shí)別票證的位置坐標(biāo)、結(jié)構(gòu)化識(shí)別的內(nèi)容以及對(duì)應(yīng)的類(lèi)別。該接口支持的票證類(lèi)型請(qǐng)見(jiàn)表1,該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。
票據(jù)類(lèi) 功能介紹 增值稅發(fā)票識(shí)別 通過(guò)對(duì)增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識(shí)別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識(shí)別出來(lái),用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票識(shí)別 自動(dòng)識(shí)別機(jī)動(dòng)車(chē)銷(xiāo)售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字
FF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中名片的有效占比超過(guò)60%,保證整張名片內(nèi)容包含在圖像內(nèi)。 支持圖像中名片的任意角度的水平旋轉(zhuǎn)(需開(kāi)啟方向檢測(cè))。 能處理反光、暗光、防偽標(biāo)識(shí)等干擾的圖片但影響識(shí)別精度。
完整的端到端OCR流程: (1)準(zhǔn)備一張含有文字的原圖; (2)對(duì)原圖進(jìn)行文字位置的檢測(cè),檢測(cè)結(jié)果可能是水平矩形框,也可能是傾斜矩形框; (3)從原圖中把文字框?qū)?yīng)的圖片切下來(lái),并旋轉(zhuǎn)正,得到水平的文字塊切片圖; (4)對(duì)每個(gè)文字塊切片圖依次進(jìn)行字符識(shí)別,每個(gè)切片
問(wèn):OCR服務(wù)識(shí)別結(jié)果可以轉(zhuǎn)化為Word或者TXT嗎?答:OCR提取之后返回的結(jié)果是JSON格式,需要用戶(hù)通過(guò)編程,將結(jié)果保存為Word或者TXT格式。
利用計(jì)算機(jī)自動(dòng)識(shí)別字符的技術(shù),是模式識(shí)別應(yīng)用的一個(gè)重要領(lǐng)域。人們?cè)谏a(chǎn)和生活中,要處理大量的文字、報(bào)表和文本。為了減輕人們的勞動(dòng),提高處理效率,50年代開(kāi)始探討一般文字識(shí)別方法,并研制出光學(xué)字符識(shí)別器。60年代出現(xiàn)了采用磁性墨水和特殊字體的實(shí)用機(jī)器。60年代后期,出現(xiàn)
只支持中國(guó)大陸道路運(yùn)輸證的識(shí)別。 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 支持圖像中道路運(yùn)輸證任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光、防偽標(biāo)識(shí)等干擾的圖片但影響識(shí)別精度。 調(diào)用方法
增值稅發(fā)票識(shí)別 功能介紹 識(shí)別增值稅發(fā)票的類(lèi)別,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果,支持識(shí)別圖片、PDF、OFD文件。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 發(fā)票驗(yàn)真API請(qǐng)參見(jiàn)發(fā)票驗(yàn)真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專(zhuān)用發(fā)票)
【AI技術(shù)】通用文字識(shí)別 高精度 ,能夠快速準(zhǔn)確識(shí)別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫(xiě)文字識(shí)別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識(shí)別準(zhǔn)確率。通用文字識(shí)別,能夠快速準(zhǔn)確識(shí)別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫(xiě)文字識(shí)別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識(shí)別準(zhǔn)確率,對(duì)網(wǎng)
1.2.8 文字識(shí)別計(jì)算機(jī)文字識(shí)別,俗稱(chēng)光學(xué)字符識(shí)別(Optical Character Recognition),是利用光學(xué)掃描技術(shù)將票據(jù)、報(bào)刊、書(shū)籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。該技術(shù)可應(yīng)用于如表1-4所示
道路運(yùn)輸從業(yè)資格證識(shí)別 功能介紹 識(shí)別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
如何選購(gòu)合適的API 文字識(shí)別服務(wù)(OCR)提供四種類(lèi)型的API:通用類(lèi)、證件類(lèi)、票據(jù)類(lèi)、智能分類(lèi)。 通用類(lèi) 通用表格識(shí)別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識(shí)別:提取圖片內(nèi)的文字及其對(duì)應(yīng)位置信息。 手寫(xiě)文字識(shí)別:識(shí)別手寫(xiě)文字、印刷文字信息。 網(wǎng)絡(luò)圖片識(shí)別:識(shí)別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對(duì)應(yīng)位置信息。
上傳模板圖片后,需要對(duì)模板圖片進(jìn)行預(yù)處理,去掉冗余部分,將圖片旋轉(zhuǎn)至水平,保證模型識(shí)別的準(zhǔn)確性。 定義預(yù)處理 框選參照字段 在圖片模板中框選參照字段,用于矯正圖片的方向,進(jìn)而在正確的方向上,識(shí)別圖片中的結(jié)構(gòu)化信息。 框選參照字段 框選識(shí)別區(qū) 在圖片模板中框選識(shí)別區(qū),確定模板圖片中需要識(shí)別的文字位置。
文字 文字。 文字塊的區(qū)域位置 文字塊的區(qū)域位置。 文字塊識(shí)別結(jié)果 文字塊識(shí)別結(jié)果。 圖片朝向 圖片朝向。 檢測(cè)到的文字塊數(shù)目 檢測(cè)到的文字塊數(shù)目。 身份證識(shí)別 識(shí)別身份證圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果返回給用戶(hù)。 輸入?yún)?shù) 用戶(hù)配置身份證識(shí)別執(zhí)行動(dòng)作,相關(guān)參數(shù)說(shuō)明如表5所示。