OCR服務(wù)能提取哪些類型圖片文字?
通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據(jù)和報表的電子化,恢復結(jié)構(gòu)化信息。
通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息,并能夠根據(jù)文字在圖片中的位置進行結(jié)構(gòu)化整理工作。
手寫文字識別:識別文檔中的手寫文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。
網(wǎng)絡(luò)圖片識別:自動識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息,并能根據(jù)識別出來的結(jié)果進行聯(lián)系人信息的提取,同時可供進一步的數(shù)據(jù)挖掘后處理操作。
智能分類識別:自動檢測定位圖片上指定要識別的票證,一次掃描即可識別票證的位置坐標、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。
身份證識別:自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等全部信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準確識別身份證信息。
駕駛證識別:自動識別駕駛證正頁與副頁上的全部信息,自動提取出姓名、性別、領(lǐng)證日期、準駕車型、有效期限、檔案編號等結(jié)構(gòu)化信息,在暗光、傾斜、過曝光、防偽標志干擾、陰影等異常條件下均可準確識別駕駛證信息。
行駛證識別:自動識別行駛證正頁與副頁上的全部信息,自動提取出號牌號碼、車輛類型、所有人、使用性質(zhì)、品牌型號、車輛識別代號、發(fā)動機號碼、注冊日期、檔案編碼、核定載人數(shù)、總質(zhì)量、整備質(zhì)量、核定載質(zhì)量、外廓尺寸、準牽引總質(zhì)量、備注、檢驗記錄、條碼號等結(jié)構(gòu)化信息,在暗光、傾斜、過曝光、防偽標志干擾、陰影等異常條件下均可準確識別行駛證信息。
護照識別:針對中國護照,可識別護照上的全部信息;針對其他國家護照,可根據(jù)兩行國際標準化的機讀碼識別出6-7個關(guān)鍵字段信息,包括姓名、性別、出生日期、護照號碼、簽發(fā)國國家碼、護照有效期等。在暗光、傾斜、過曝光、陰影等異常條件下均可準確識別護照信息。
營業(yè)執(zhí)照識別:識別營業(yè)執(zhí)照中的公司名稱、注冊號、法人代表、地址、注冊資本、營業(yè)期限、經(jīng)營范圍等字段。 在暗光,傾斜、水印等異常條件下均可正常識別執(zhí)照信息。
銀行卡識別:自動識別銀行卡正面的信息,識別信息包括卡片類型(借記卡或信用卡)、銀行卡卡號、有效日期、發(fā)卡行、持卡人姓名(限信用卡)。省去手動錄入過程。
道路運輸證識別:自動識別道路運輸證的全部信息,一次掃描即可識別業(yè)戶名稱、道路運輸證號、車輛號牌、車輛類型等全部信息。
車牌識別:自動識別圖片中的車牌信息。
名片識別:自動識別名片中的信息,識別信息包括姓名、職位頭銜、公司、部門、聯(lián)系方式、地址、郵箱、傳真、郵編、公司網(wǎng)址等信息,并將識別結(jié)果返回給用戶。
增值稅發(fā)票識別:通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進一步處理,節(jié)省大量的人工錄入成本。
機動車銷售發(fā)票識別:自動識別機動車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字段信息,用于后續(xù)的進一步處理,節(jié)省大量的人工錄入成本。
飛機行程單識別:自動識別飛機行程單的全部信息,一次掃描即可識別旅客姓名、有效身份證件號碼、訂單號、票價等全部信息。
定額發(fā)票識別:自動識別定額發(fā)票的全部信息,一次掃描即可識別發(fā)票號碼、發(fā)票代碼、地址、發(fā)票金額等全部信息。
火車票識別:自動識別火車票的全部信息,一次掃描即可識別一張車票的ID、檢票口信息、車次等全部信息。
出租車發(fā)票識別:自動識別出租車發(fā)票的全部信息,一次掃描即可識別歸屬地區(qū)、發(fā)票代碼、發(fā)票號碼、電話(包括電話、監(jiān)督電話)等全部信息。
車輛通行費發(fā)票識別:自動識別車輛通行費發(fā)票的全部信息,一次掃描即可識別發(fā)票代碼、發(fā)票號碼、入口、出口、收費金額、收費員、車輛類型、日期、時間等主要信息。
提取圖片文字、圖片轉(zhuǎn)換文字服務(wù)使用流程
-
收起
開通文字識別 收起
① 在開通文字識別OCR前,可在線體驗服務(wù)功能,該方式無需編程,只需在網(wǎng)頁端上傳圖片,即可體驗識別效果。
② 在開通文字識別OCR前,需要提前注冊華為云賬號,并進行實名認證。
③ OCR服務(wù)提供的開通方式有兩種,分別為按需計費和套餐包計費,用戶可以任選其一進行開通服務(wù)。
-
收起
準備數(shù)據(jù) 收起
① 首先要查看數(shù)據(jù)傳入的要求,受技術(shù)與成本多種因素制約,文字識別服務(wù)存在一些約束限制。
② 然后選擇數(shù)據(jù)傳入的方式,使用OCR API或SDK時,數(shù)據(jù)主要通過以下兩種方法傳入,分別為image和url。
-
收起
調(diào)用API或SDK 收起
①在線調(diào)試: API Explorer在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時,集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運行。
② 本地調(diào)用:該接口可以識別表格圖片中的文字內(nèi)容,并將識別結(jié)果以JSON格式返回給用戶。返回結(jié)果包含兩類:純文本區(qū)(text)和表格區(qū)(table),并返回表格結(jié)構(gòu)(row, column)和文本信息。
-
收起
獲取識別結(jié)果 收起
① 解讀識別結(jié)果:調(diào)用網(wǎng)絡(luò)圖片API成功后,在“JSON返回結(jié)果”中,可見result字段,該字段包含了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。
② 識別結(jié)果后處理:調(diào)用身份證識別API,并從獲取到的JSON結(jié)果中,提取所需的字段,填入至Excel?;?qū)DF文件轉(zhuǎn)換為圖片,并調(diào)用網(wǎng)絡(luò)圖片識別API,獲取識別結(jié)果。
圖片轉(zhuǎn)換為文字有哪些用途
提取圖片文字、圖片轉(zhuǎn)換文字實用文檔下載
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
活動時間: 2020年8月12日-2020年9月11日
活動期間,華為云用戶通過活動頁面購買云服務(wù),或使用上云禮包優(yōu)惠券在華為云官網(wǎng)新購云服務(wù),累計新購實付付費金額達到一定額度,可兌換相應(yīng)的實物禮品?;顒觾?yōu)惠券可在本活動頁面中“上云禮包”等方式獲取,在華為云官網(wǎng)直接購買(未使用年中云鉅惠活動優(yōu)惠券)或參與其他活動的訂單付費金額不計入統(tǒng)計范圍內(nèi);