華為云計算 云知識 什么是文字識別
什么是文字識別

文字識別 (Optical Character Recognition,簡稱OCR)是指對圖像文件的打印字符進行檢測識別,將圖像中的文字轉(zhuǎn)換成可編輯的文本格式,以JSON格式返回識別結(jié)果。

OCR以開放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供給用戶,用戶使用Python、Java等編程語言調(diào)用OCR服務(wù)API將圖片識別成文字,幫助用戶自動采集關(guān)鍵數(shù)據(jù),打造智能化業(yè)務(wù)系統(tǒng),提升業(yè)務(wù)效率,API獲取詳情請參考《API參考》。

OCR還提供多種編程語言的SDK供您使用,SDK使用方法請參考《SDK參考》

OCR能力

通用類OCR

通用類OCR(General OCR),支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片上文字信息的 自動化 識別,自適應(yīng)分析各種版面和表格,快速實現(xiàn)各種文檔電子化。

證件類OCR

證件類OCR(Card OCR),支持身份證、駕駛證、行駛證、護照等證件圖片上有效信息的自動識別和關(guān)鍵字段結(jié)構(gòu)化提取。

票據(jù)類OCR

票據(jù)類OCR(Receipt OCR),支持增值稅發(fā)票、機動車銷售發(fā)票、醫(yī)療發(fā)票等各種發(fā)票和表單圖片上有效信息的自動識別和結(jié)構(gòu)化提取。

行業(yè)類OCR

行業(yè)類OCR(Domain OCR),支持物流面單、醫(yī)療化驗單據(jù)等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識別,助力行業(yè)自動化效率提升。

定制模板OCR

定制模板OCR(Custom OCR),支持用戶自定義識別模板,指定需要識別的關(guān)鍵字段,實現(xiàn)用戶特定格式圖片的自動識別和結(jié)構(gòu)化提取。