檢測(cè)到您已登錄華為云國際站賬號(hào),為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
網(wǎng)絡(luò)圖片識(shí)別 功能介紹 識(shí)別網(wǎng)絡(luò)圖片中的文字內(nèi)容,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。支持橫向、豎向、藝術(shù)字識(shí)別,支持字體分類和長圖檢測(cè)。 該接口的使用限制請(qǐng)參見約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 網(wǎng)絡(luò)圖片示例圖 約束與限制 支持中英文及部分中文繁體字。
通用文字識(shí)別 功能介紹 識(shí)別圖片上的文字信息,以JSON格式返回識(shí)別的文字和坐標(biāo)。支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場(chǎng)景的文字識(shí)別。 支持中英文以及部分繁體字。該接口的使用限制請(qǐng)參見約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 通用文字示例圖 約束與限制
對(duì)接OCR識(shí)別圖片中文字 文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)以開放API的方式提供給用戶,用戶使用Python、Java等編程語言調(diào)用OCR服務(wù)API將圖片識(shí)別成文字,幫助用戶自動(dòng)采集關(guān)鍵數(shù)據(jù),打造智能化業(yè)務(wù)系統(tǒng),提升業(yè)務(wù)效率。
None 服務(wù)介紹 文字識(shí)別 OCR 文字識(shí)別技術(shù)簡(jiǎn)介 01:46 文字識(shí)別技術(shù)簡(jiǎn)介 快速入門 文字識(shí)別 OCR 使用SDK 06:38 SDK使用指導(dǎo) 文字識(shí)別 OCR 使用API 03:04 API使用指導(dǎo) 問題排查 文字識(shí)別 OCR 獲取Token時(shí)帳密報(bào)錯(cuò) 03:53 獲取Token時(shí)帳密報(bào)錯(cuò)
OCR服務(wù)需要用戶通過調(diào)用API接口,將圖片或掃描件中的文字識(shí)別成可編輯的文本,然后返回JSON格式的識(shí)別結(jié)果,用戶需要通過編碼將識(shí)別結(jié)果對(duì)接到業(yè)務(wù)系統(tǒng)或保存為TXT、Excel等格式。 關(guān)于文字識(shí)別的相關(guān)聲明請(qǐng)參見文字識(shí)別服務(wù)聲明、隱私政策聲明。 文字識(shí)別服務(wù)等級(jí)協(xié)議請(qǐng)參見華為云服務(wù)等級(jí)協(xié)議。
產(chǎn)品介紹 在線體驗(yàn) 圖說ECS 立即使用 成長地圖 由淺入深,帶您玩轉(zhuǎn)OCR 01 了解 了解華為云文字識(shí)別服務(wù)的產(chǎn)品介紹、應(yīng)用場(chǎng)景、使用限制,有助于更好的使用文字識(shí)別服務(wù)。 產(chǎn)品介紹 什么是文字識(shí)別 應(yīng)用場(chǎng)景展示 使用限制說明 智能分類介紹 03 入門 文字識(shí)別服務(wù)以開放API(Application
文字識(shí)別-發(fā)票識(shí)別與驗(yàn)真 文字識(shí)別-發(fā)票識(shí)別與驗(yàn)真 查看部署指南 方案咨詢 該解決方案有何用途? 該解決方案基于華為云文字識(shí)別 OCR增值稅發(fā)票識(shí)別與發(fā)票驗(yàn)真技術(shù)構(gòu)建,自動(dòng)識(shí)別和錄入增值稅發(fā)票各字段信息,減少人工核算工作量,實(shí)現(xiàn)財(cái)稅報(bào)銷自動(dòng)化。同時(shí),自動(dòng)接入國家稅務(wù)機(jī)關(guān)發(fā)票查驗(yàn)平
簡(jiǎn)介章節(jié)。 圖1 通用表格示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過10MB。 圖像中識(shí)別區(qū)域有效占比超過80%,保證整張表格及其邊緣包含在圖像內(nèi)。 支持圖像任意角度的水平旋轉(zhuǎn)。
車牌識(shí)別 功能介紹 識(shí)別輸入圖片中的車牌信息,并以JSON格式返回其坐標(biāo)和內(nèi)容。 該接口的使用限制請(qǐng)參見約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 車牌示例圖 支持車牌信息、車牌顏色識(shí)別,支持雙行車牌識(shí)別,支持單張圖片內(nèi)多個(gè)車牌識(shí)別。 目前支持車牌類型含小型汽車
營業(yè)執(zhí)照識(shí)別 識(shí)別營業(yè)執(zhí)照首頁圖片中的文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 身份證識(shí)別 識(shí)別身份證圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果返回給用戶。 護(hù)照識(shí)別 識(shí)別用戶上傳的護(hù)照首頁圖片中的文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。當(dāng)前版本支持中國護(hù)照的全字段識(shí)別。
身份證信息核驗(yàn)請(qǐng)使用人證核身服務(wù)。 圖1 身份證示例圖 身份證識(shí)別支持中華人民共和國居民身份證識(shí)別。 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類識(shí)別服務(wù)。 約束與限制 支持中華人民共和國居民身份證的識(shí)別。 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到
3)epoch:1個(gè)epoch等于使用訓(xùn)練集中的全部樣本訓(xùn)練一次; GPU對(duì)2的冪次的batch可以發(fā)揮更佳的性能,因此設(shè)置成16、32、64、128時(shí)往往要比設(shè)置為整10、整100的倍數(shù)時(shí)表現(xiàn)更優(yōu)。 在現(xiàn)存允許的情況下batch_size可以取相對(duì)大一些 第三個(gè)問題:維度匹配 深度學(xué)習(xí)最麻煩的就是維度匹配,
手寫文字識(shí)別 功能介紹 識(shí)別文檔中的手寫文字、印刷文字信息,并將識(shí)別的結(jié)構(gòu)化結(jié)果以JSON格式返回給用戶。該接口的使用限制請(qǐng)參見約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 手寫文字示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。
成可編輯的Excel格式 通用文字識(shí)別 識(shí)別圖片上的文字信息,支持掃描文件、電子文檔、書籍、票據(jù)和表單等多種場(chǎng)景的文字識(shí)別 網(wǎng)絡(luò)圖片識(shí)別 識(shí)別網(wǎng)絡(luò)圖片中的文字信息,支持印刷體、藝術(shù)字、豎行文本等文字識(shí)別 智能分類識(shí)別 檢測(cè)定位圖片上指定要識(shí)別的票證的文字信息 手寫文字識(shí)別 識(shí)別圖片中的手寫文字信息
文字識(shí)別SDK簡(jiǎn)介 文字識(shí)別SDK概述 文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)將圖片或掃描件中的文字識(shí)別成可編輯的文本??纱嫒斯や浫?,提升業(yè)務(wù)效率。支持身份證、駕駛證、行駛證、發(fā)票、通用表格、通用文字等場(chǎng)景文字識(shí)別。 文字識(shí)別以開放API(Application
了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識(shí)別結(jié)果,本示例中,識(shí)別出2個(gè)文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照?qǐng)D片文字從上到下、從左到右排列。
傳”按鈕上傳示例圖片,然后單擊“預(yù)測(cè)”。 預(yù)測(cè)完成后,預(yù)測(cè)結(jié)果顯示區(qū)域?qū)⒄故绢A(yù)測(cè)結(jié)果,根據(jù)預(yù)測(cè)結(jié)果內(nèi)容,可識(shí)別出此圖片的數(shù)字是“2”。 本案例中使用的MNIST是比較簡(jiǎn)單的用做demo的數(shù)據(jù)集,配套算法也是比較簡(jiǎn)單的用于教學(xué)的神經(jīng)網(wǎng)絡(luò)算法。這樣的數(shù)據(jù)和算法生成的模型僅適用于教學(xué)模
通過該服務(wù),可以同時(shí)識(shí)別出圖片中包含的不同傾角正臉及側(cè)臉。 圖1 人臉檢測(cè)示意圖 人臉比對(duì) 通過對(duì)人臉區(qū)域的特征進(jìn)行對(duì)比,該服務(wù)可以返回給用戶兩張圖片中人臉的相似度。如果兩張圖片中包含多張人臉,則在兩張圖片中選取最大的人臉進(jìn)行相似度比對(duì)。 圖2 人臉比對(duì)示意圖 人臉?biāo)阉?人臉?biāo)阉?/p>
識(shí)別增值稅發(fā)票關(guān)鍵字段信息,結(jié)構(gòu)化輸出結(jié)果。支持圖片及PDF、OFD文檔識(shí)別。 機(jī)動(dòng)車銷售發(fā)票識(shí)別 自動(dòng)分類識(shí)別機(jī)動(dòng)車銷售發(fā)票和二手車銷售發(fā)票上的關(guān)鍵字段 出租車發(fā)票識(shí)別 支持識(shí)別全國各主要城市的出租車票的全字段信息識(shí)別 火車票識(shí)別 支持對(duì)火車票上的主要字段進(jìn)行結(jié)構(gòu)化識(shí)別,包括車票號(hào)碼、始發(fā)站、目的站、車次、日期、票價(jià)、席別、姓名等
只支持中國大陸行駛證的識(shí)別。 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在100px到8000px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過10MB。 圖像中行駛證區(qū)域有效占比超過50%,保證整張行駛證內(nèi)容及其邊緣包含在圖像內(nèi)。 支持圖像中行駛證任意角度的水平旋轉(zhuǎn)。
駕駛證識(shí)別 功能介紹 識(shí)別駕駛證圖片中主頁與副頁的文字內(nèi)容,并將識(shí)別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請(qǐng)參見約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類識(shí)別服務(wù)。 約束與限制
對(duì)銀行卡的卡號(hào)、有效期、發(fā)卡行信息進(jìn)行結(jié)構(gòu)化識(shí)別 道路運(yùn)輸證識(shí)別 識(shí)別道路運(yùn)輸證首頁中的文字信息,并將識(shí)別的結(jié)構(gòu)化結(jié)果返回給用戶 車牌識(shí)別 支持車牌號(hào)碼關(guān)鍵信息識(shí)別 名片識(shí)別 支持名片關(guān)鍵信息識(shí)別 VIN碼識(shí)別 支持VIN碼識(shí)別 道路運(yùn)輸從業(yè)資格證識(shí)別 識(shí)別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果