檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
護(hù)照識別 功能介紹 識別護(hù)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國普通電子護(hù)照的全字段識別。中國-港澳臺地區(qū)、外國護(hù)照支持護(hù)照下方兩行國際標(biāo)準(zhǔn)化的機(jī)讀碼識別,并可從中提取7個關(guān)鍵字段信息。該接口的使用限制請參見約束與限
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識別結(jié)果,本示例中,識別出2個文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照圖片文字從上到下、從左到右排列。
道路運(yùn)輸從業(yè)資格證識別 功能介紹 識別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
填寫連接器的描述信息,用于識別不同的連接器。 支持的操作 通用表格識別 通用文字識別 網(wǎng)絡(luò)圖片識別 智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護(hù)照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運(yùn)輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗真 機(jī)動車銷售發(fā)票識別 出租車發(fā)票識別
Python開發(fā)環(huán)境配置 環(huán)境配置 使用圖像識別Python版本SDK包,需要您配置Python開發(fā)環(huán)境。 從Python官網(wǎng)下載并安裝合適的Python版本。請使用Python3.3以上版本,如下以Python3.7 版本為例進(jìn)行說明。 從PyCharm官網(wǎng)下載并安裝最新版本。
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險單的掃描圖片及手機(jī)照片進(jìn)行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
道路運(yùn)輸證識別 功能介紹 識別道路運(yùn)輸證首頁中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 道路運(yùn)輸證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸道路運(yùn)輸證的識別。
主體識別示例 本章節(jié)對主體識別AK/SK方式使用SDK進(jìn)行示例說明。 主體識別示例代碼只需將AK/SK信息替換為實際AK/SK,代碼中可以使用初始化ImageMainObjectDetectionReq中的url或image配置圖像信息(image和url參數(shù)二選一),示例中以url為例,配置完成后運(yùn)行即可。
名人識別示例 本章節(jié)對名人識別AK/SK方式使用SDK進(jìn)行示例說明。 名人識別示例代碼只需將AK/SK信息替換為實際AK/SK,代碼中可以使用初始化CelebrityRecognitionReq中的url或image配置圖像信息(image和url參數(shù)二選一),示例中以url為例,配置完成后運(yùn)行即可。
翻拍識別示例 本章節(jié)對翻拍識別AK/SK方式使用SDK進(jìn)行示例說明。 翻拍識別示例代碼只需將AK/SK信息替換為實際AK/SK,代碼中可以使用初始化RunRecaptureDetectReq中的url或image配置圖像信息(image和url參數(shù)二選一),示例中以url為例,配置完成后運(yùn)行即可。
發(fā)票識別與驗真 方案概述 資源和成本規(guī)劃 實施步驟
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行駛
設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5 文字識別控制臺 在文字識別控制臺“總覽”頁面,選擇對應(yīng)產(chǎn)品的“終端節(jié)點(diǎn)”。不同區(qū)域OCR產(chǎn)品部署情況請參考終端節(jié)點(diǎn)。 圖6 終端節(jié)點(diǎn) 選擇產(chǎn)品類別,如:通用類、證件類、票據(jù)類等,然后選
文字識別 OCR 文字識別 OCR 文字識別(Optical Character Recognition,簡稱OCR)提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。支持通用類識別、證件類識別、票據(jù)類識別、行業(yè)類識別和智能文檔解析,具備高精度、高性能的全文識別和高階結(jié)構(gòu)化識別能力。
基本概念、云服務(wù)簡介、專有名詞解釋: 文字識別服務(wù) OCR:文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。 對象存儲服務(wù) OBS:對象存儲服務(wù)(Object
錄音文件識別 LASR 錄音文件識別 LASR 錄音文件識別,基于深度學(xué)習(xí)技術(shù),可以實現(xiàn)5小時以內(nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。 錄音文件識別,基于深度學(xué)習(xí)技術(shù),可以實現(xiàn)5小時以內(nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。 立即購買
est.xlsx", response) 使用PDF進(jìn)行文字識別 本示例將PDF文件轉(zhuǎn)換為圖片,并調(diào)用網(wǎng)絡(luò)圖片識別API,獲取識別結(jié)果。 前提條件 開通網(wǎng)絡(luò)圖片識別。 參考本地調(diào)用,安裝OCR Python SDK。并執(zhí)行pip install fitz命令和pip install