檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
創(chuàng)建用于存儲發(fā)票識別與驗真結(jié)果的對象存儲服務(wù) OBS桶,企業(yè)業(yè)務(wù)系統(tǒng)定時從該桶中獲取結(jié)果并處理。 函數(shù)工作流 FunctionGraph:用于實現(xiàn)調(diào)用文字識別服務(wù)的業(yè)務(wù)邏輯,當OBS桶收到上傳的發(fā)票文件后,會自動通知函數(shù)調(diào)用文字識別服務(wù),并將結(jié)果存放到指定的OBS桶里。 文字識別 OCR
FunctionGraph,用于實現(xiàn)調(diào)用文字識別服務(wù)業(yè)務(wù)邏輯,當收到OBS上傳圖片通知后,自動調(diào)用文字識別 OCR服務(wù)進行電子面單識別、網(wǎng)絡(luò)圖片識別并將結(jié)果存放在OBS桶內(nèi)。 使用文字識別 OCR,提供電子面單識別和網(wǎng)絡(luò)圖片識別。用戶只需要將電子面單圖片或含有收/寄件信息的截圖上傳至OBS桶,即可自動識別提取收/
定額發(fā)票識別 功能介紹 識別定額發(fā)票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 定額發(fā)票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
靠的方式運行。此外,按函數(shù)實際執(zhí)行資源計費,不執(zhí)行不產(chǎn)生費用。 文字識別 OCR:提供在線文字識別服務(wù),將圖片或掃描件中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。
DF默認識別第一頁,或者您可以指定要識別的頁碼。 圖像各邊的像素大小在15px到8192px之間。單個圖片、PDF文件其對應(yīng)的Base64編碼不超過10MB。 支持單圖多印章識別。 支持圖像中印章任意角度的水平旋轉(zhuǎn)。 支持圓形章、橢圓章、方形章、三角章和菱形章的檢測和識別。 能處
Array<Array<Integer>> 文字塊位置信息,列表形式,分別表示文字塊4個頂點的x, y坐標;坐標原點為圖片左上角,x軸沿水平方向,y軸沿豎直方向。 confidence Float 文字塊識別結(jié)果置信度信息,置信度越大,表示本次識別的對應(yīng)字段的可靠性越大,在統(tǒng)計意義上,
VIN碼識別 功能介紹 識別圖片中的車架號信息,并將識別結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 VIN碼示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小
OCR服務(wù)支持批量識別嗎 OCR服務(wù)只支持調(diào)用一次接口識別一張圖片,批量識別需要進行二次開發(fā),編碼循環(huán)調(diào)用API,實現(xiàn)批量調(diào)用服務(wù)識別圖片。 父主題: API使用類
問:OCR服務(wù)識別結(jié)果可以轉(zhuǎn)化為Word或者TXT嗎?答:OCR提取之后返回的結(jié)果是JSON格式,需要用戶通過編程,將結(jié)果保存為Word或者TXT格式。
電子面單識別 OCR電子面單識別已于2025.09.04正式下架,為避免影響您目前的業(yè)務(wù),請您及時進行相關(guān)遷移工作,詳見下架公告。 功能介紹 識別用戶上傳的電子面單圖片中的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。 圖1 電子面單示例圖 約束與限制 電子面單支持的版式以樣例為準。
OCR服務(wù)可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結(jié)果后處理。 父主題: 產(chǎn)品咨詢類
2.0 文字識別服務(wù)條款 2.1服務(wù)內(nèi)容 文字識別服務(wù)以開放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供給用戶,用戶通過實時訪問和調(diào)用API識別圖片等數(shù)據(jù)中的字符結(jié)果,幫助客戶提升業(yè)務(wù)效率。本服務(wù)內(nèi)容包含通用文字識別、卡證
火車票識別 功能介紹 識別火車票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 火車票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
營業(yè)執(zhí)照識別 功能介紹 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 營業(yè)執(zhí)照示例圖 圖2 營業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
現(xiàn)了多種字體和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機和印刷體英文數(shù)字識別機。70年代主要研究文字識別的基本理論和研制高性能的文字識別機,并著重于漢字識別的研究。
徑,例如D:\local\test.xlsx", response) 使用PDF進行文字識別 本示例將PDF文件轉(zhuǎn)換為圖片,并調(diào)用網(wǎng)絡(luò)圖片識別API,獲取識別結(jié)果。 前提條件 開通網(wǎng)絡(luò)圖片識別。 參考本地調(diào)用,安裝OCR Python SDK。并執(zhí)行pip install fitz命令和pip
泰國車牌識別 功能介紹 識別泰國車牌圖片中的車牌信息,返回識別結(jié)果和車牌的區(qū)域位置信息。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 泰國車牌示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素
銀行卡識別 功能介紹 識別銀行卡上的關(guān)鍵文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 銀行卡示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別JPG、JPEG、PNG、BMP、TIFF格式圖片。
車輛合格證識別 功能介紹 識別車輛合格證中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 約束與限制 只支持中國大陸車輛合格證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15到8192px之間。單個圖片對應(yīng)的Base64編碼不超過10MB。
片對應(yīng)的Base64編碼不超過10MB。 圖像中識別區(qū)域有效占比超過80%,保證所有文字及其邊緣包含在圖像內(nèi)。 不支持角度旋轉(zhuǎn)的圖片識別。 支持電子承兌匯票,對于拍照場景、復(fù)雜背景支持欠佳。 文字識別服務(wù)屬于公有云服務(wù),線上用戶資源共享,如果需要多并發(fā)請求,請?zhí)崆奥?lián)系我們。 調(diào)用方法