怎樣提取圖片中的文字步驟
怎樣提取圖片中的文字步驟
-
提取圖片中的文字開通文字識別服務(wù):
OCR服務(wù)提供的開通方式有以下兩種,用戶可以任選其一進(jìn)行開通服務(wù)。
●按需計(jì)費(fèi)開通服務(wù)
●購買套餐包開通服務(wù)
-
提取圖片中的文字準(zhǔn)備數(shù)據(jù):
●數(shù)據(jù)要求
受技術(shù)與成本多種因素制約,文字識別服務(wù)存在一些約束限制。
以通用文字識別API為例,輸入數(shù)據(jù)存在以下約束。其他API的的使用約束請參見約束與限制。
只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。
圖像各邊的像素大小在15px到8192px之間。
圖像中識別區(qū)域有效占比超過80%,保證所有文字及其邊緣包含在圖像內(nèi)。
支持圖像任意角度的水平旋轉(zhuǎn)。
目前不支持復(fù)雜背景(如戶外自然場景、防偽水印等)和文字扭曲圖像的文字識別。
-
提取圖片中的文字調(diào)用API或SDK:
●在線調(diào)試
API Explorer在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時(shí),集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運(yùn)行。
●本地調(diào)用
本章節(jié)以通用表格識別為例,介紹如何使用OCR Python SDK在本地進(jìn)行開發(fā)。
該接口可以識別表格圖片中的文字內(nèi)容,并將識別結(jié)果以JSON格式返回給用戶。返回結(jié)果包含兩類:純文本區(qū)(text)和表格區(qū)(table),并返回表格結(jié)構(gòu)(row, column)和文本信息。查看詳情
-
解讀識別結(jié)果:
●本章節(jié)通過網(wǎng)絡(luò)圖片識別API介紹如何解讀調(diào)API返回的JSON格式識別結(jié)果。請參照API參考“響應(yīng)參數(shù)”章節(jié)比對查看。查看詳情
-
識別結(jié)果后處理:
●提取特定字段導(dǎo)入Excel
本示例調(diào)用身份證識別API,并從獲取到的JSON結(jié)果中,提取所需的字段,填入至Excel。
前提條件
開通身份證識別。
參考本地調(diào)用,安裝OCR Python SDK。并執(zhí)行pip install xlsxwriter命令安裝依賴包。
登錄訪問秘鑰頁面,獲取AK、SK。可以新增訪問秘鑰,或使用已有的訪問秘鑰。訪問秘鑰為credentials.csv文件,包含AK/SK信息。查看詳情
-
統(tǒng)計(jì)API使用量:
●文字識別控制臺 > 服務(wù)監(jiān)控支持查看API的總調(diào)用量、調(diào)用成功量、調(diào)用失敗量。
如果您購買了套餐包,可在“套餐包管理”頁面,查看已有的套餐包及使用詳情。套餐包費(fèi)用扣減規(guī)則請參見“產(chǎn)品介紹 > 計(jì)費(fèi)說明”。
怎樣提取圖片中的文字OCR常見問題
怎樣提取圖片中的文字OCR常見問題
提取圖片中的文字必看文檔
-
提取圖片中文字調(diào)用說明
文字識別提供了REST(Representational State Transfer)風(fēng)格的API,支持您通過HTTPS請求調(diào)用,調(diào)用方法請參見如何調(diào)用API。同時(shí)文字識別還提供多種編程語言的SDK供您使用
文字識別提供了REST(Representational State Transfer)風(fēng)格的API,支持您通過HTTPS請求調(diào)用,調(diào)用方法請參見如何調(diào)用API。同時(shí)文字識別還提供多種編程語言的SDK供您使用
-
通用類提取圖片文字功能介紹
通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時(shí)也識別表格外部的文字區(qū)域。用于各種單據(jù)和報(bào)表的電子化,恢復(fù)結(jié)構(gòu)化信息。
通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時(shí)也識別表格外部的文字區(qū)域。用于各種單據(jù)和報(bào)表的電子化,恢復(fù)結(jié)構(gòu)化信息。
-
提取圖片中文字的使用約束
受技術(shù)與成本多種因素制約,文字識別服務(wù)存在一些約束限制。其中系統(tǒng)級約束限制,是所有子服務(wù)的約束。除系統(tǒng)級約束限制外,各子服務(wù)還有獨(dú)立的約束條件。
受技術(shù)與成本多種因素制約,文字識別服務(wù)存在一些約束限制。其中系統(tǒng)級約束限制,是所有子服務(wù)的約束。除系統(tǒng)級約束限制外,各子服務(wù)還有獨(dú)立的約束條件。
-
提取圖片文字服務(wù)價(jià)格和購買方式
OCR提供兩種計(jì)費(fèi)方式下不同區(qū)域、不同應(yīng)用場景的文字識別服務(wù),含功能場景包括不僅限于以下類別:通用文字識別、機(jī)動車銷售發(fā)票識別、發(fā)票驗(yàn)真等數(shù)十種文字識別服務(wù)
OCR提供兩種計(jì)費(fèi)方式下不同區(qū)域、不同應(yīng)用場景的文字識別服務(wù),含功能場景包括不僅限于以下類別:通用文字識別、機(jī)動車銷售發(fā)票識別、發(fā)票驗(yàn)真等數(shù)十種文字識別服務(wù)
-
什么是文字識別的并發(fā)量
OCR以公有云服務(wù)為主,線上用戶資源共享,并發(fā)量會根據(jù)線上用戶的調(diào)用情況動態(tài)調(diào)整。如遇到突發(fā)高峰導(dǎo)致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法:
OCR以公有云服務(wù)為主,線上用戶資源共享,并發(fā)量會根據(jù)線上用戶的調(diào)用情況動態(tài)調(diào)整。如遇到突發(fā)高峰導(dǎo)致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法:
-
提取圖片中文字剩余量及預(yù)警
進(jìn)入控制臺費(fèi)用中心“資源包”頁面,即可直接查看套餐包的剩余使用量。相同規(guī)格資源包會匯總展示,僅支持查詢當(dāng)前有效的資源包和失效時(shí)間不超過18個(gè)月的資源包。
進(jìn)入控制臺費(fèi)用中心“資源包”頁面,即可直接查看套餐包的剩余使用量。相同規(guī)格資源包會匯總展示,僅支持查詢當(dāng)前有效的資源包和失效時(shí)間不超過18個(gè)月的資源包。
-
提取圖片中文字使用簡介
服務(wù)以開放API的方式提供文字識別能力,用戶調(diào)用API接口需要具備一定的編程開發(fā)基礎(chǔ),文字識別后返回的結(jié)果為JSON格式,用戶需要通過編程來處理識別結(jié)果。
服務(wù)以開放API的方式提供文字識別能力,用戶調(diào)用API接口需要具備一定的編程開發(fā)基礎(chǔ),文字識別后返回的結(jié)果為JSON格式,用戶需要通過編程來處理識別結(jié)果。
-
開通文字識別服務(wù)
進(jìn)入文字識別官網(wǎng)主頁,單擊“立即使用”,進(jìn)入文字識別控制臺。在“總覽”頁面,選擇需要使用的服務(wù),在操作列單擊“開通服務(wù)”。服務(wù)開通成功后,開通狀態(tài)將顯示為“已開通”。
進(jìn)入文字識別官網(wǎng)主頁,單擊“立即使用”,進(jìn)入文字識別控制臺。在“總覽”頁面,選擇需要使用的服務(wù),在操作列單擊“開通服務(wù)”。服務(wù)開通成功后,開通狀態(tài)將顯示為“已開通”。
-
提取圖片中文字在線調(diào)試
API Explorer在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時(shí),集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運(yùn)行。本章節(jié)介紹如何使用API Explorer調(diào)試API。
API Explorer在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時(shí),集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運(yùn)行。本章節(jié)介紹如何使用API Explorer調(diào)試API。