文字語音識別教程,免費(fèi)OCR試用
華為云文字識別產(chǎn)品列表
華為云文字識別產(chǎn)品列表
-
通用類OCR(General OCR):
●通用類OCR支持表格、文檔、網(wǎng)絡(luò)圖片、健康碼、核酸檢測記錄等任意格式圖片上文字信息的自動化識別,自適應(yīng)分析各種版面和表格,快速實(shí)現(xiàn)各種文檔電子化
-
證件類OCR(Card OCR):
●證件類OCR支持身份證、駕駛證、行駛證、護(hù)照等證件圖片上有效信息的自動識別和關(guān)鍵字段結(jié)構(gòu)化提取
-
票據(jù)類OCR(Receipt OCR):
●票據(jù)類OCR支持增值稅發(fā)票、機(jī)動車銷售發(fā)票、火車票、出租車發(fā)票等各種發(fā)票以及發(fā)票驗(yàn)真,支持圖片及PDF、OFD文檔上有效信息的自動識別和結(jié)構(gòu)化提取。
-
行業(yè)類文字識別(Domain OCR):
●行業(yè)類文字識別支持物流面單、醫(yī)療化驗(yàn)單據(jù)等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識別,助力行業(yè)自動化效率提升
-
文字識別功能與試用:
●文字識別(Optical Character Recognition,OCR)是指對圖像文件的打印字符進(jìn)行檢測識別,將圖像中的文字轉(zhuǎn)換成可編輯的文本格式。OCR通過API提供服務(wù)能力,用戶需要通過編程來處理識別結(jié)果。
●在開通OCR前,請先使用OCR體驗(yàn)館體驗(yàn)服務(wù)功能。該方式無需編程,只需在網(wǎng)頁端上傳圖片,即可體驗(yàn)識別效果。
●開通OCR后,默認(rèn)按API調(diào)用次數(shù)進(jìn)行收費(fèi)。API使用指導(dǎo)請參見使用流程簡介。
文字語音識別使用必看文檔
-
什么是文字識別
文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。
文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。
-
通用類文字識別功能介紹
通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據(jù)和報(bào)表的電子化,恢復(fù)結(jié)構(gòu)化信息。
通用表格識別提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據(jù)和報(bào)表的電子化,恢復(fù)結(jié)構(gòu)化信息。
-
智能分類文字識別
智能分類識別服務(wù)可以一次性對同張圖片中的多個卡證、票據(jù)識別,并返回每個卡證、票據(jù)的類別及結(jié)構(gòu)化數(shù)據(jù)。智能分類識別服務(wù)應(yīng)用在身份認(rèn)證、財(cái)務(wù)報(bào)銷等多種場景。
智能分類識別服務(wù)可以一次性對同張圖片中的多個卡證、票據(jù)識別,并返回每個卡證、票據(jù)的類別及結(jié)構(gòu)化數(shù)據(jù)。智能分類識別服務(wù)應(yīng)用在身份認(rèn)證、財(cái)務(wù)報(bào)銷等多種場景。
-
證件類文字識別
自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準(zhǔn)確識別身份證信息。
自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準(zhǔn)確識別身份證信息。
-
票據(jù)類文字識別
通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,節(jié)省大量的人工錄入成本。
通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,節(jié)省大量的人工錄入成本。
-
文字識別計(jì)費(fèi)項(xiàng)和計(jì)費(fèi)模式
文字識別提供兩種計(jì)費(fèi)模式:按需計(jì)費(fèi),套餐包計(jì)費(fèi)。按需計(jì)費(fèi):默認(rèn)計(jì)費(fèi)方式,指按照API調(diào)用次數(shù)收費(fèi),按次進(jìn)行結(jié)算。套餐包計(jì)費(fèi):相比“按需計(jì)費(fèi)”具有更大折扣。
文字識別提供兩種計(jì)費(fèi)模式:按需計(jì)費(fèi),套餐包計(jì)費(fèi)。按需計(jì)費(fèi):默認(rèn)計(jì)費(fèi)方式,指按照API調(diào)用次數(shù)收費(fèi),按次進(jìn)行結(jié)算。套餐包計(jì)費(fèi):相比“按需計(jì)費(fèi)”具有更大折扣。
-
什么是語音交互服務(wù)
語音交互服務(wù)是一種人機(jī)交互方式,用戶通過實(shí)時訪問和調(diào)用API獲取語音交互結(jié)果。例如用戶通過語音識別功能,將口述音頻或者語音文件識別成可編輯的文本
語音交互服務(wù)是一種人機(jī)交互方式,用戶通過實(shí)時訪問和調(diào)用API獲取語音交互結(jié)果。例如用戶通過語音識別功能,將口述音頻或者語音文件識別成可編輯的文本
-
實(shí)時語音識別功能介紹
實(shí)時語音識別服務(wù),用戶通過實(shí)時訪問和調(diào)用API獲取實(shí)時語音識別結(jié)果,支持的語言包含中文普通話、方言,方言當(dāng)前支持四川話、粵語和上海話。
實(shí)時語音識別服務(wù),用戶通過實(shí)時訪問和調(diào)用API獲取實(shí)時語音識別結(jié)果,支持的語言包含中文普通話、方言,方言當(dāng)前支持四川話、粵語和上海話。
-
語音交互服務(wù)使用簡介
如果您是業(yè)務(wù)開發(fā)者,沒有代碼編寫基礎(chǔ),您可以使用該方式體驗(yàn)語音交互服務(wù)的一句話識別和語音合成功能。該方式只能用于體驗(yàn),不能用于開發(fā)。
如果您是業(yè)務(wù)開發(fā)者,沒有代碼編寫基礎(chǔ),您可以使用該方式體驗(yàn)語音交互服務(wù)的一句話識別和語音合成功能。該方式只能用于體驗(yàn),不能用于開發(fā)。