普通話
實(shí)時語音識別功能特性
文本時間戳 為音頻轉(zhuǎn)換結(jié)果生成特定的時間戳,從而通過搜索文本即可快速找到對應(yīng)的原始音頻片段 智能斷句 通過提取上下文相關(guān)語義特征,并結(jié)合語音特征,智能劃分?jǐn)嗑浼疤砑訕?biāo)點(diǎn)符號,提升輸出文本的可閱讀性 中英文混合識別 支持在中文句子識別中可夾帶英文字母、數(shù)字等,從而實(shí)現(xiàn)中、英文以及數(shù)字的混合識別 語言支持 支持中文普通話,含帶方言口音的普通話識別 即時輸出識別結(jié)果 連續(xù)識別語音流內(nèi)容,即時輸出結(jié)果,并可根據(jù)上下文語言模型自動校正 自動靜音檢測 對輸入語音流進(jìn)行靜音檢測,識別效率和準(zhǔn)確率更高
一句話識別產(chǎn)品特性
效果出眾 使用深度學(xué)習(xí)技術(shù), 語音識別 準(zhǔn)確率高,在業(yè)界具有一定的技術(shù)優(yōu)勢 穩(wěn)定可靠 成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實(shí)踐,經(jīng)受過復(fù)雜場景考驗(yàn) 簡單易用 提供RESTful規(guī)范API接口,并提供服務(wù)SDK,方便客戶使用與集成;幫助客戶減少人力成本,節(jié)省業(yè)務(wù)支出 語音識別 實(shí)時將語音轉(zhuǎn)換成文字,一次性上傳整個音頻,能快速返回識別結(jié)果。 語言支持 支持中文普通話、帶方言口音的普通話以及方言,方言當(dāng)前支持四川話、粵語和上海話識別。 多語音格式支持 支持11種輸入語音格式,包含ulaw、alaw、pcm、mpx、wav等