產(chǎn)品列表
產(chǎn)品列表
時(shí)語音識別.jpg)
實(shí)時(shí)語音識別 RASR
實(shí)時(shí)語音識別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語音識別更快。可應(yīng)用于直播實(shí)時(shí)字幕、會議實(shí)時(shí)記錄、即時(shí)文本生成等場景。

一句話識別 SASR
一句話識別將口述音頻轉(zhuǎn)換為文本,通過API調(diào)用識別不超過一分鐘的不同音頻源發(fā)來的音頻流或音頻文件。適用于語音搜索、人機(jī)交互等語音交互識別場景。

語音合成 TTS
語音合成服務(wù)提供在線語音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語言多音色語音在線合成。支持客戶的個性化語音定制化需求。

錄音文件識別 LASR
錄音文件識別,基于深度學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)5小時(shí)以內(nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。

時(shí)語音合成.jpg)