檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
該API屬于MetaStudio服務(wù),描述: 該接口用于獲取生成的數(shù)字人驅(qū)動數(shù)據(jù),包括語音、表情、動作等。接口URL: "/v1/{project_id}/ttsa-jobs/{job_id}"
com/ 1 四、語音轉(zhuǎn)文字 獲取語音 想要實現(xiàn)語音轉(zhuǎn)文字,首先,我們得獲取用戶的語音輸入。這里使用Python的speech_recognition包來進行語音獲取,使用這個的好處是,他會在用戶說話結(jié)束時,自動停止語音獲取,這里我們就不用自己去寫該什么停止語音獲取的邏輯了,這點
語音回呼場景API 典型場景 當(dāng)應(yīng)用要實現(xiàn)語音回呼功能時,可以調(diào)用語音回呼場景API。 接口功能 主叫用戶通過應(yīng)用撥打被叫用戶,語音通話平臺呼叫主叫和被叫,使主叫和被叫能夠互相通話。 圖1 語音回呼體驗流程 語音回呼業(yè)務(wù)體驗描述: 用戶A通過應(yīng)用呼叫用戶B,請求上報到SP。 SP調(diào)用語音回呼場景API。
提供的語音合成服務(wù)使用方法,利用提供的API接口完成語音合成功能,將合成的語音下載下來。2. 開通功能華為云的提供的語音合成,是一種將文本轉(zhuǎn)換成逼真語音的服務(wù)。用戶通過實時訪問和調(diào)用API獲取語音合成結(jié)果,將用戶輸入的文字合成為音頻。通過音色選擇、自定義音量、語速,為企業(yè)和個人提供個性化的發(fā)音服務(wù)。2
語音合成 TTS 語音合成 TTS 語音合成服務(wù)提供在線語音合成能力,支持將文本信息實時轉(zhuǎn)化為近似的真人發(fā)聲,支持多語言多音色語音在線合成。支持客戶的個性化語音定制化需求。 語音合成服務(wù)提供在線語音合成能力,支持將文本信息實時轉(zhuǎn)化為近似的真人發(fā)聲,支持多語言多音色語音在線合成。支持客戶的個性化語音定制化需求。
實時語音識別響應(yīng) 開始識別請求響應(yīng) 事件響應(yīng) 識別結(jié)果響應(yīng) 錯誤響應(yīng) 嚴重錯誤響應(yīng) 結(jié)束識別請求響應(yīng) 父主題: 實時語音識別接口
實時語音識別工作流程 實時語音識別分為開始識別、發(fā)送音頻數(shù)據(jù)、結(jié)束識別,斷開連接四個階段。 開始階段需要發(fā)送開始指令,包含采樣率,音頻格式,是否返回中間結(jié)果等配置信息。服務(wù)端會返回一個開始響應(yīng)。 發(fā)送音頻階段客戶端會分片發(fā)送音頻數(shù)據(jù),服務(wù)會返回識別結(jié)果或者其他事件,如音頻超時,靜音部分過長等。
語音通知話單通知API 接口功能 用戶通話結(jié)束后,語音通話平臺通過此接口向SP推送通話的話單信息。短時間內(nèi)有多個通話結(jié)束時語音通話平臺會將話單合并推送,每條消息最多攜帶50個話單。 請求方向 語音通話平臺(客戶端) → 客戶服務(wù)器(服務(wù)端) 使用說明 前提條件 SP在開發(fā)應(yīng)用時,
語音回呼話單通知API 接口功能 用戶通話結(jié)束后,語音通話平臺通過此接口向SP推送通話的話單信息。短時間內(nèi)有多個通話結(jié)束時語音通話平臺會將話單合并推送,每條消息最多攜帶50個話單。 請求方向 語音通話平臺(客戶端) → 客戶服務(wù)器(服務(wù)端) 使用說明 前提條件 SP在開發(fā)應(yīng)用時,
HTTPS/HTTP 請求參數(shù) SP調(diào)用語音通知API,語音通話平臺發(fā)起呼叫,給用戶播放自定義的語音文件或TTS合成語音文件,并可進行收號,獲得應(yīng)答信息并反饋給SP。 注:以下流程以語音通話平臺呼叫A,給A播放語音文件并收號為例。流程和接口示例僅供參考,請以實際消息為準(zhǔn)。 表2 請求Headers參數(shù)說明
語音回呼API使用說明 API列表 API名稱 API功能 語音回呼場景API 主叫用戶通過應(yīng)用撥打被叫用戶,語音通話平臺呼叫主叫和被叫,使主叫和被叫能夠互相通話。 終止呼叫場景API 實現(xiàn)通話雙方終止呼叫。 語音回呼呼叫狀態(tài)通知API 語音通話平臺向SP推送接收語音通話業(yè)務(wù)用戶
語音合成 支持“華北-北京一”、“華北-北京四”、“華東-上海一”區(qū)域。 僅支持中文,文本不長于500個中文字。 支持合成采樣率8kHz、16kHz。 父主題: 使用限制
終止呼叫場景API 典型場景 SP通過請求響應(yīng)或者呼叫狀態(tài)和話單通知API獲取到sessionid后,若需要終止呼叫,可調(diào)用“終止呼叫場景API”。 接口功能 開發(fā)者在開發(fā)應(yīng)用時,通過調(diào)用終止呼叫場景API,可以實現(xiàn)終止呼叫的功能。 如果業(yè)務(wù)已經(jīng)執(zhí)行完畢,終止呼叫API會返回失敗。
實時語音識別接口 接口說明 Websocket握手請求 實時語音識別請求 實時語音識別響應(yīng)
團隊作業(yè),應(yīng)對各種問題溫馨提示:1、根據(jù)接口使用規(guī)則,所以API接口調(diào)用即產(chǎn)生次數(shù)累計/計費。應(yīng)用場景:適用于各類物流快遞語音提醒、電話通知、電話語音通知、訂單語音播報、會議語音通知服務(wù)等場景。提供專屬固顯號碼申請,大容量并發(fā),清晰播報語音, 運營商優(yōu)質(zhì)線路資源
Count/min 不涉及 interface 1分鐘 api_calls_with_4xx_response 4xx失敗調(diào)用次數(shù) 該指標(biāo)用于統(tǒng)計接口的4xx失敗調(diào)用次數(shù)。 單位:次/分鐘 ≥ 0 Count/min 不涉及 interface 1分鐘 api_calls_with_5xx_response
語音交互服務(wù)使用簡介 語音交互服務(wù)(Speech Interaction Service,簡稱SIS)是一種人機交互方式,用戶通過實時訪問和調(diào)用API獲取語音交互結(jié)果。華為云SIS服務(wù)支持調(diào)用一句話識別、錄音文件識別、實時語言識別、語音合成接口等。用戶通過調(diào)用語音識別類接口,將口
語音回呼呼叫狀態(tài)通知API 接口功能 語音通話平臺通過此接口向客戶推送語音通話業(yè)務(wù)用戶呼叫時的狀態(tài)信息,如呼入、呼出、振鈴、應(yīng)答、掛機等狀態(tài)的信息。 請求方向 語音通話平臺(客戶端) → 客戶服務(wù)器(服務(wù)端) 使用說明 前提條件 SP在開發(fā)應(yīng)用時,若需訂閱呼叫狀態(tài)通知,必須要提供
該API屬于MetaStudio服務(wù),描述: 該接口用于創(chuàng)建驅(qū)動數(shù)字人表情、動作及語音的任務(wù)。接口URL: "/v1/{project_id}/ttsa-jobs"
語音驗證碼API 語音驗證碼API使用說明 語音驗證碼場景API 語音驗證碼呼叫狀態(tài)通知API 語音驗證碼話單通知API