該解決方案有何用途?
該解決方案基于華為云語音交互服務 SIS語音識別構建,可自動將用戶上傳到對象存儲服務 OBS的wav語音文件轉化為文字,并將結果存放到指定對象存儲服務 OBS桶。該方案可以將用戶上傳在對象存儲服務 OBS的語音文件識別成可編輯的文本,支持中文普通話的識別和合成,其中語音識別還支持帶方言口音的普通話識別以及方言(四川話、粵語和上海話)的識別。適用于如下場景:識別客服、客戶的語音,進一步通過文本檢索,檢查有沒有違規(guī)、敏感詞、電話號碼等信息。對會議記錄的音頻文件,進行快速的識別,轉化成文字,方便進行會議記錄等場景。
方案架構
該方案基于華為云語音交互服務 SIS語音識別構建,可自動將用戶上傳到對象存儲服務 OBS的wav語音文件轉化為文字。
架構描述
架構描述
-
創(chuàng)建兩個對象存儲服務 OBS桶,一個用于用戶上傳和存儲用戶的語音文件,另一個用于存儲語音識別結果,用戶可以從該桶中獲取結果并處理
-
使用函數(shù)工作流 FunctionGraph,只需編寫業(yè)務函數(shù)代碼并設置運行的條件,即可以彈性、免運維、高可靠的方式運行
-
使用語音交互服務 SIS,將wav語音文件轉化為文字
-
創(chuàng)建一個EventGrid觸發(fā)器,該觸發(fā)器關聯(lián)事件網格 EG,默認創(chuàng)建一個事件訂閱,事件源為OBS應用事件源,用于自動觸發(fā)函數(shù)執(zhí)行相關業(yè)務邏輯