五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

高山流水覓知音,從“聽見”到“聽懂”

gaoshangliushui.jpg

“高山流水覓知音,知音不在誰堪聽?焦尾聲斷斜陽里,尋遍人間已無琴”。高山流水的典故可謂家喻戶曉。知音難覓,不僅僅是音律動聽,更需能懂。無獨有偶,詩人李白在(開元二十三年)游洛陽而作《春夜洛城聞笛》:“誰家玉笛暗飛聲,散入春風滿洛城。此夜曲中聞折柳,何人不起故園情?!蓖瑯右脖磉_了相同的感慨。詩人聽見幽幽的笛聲,陶醉其中,好似隨春風散落滿城;詩人聽懂“折柳曲”,觸動羈旅情懷,不由得心生思鄉(xiāng)之情。

聲音是一種非接觸的信息傳遞方式,在家居、客服、車載、教育、醫(yī)療等各類語音交互場景中具有先天優(yōu)勢。有關(guān)語音的人工智能技術(shù),就是在解決從“聽見”到“聽懂”的全階段問題,于細微處辨識“笛聲”,分析并理解曲中“折柳”,對應知識文化所賦予的語義,最終形成感知。

扶搖直上九萬里 扎根而下百余尺:在非洲草原上的一種被稱為“草地之王”的植物尖茅草。在生長的最初半年里,只有一寸高,看似薄弱,渺小,人們甚至看不出它在生長。但半年后的雨季到來之際,尖茅草幾天時間就能長到一兩米的高度。研究表明,在長達半年的時間里,尖茅草其實一直在瘋長,但瘋長的只是根部,長度往往超過28米。這樣驚人之舉應征了一句老話:博觀約取,厚積薄發(fā)。語音業(yè)務的算法能力構(gòu)建和客戶場景深耕,更是需要有這種向下扎深根的信念,探究深層次技術(shù)原理的決心。本期給大家繼續(xù)分享華為云算法創(chuàng)新Lab在語音領(lǐng)域的最新進展,包括哭聲檢測、語音喚醒和定制語音識別等關(guān)鍵算法創(chuàng)新。

1. 哭聲識別

落地情況:

1. 哭聲識別算法落地海雀AI全景攝像頭,商品鏈接:https://www.vmall.com/product/10086322059741.html。

2.  上線Hilens技能市場,技能鏈接:http://www.cqfng.cn/product/hilens.html。

image.png

2.  語音喚醒算法 

落地情況:

云側(cè)喚醒模型大小為1.8M,喚醒率>95%,誤喚醒率<1次/天,性能指標達到業(yè)界領(lǐng)先水平,已經(jīng)上線ROC助手。

image.png

端側(cè)模型采用dynamic_rnn訓練并轉(zhuǎn)儲至static_rnn,極大程度進行了模型壓縮,模型大小<500K,內(nèi)存占用<1M,CPU占用率<10%,喚醒率>95%,誤喚醒率<1次/天,已經(jīng)成功部署在Hisi3516EV300/Hisi3518EV200的HiLinux上。

3. 領(lǐng)域ASR

當前進展:

image.png

目前,已經(jīng)完成在線解碼器引擎的研發(fā),包括前端vad、音頻格式處理、定制化熱詞、核心解碼等功能模塊。引擎目前支持流式實時流識別、短語音識別接口。目前最優(yōu)模型效果在3個公開測試集和8個現(xiàn)網(wǎng)客戶測試集上均優(yōu)于華為云訊飛引擎,和華為云捷通引擎平均識別差距在兩個百分點以內(nèi)。