句子
自然語言處理基礎(chǔ)產(chǎn)品功能
中文分詞 將中文文本切分成以獨立的詞為單位的序列 詞向量 將自然語言中的詞進(jìn)行向量化表示,輸入文本語料庫,輸出每個詞的詞向量表示 命名實體識別 挖掘出文本中的實體,如人名、機(jī)構(gòu)名、地名等 短文本相似度 度量兩個短文本之間的語義相似性,輸出相似度數(shù)值 關(guān)鍵詞提取 提取出能夠代表文本語義的詞或短語 依存句法分析 識別句子中的成分以及各成分之間的關(guān)系,如主謂賓、定狀補(bǔ)等
實時語音識別功能特性
文本時間戳 為音頻轉(zhuǎn)換結(jié)果生成特定的時間戳,從而通過搜索文本即可快速找到對應(yīng)的原始音頻片段 智能斷句 通過提取上下文相關(guān)語義特征,并結(jié)合語音特征,智能劃分?jǐn)嗑浼疤砑訕?biāo)點符號,提升輸出文本的可閱讀性 中英文混合識別 支持在中文句子識別中可夾帶英文字母、數(shù)字等,從而實現(xiàn)中、英文以及數(shù)字的混合識別 語言支持 支持中文普通話,含帶方言口音的普通話識別 即時輸出識別結(jié)果 連續(xù)識別語音流內(nèi)容,即時輸出結(jié)果,并可根據(jù)上下文語言模型自動校正 自動靜音檢測 對輸入語音流進(jìn)行靜音檢測,識別效率和準(zhǔn)確率更高