語(yǔ)料庫(kù)
自然語(yǔ)言處理基礎(chǔ)產(chǎn)品功能
中文分詞 將中文文本切分成以獨(dú)立的詞為單位的序列 詞向量 將自然語(yǔ)言中的詞進(jìn)行向量化表示,輸入文本語(yǔ)料庫(kù),輸出每個(gè)詞的詞向量表示 命名實(shí)體識(shí)別 挖掘出文本中的實(shí)體,如人名、機(jī)構(gòu)名、地名等 短文本相似度 度量?jī)蓚€(gè)短文本之間的語(yǔ)義相似性,輸出相似度數(shù)值 關(guān)鍵詞提取 提取出能夠代表文本語(yǔ)義的詞或短語(yǔ) 依存句法分析 識(shí)別句子中的成分以及各成分之間的關(guān)系,如主謂賓、定狀補(bǔ)等