語料庫
自然語言處理基礎(chǔ)產(chǎn)品功能
中文分詞 將中文文本切分成以獨(dú)立的詞為單位的序列 詞向量 將自然語言中的詞進(jìn)行向量化表示,輸入文本語料庫,輸出每個(gè)詞的詞向量表示 命名實(shí)體識別 挖掘出文本中的實(shí)體,如人名、機(jī)構(gòu)名、地名等 短文本相似度 度量兩個(gè)短文本之間的語義相似性,輸出相似度數(shù)值 關(guān)鍵詞提取 提取出能夠代表文本語義的詞或短語 依存句法分析 識別句子中的成分以及各成分之間的關(guān)系,如主謂賓、定狀補(bǔ)等