檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://www.cqfng.cn/intl/zh-cn
不再顯示此消息
在AI原生應(yīng)用引擎的左側(cè)導(dǎo)航欄選擇“運營看板 > 敏感詞庫管理”。 在敏感詞庫管理頁面,單擊“創(chuàng)建敏感詞庫”。 配置敏感詞庫基本信息,參數(shù)說明如表1所示。 表1 創(chuàng)建敏感詞庫參數(shù)說明 參數(shù) 說明 敏感詞庫名稱 自定義敏感詞庫的名稱。
敏感詞管理 敏感詞設(shè)置 管理員可在管理后臺添加敏感詞詞庫,并對敏感詞詞庫進行查看、編輯、停用、刪除操作,針對啟用中詞庫中的敏感詞將攔截發(fā)送。
詞庫管理 查詢自定義詞庫狀態(tài) - ShowIkThesaurus 加載自定義詞庫 - CreateLoadIkThesaurus 刪除自定義詞庫 - DeleteIkThesaurus 父主題: API V1
") sk := os.Getenv("CLOUD_SDK_SK") projectId := "{project_id}" auth := basic.NewCredentialsBuilder().
也支持基于同義詞詞庫,根據(jù)同義詞搜 索文本數(shù)據(jù)。CSS服務(wù)使用的分詞器包括IK分詞器和同義詞分詞器。IK分詞器配備主詞詞庫和停詞詞庫;同義詞分詞器配備同義詞詞庫。其中,IK分詞器包含ik_max_word和ik_smart分詞 策略。
由于系統(tǒng)預(yù)置的靜態(tài)停詞詞庫包含了“是”、“的”等常用詞,如果集群未刪除或更新預(yù)置詞庫,則此類停用詞可以不用上傳。 參考配置自定義詞庫,完成詞庫配置。 待詞庫配置信息生效后,返回集群列表。單擊集群操作列的“Dashboards”接入集群。
也支持基于同義詞詞庫,根據(jù)同義詞搜索文本數(shù)據(jù)。 該接口用于清空自定義詞庫(主詞詞庫、停詞詞庫、同義詞詞庫)。 調(diào)用方法 請參見如何調(diào)用API。 授權(quán)信息 賬號具備所有API的調(diào)用權(quán)限,如果使用賬號下的IAM用戶調(diào)用當前API,該IAM用戶需具備調(diào)用API所需的權(quán)限。
敏感詞管理接口 (sensitiveWordManage) 刪除敏感詞 取得敏感詞列表 刪除敏感詞分類 更新敏感詞 獲取敏感詞分類列表 根據(jù)敏感詞分類的唯一標識取得分類下敏感詞列表 創(chuàng)建敏感詞分類 搬移敏感詞到指定分類 新增敏感詞 更新敏感詞分類 根據(jù)敏感詞的唯一標識獲取敏感詞詳細資訊
由于系統(tǒng)預(yù)置的靜態(tài)停詞詞庫包含了“是”、“的”等常用詞,如果集群未刪除或更新預(yù)置詞庫,則此類停用詞可以不用上傳。 參考配置自定義詞庫,完成詞庫配置。 待詞庫配置信息生效后,返回集群列表。單擊集群操作列的“Kibana”接入集群。
如果創(chuàng)建時間早于2018年3月10日,則創(chuàng)建該集群時自定義詞庫功能尚未上線,當前無法為該集群配置自定義詞庫。 如果創(chuàng)建時間晚于2018年3月10日,則需要排查當前登錄所用的賬號或IAM用戶是否具有使用自定義詞庫功能的權(quán)限,具體操作請參見排查是否有權(quán)限。
配置OpenSearch集群自定義詞庫 OpenSearch集群詞庫介紹 配置和使用OpenSearch集群的自定義詞庫 父主題: 管理OpenSearch集群
配置Elasticsearch集群自定義詞庫 Elasticsearch集群詞庫介紹 配置和使用Elasticsearch集群的自定義詞庫 父主題: 管理Elasticsearch集群
評價敏感詞及敏感詞處理方式管理 租戶管理員可以對評價時涉及到的敏感詞進行管理包括新增、修改、刪除敏感詞;租戶管理員也可以設(shè)置當用戶提交的評價內(nèi)容中包括敏感詞時的處理策略。
配置自定義詞庫(可選) 使用文本內(nèi)容審核服務(wù)前,您可以配置自定義白名單詞庫或自定義黑名單詞庫,來幫助您過濾和檢測指定文本內(nèi)容。 配置自定義詞庫 V3請看具體操作。
背景信息 配置自定義詞庫需要先開通文本內(nèi)容審核服務(wù),詳情參見申請服務(wù)。 配置后可以免費使用自定義詞庫。 一個賬戶最多支持創(chuàng)建20個自定義詞庫。 創(chuàng)建自定義詞庫 白名單詞庫的處理建議選擇“通過”,黑名單詞庫的處理建議選擇“違規(guī)”或“疑似”。
CSS服務(wù)給集群預(yù)置了靜態(tài)主詞詞庫、靜態(tài)停詞詞庫、Extra主詞詞庫和Extra停詞詞庫這四個詞庫。 當這些預(yù)置詞庫已滿足集群業(yè)務(wù)的分詞需求時,則集群無需配置自定義詞庫即可直接實現(xiàn)關(guān)鍵詞搜索。
/ 中國/ 科學(xué)/ 學(xué)院/ 科學(xué)院/ 中國科學(xué)院/ 計算/ 計算所/ ,/ 后/ 在/ 日本/ 京都/ 大學(xué)/ 日本京都大學(xué)/ 深造 Process finished with exit code 0 添加自定義詞典 開發(fā)者可以指定自己自定義的詞典,以便包含jieba詞庫里沒有的詞
CSS服務(wù)給集群預(yù)置了靜態(tài)主詞詞庫、靜態(tài)停詞詞庫、Extra主詞詞庫和Extra停詞詞庫這四個詞庫。 當這些預(yù)置詞庫已滿足集群業(yè)務(wù)的分詞需求時,則集群無需配置自定義詞庫即可直接實現(xiàn)關(guān)鍵詞搜索。
使用文本內(nèi)容審核時,您可以配置自定義詞庫來過濾和檢測指定文本內(nèi)容。當前僅支持中文內(nèi)容審核。 自定義白名單詞庫配置 進行白名單詞庫配置,可以不檢測白名單詞庫中配置的內(nèi)容。 自定義黑名單詞庫 黑名單詞庫的名稱指定給glossary_names就是設(shè)置自定義的場景。
分詞原理: 簡單來說,jieba庫是通過中文詞庫的方式來識別分詞的。它首先利用一個中文詞庫,通過詞庫計算漢字之間構(gòu)成詞語的關(guān)聯(lián)概率,所以通過計算漢字之間的概率,就可以形成分詞的結(jié)果。
為企業(yè)提供端管云安全防護與差異化管理能力,安全水印、加密算法、保密通訊、安全隧道、敏感詞管理、隱私設(shè)置等服務(wù)可滿足不同組織、不同場景的安全訴求。