架構全覽帶您深入了解ModelArts Guard
架構全覽帶您深入了解ModelArts Guard
為什么選擇華為云ModelArts Guard
提示詞攻擊檢測:抵御大模型新型攻擊
支持單輪和多輪交互攻擊手法,檢出率>80%,誤報率小于1%
支持多種攻擊模式檢測 (例:目標劫持、角色扮演、反面誘導、悖論攻擊、初始肯定、GCG攻擊等)
PII隱私內(nèi)容脫敏:保障個人隱私數(shù)據(jù)安全
支持20+種個人識別數(shù)據(jù)檢測和脫敏
支持身份證、電話、地址、護照、駕照等信息脫敏
內(nèi)容審核:全面攔截敏感內(nèi)容傳播
支持文本審核,具有語言識別能力,主動識別變體等能力
支持圖片審核,具有政治人物識別、畫中畫識別的能力,以及構建目標檢測、識別、OCR等復雜的模型體系