視頻標簽(簡稱VCT),基于深度學習對視頻進行場景分類、人物識別、 語音識別 、 文字識別 等多維度分析,形成層次化的分類標簽。
功能描述
場景概念識別
基于對視頻中的場景信息的分析,輸出豐富而準確的概念、場景標簽
人物識別
基于對視頻中的人物信息的分析,輸出準確的人物標簽
視頻OCR
識別視頻中出現(xiàn)的文字內(nèi)容,包括字幕、彈幕、以及部分自然場景文字和藝術(shù)字等
產(chǎn)品優(yōu)勢
識別準確
采用標簽排序?qū)W習算法與卷積神經(jīng)網(wǎng)絡(luò)算法,識別精度高,支持實時識別與檢測
簡單易用
提供符合RESTful的API訪問接口,使用方便,用戶的業(yè)務(wù)系統(tǒng)可快速集成
層次標簽
層次化標簽庫完善,支持同時輸出通用標簽與垂直領(lǐng)域細粒度標簽,豐富標簽應(yīng)用場景
多維分析
從聲音、動作、圖像、文字等多維度分析視頻,深度理解視頻內(nèi)容,輸出結(jié)果更加準確
應(yīng)用場景
1.視頻搜索
基于對視頻的場景分類、人物識別、語音識別、文字識別等分析,形成層次化的分類標簽,支撐準確高效的視頻搜索,提升搜索體驗
優(yōu)勢
多維度識別
綜合圖像、語音、文字、人臉等信息,標簽識別更加準確
識別準確
采用標簽排序?qū)W習算法與卷積神經(jīng)網(wǎng)絡(luò)算法,標簽識別準確度高
標簽可定制
只需提供少量視頻與對應(yīng)標簽,便可以按需定制標簽類別、層次體系

2.視頻推薦
基于對視頻的場景分類、人物識別、語音識別、文字識別等分析,形成層次化的分類標簽,進行個性化視頻推薦
優(yōu)勢
多維度識別
綜合圖像、語音、文字、人臉等信息,標簽識別更加準確
識別準確
采用標簽排序?qū)W習算法與卷積神經(jīng)網(wǎng)絡(luò)算法,標簽識別準確度高
標簽可定制
只需提供少量視頻與對應(yīng)標簽,便可以按需定制標簽類別、層次體系
