五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

[快速入門]免費(fèi)ai文本模型
內(nèi)容審核-文本

內(nèi)容審核-文本 內(nèi)容審核-文本 內(nèi)容審核-文本 Moderation (Text),基于華為自研的深度學(xué)習(xí)和內(nèi)容審核模型,可自動(dòng)識(shí)別出文本中出現(xiàn)的涉黃、廣告、辱罵、灌水等內(nèi)容,幫助客戶降低業(yè)務(wù)違規(guī)風(fēng)險(xiǎn),凈化網(wǎng)絡(luò)環(huán)境,提升用戶體驗(yàn) 內(nèi)容審核-文本 Moderation (Text)

CodeArts活動(dòng)頁

內(nèi)全量構(gòu)建的極速構(gòu)建、支持億級(jí)測(cè)試用例資產(chǎn)復(fù)用、千萬級(jí)壓測(cè)先進(jìn)能力。 更智能: CodeArts引用大模型AIGC的突破,已實(shí)現(xiàn)代碼智能生成、測(cè)試文本用例智能生成等,后續(xù)CodeArts會(huì)不斷創(chuàng)新探索,將AI技術(shù)貫穿軟件開發(fā)生命周期始終。 更安全: CodeArts致力從運(yùn)行態(tài)的

向量數(shù)據(jù)庫

引入動(dòng)態(tài)難負(fù)例訓(xùn)練:采用動(dòng)態(tài)難負(fù)樣本優(yōu)化召回模型,進(jìn)一步推升模型效果。 應(yīng)用場(chǎng)景 向量檢索 向量檢索的應(yīng)用場(chǎng)景非常廣泛,典型如:語義搜索、圖像搜索、商品推薦、智能客服、企業(yè)知識(shí)庫搜索等等。 優(yōu)勢(shì) 大模型的“黃金搭檔” 為盤古大模型提供緩存能力,同時(shí)提供開箱即用的多模態(tài)Embedding能力。

圖像搜索

支持百億級(jí)圖片索引構(gòu)建,實(shí)時(shí)建庫及檢索,單圖毫秒級(jí)響應(yīng) 多特性:多特性搜索 多特性:多特性搜索 以圖搜圖,關(guān)鍵詞搜索,文本搜索進(jìn)行多特性搜索 預(yù)置特征抽取模型 預(yù)置特征抽取模型 預(yù)置垂直行業(yè)特征提取模型和細(xì)顆粒度特征組合,為用戶快速構(gòu)建圖像檢索能力 文檔與學(xué)習(xí)成長(zhǎng) 快速入門 快速入門 圖像搜索功能介紹

Web應(yīng)用防火墻WAF-大模型防火墻

全新上線:大模型防火墻 全新上線:大模型防火墻 全面守護(hù)AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 全面守護(hù)AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 免費(fèi)試用大模型防火墻公測(cè)上線,可申請(qǐng)免費(fèi)試用一個(gè)月 申請(qǐng)公測(cè) 了解更多 提示詞攻擊防護(hù) 識(shí)別并攔截惡意提示詞,防止大模型被誘導(dǎo)生成不當(dāng)內(nèi)容。

盤古預(yù)測(cè)大模型

文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古預(yù)測(cè)大模型能力與規(guī)格 盤古大模型快速入門 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū) 優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè)

ModelBox開發(fā)者專區(qū)

開源鏡像開發(fā) ModelBox AI應(yīng)用開發(fā) ModelBox是一套專門為AI開發(fā)者提供的易于使用,高效,高擴(kuò)展的AI推理開發(fā)框架,它可以幫助AI開發(fā)者快速完成從模型文件到AI推理應(yīng)用的開發(fā)和上線工作,降低AI算法落地門檻,同時(shí)帶來AI應(yīng)用的高穩(wěn)定性和極致性能。 基于ModelBox開源社區(qū)源碼開發(fā)AI應(yīng)用

華為云會(huì)議免費(fèi)下載

華為云會(huì)議,更專業(yè)“會(huì)”更好 華為云會(huì)議,更專業(yè)“會(huì)”更好 注冊(cè)免費(fèi)送50方云會(huì)議室,支持最多50人同時(shí)入會(huì) 注冊(cè)免費(fèi)送50方云會(huì)議室,支持最多50人同時(shí)入會(huì) 購買咨詢 免費(fèi)體驗(yàn) 產(chǎn)品優(yōu)勢(shì) 高清視頻會(huì)議 4K超高清數(shù)據(jù)共享,1080p高清視頻,首家移動(dòng)端720p,端到端時(shí)延<200ms,高清流暢

ModelArts Standard

支持訂閱AI Gallery中的算法構(gòu)建模型 訓(xùn)練管理 支持基于不同的數(shù)據(jù),選擇不同規(guī)格的資源池用于模型訓(xùn)練;支持使用以下三種方式開發(fā)模型:訂閱算法、自定義算法、自定義鏡像 AI應(yīng)用管理 支持將訓(xùn)練作業(yè)中得到的模型、本地開發(fā)的模型部署為AI應(yīng)用,并進(jìn)行統(tǒng)一管理;提供模型轉(zhuǎn)換能力,方便能夠?qū)⒛P筒渴鹪诓煌脑O(shè)備上

[相關(guān)產(chǎn)品]免費(fèi)ai文本模型
智慧監(jiān)控AI模型

智慧監(jiān)控AI模型綜合集成了人臉識(shí)別模型、安全帽識(shí)別模型、口罩佩戴識(shí)別模型、車牌識(shí)別模型、車輛占道識(shí)別模型5種AI模型。一,人臉識(shí)別服務(wù) 人臉識(shí)別模型目前提供授權(quán)認(rèn)證、模型加載、人臉注冊(cè)、人臉識(shí)別、人臉刪除、特征提取六個(gè)接口服務(wù)。 授權(quán)認(rèn)證:需先進(jìn)行授權(quán)認(rèn)證,才能夠正常使用人臉識(shí)別服務(wù);

AI大模型 算法備案

《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》明確,具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)在提供服務(wù)之日起十個(gè)工作日內(nèi)通過互聯(lián)網(wǎng)信息服務(wù)算法備案系統(tǒng)填報(bào)服務(wù)提供者的名稱、服務(wù)形式、應(yīng)用領(lǐng)域、算法類型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息  方便

AI大模型專業(yè)服務(wù)

湘江鯤鵬目前在人工智能模型領(lǐng)域擁有算力、數(shù)據(jù)、算法三大關(guān)鍵要素的經(jīng)驗(yàn)積累,構(gòu)建了大模型三個(gè)方面的差異化競(jìng)爭(zhēng)力,盤古大模型AI專業(yè)服務(wù)覆蓋從前期咨詢、規(guī)劃設(shè)計(jì),到數(shù)據(jù)工程、模型訓(xùn)練,再到應(yīng)用工程及模型運(yùn)維的完整流程?;谌A為盤古提供的AI專業(yè)服務(wù)包,致力于為企業(yè)提供一站式人工智能解決方案

企業(yè)級(jí)AI模型開發(fā)

云塢網(wǎng)絡(luò)專注于利用先進(jìn)的AI云計(jì)算、大數(shù)據(jù)和人工智能技術(shù),為企業(yè)提供卓越的ChatGPT行業(yè)解決方案。幫助企業(yè)快速實(shí)現(xiàn)數(shù)字化、智能化和綠色化轉(zhuǎn)型。 系統(tǒng)定制開發(fā):我們可以為客戶提供系統(tǒng)的定制開發(fā)服務(wù),幫助客戶實(shí)現(xiàn)更多的個(gè)性化功能和業(yè)務(wù)流程需求。,數(shù)據(jù)遷移:我們幫助客戶將現(xiàn)有系統(tǒng)的

文本識(shí)別

風(fēng)險(xiǎn)文本識(shí)別,可檢測(cè)并識(shí)別該文本中包含的涉黃、涉政、廣告內(nèi)容 文本分類,提供對(duì)文本按照內(nèi)容類型進(jìn)行分類并輸出置信度 文本關(guān)鍵詞提取,對(duì)標(biāo)題、文章等文本內(nèi)容進(jìn)行分析,提取核心關(guān)鍵詞風(fēng)險(xiǎn)文本識(shí)別服務(wù)核心功能介紹: 輸入一段文本,可檢測(cè)并識(shí)別該文本中包含的涉黃、涉政、廣告內(nèi)容。 應(yīng)用場(chǎng)景推薦:

大模型及AI應(yīng)用配套服務(wù)

angChain等流行的大模型開發(fā)框架,構(gòu)建企業(yè)級(jí)AI應(yīng)用;團(tuán)隊(duì)擁有成熟的軟件工程技術(shù)和管理能力。6. 大模型使用的技術(shù)支持,用戶使用大模型平臺(tái),解答用戶使用過程遇到的問題;大模型與應(yīng)用對(duì)接集成,以及進(jìn)行日常巡檢、故障處理、模型升級(jí)等服務(wù)。4. 工業(yè)數(shù)據(jù)模型(CAD模型、CAE模

文本審核

文本審核 文本內(nèi)容審核】提供對(duì)負(fù)面詞語的識(shí)別審核能力,可用于用戶評(píng)論過濾、注冊(cè)信息篩選、文章內(nèi)容審核等場(chǎng)景。—— 我們只做精品!一、產(chǎn)品介紹 :【 文本審核 文本內(nèi)容審核】提供對(duì)負(fù)面詞語的識(shí)別審核能力,可用于用戶評(píng)論過濾、注冊(cè)信息篩選、文章內(nèi)容審核等場(chǎng)景。—— 我們只做精品! 二、更多產(chǎn)品:更多商品請(qǐng)點(diǎn)擊鏈接

人工智能AI大模型技術(shù)研發(fā)定制服務(wù)

公司集成了世界領(lǐng)先的底層大模型,具備打通跨模型和工具鏈的平臺(tái),提供從需求分析、數(shù)據(jù)收集、模型設(shè)計(jì)、訓(xùn)練優(yōu)化、評(píng)估、系統(tǒng)集成、用戶界面設(shè)計(jì)、部署維護(hù)、合規(guī)性檢查、技術(shù)支持、性能監(jiān)控、擴(kuò)展性設(shè)計(jì)、定制服務(wù)到持續(xù)研發(fā)一站式AI模型定制研發(fā)服務(wù)。光啟慧語是一家圍繞大模型全棧開展技術(shù)研發(fā)和產(chǎn)品

天尊大模型AIGC場(chǎng)景解決方案

太杉天尊大模型AIGC場(chǎng)景解決方案是以AI場(chǎng)景解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。具備自研的行業(yè)模型能力,主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。太杉天尊大模型AIGC場(chǎng)景解決方案,是一款專為滿足政府企

[相似文章]免費(fèi)ai文本模型
華為云盤古大模型_華為云AI大模型_盤古人工智能

了解詳情 盤古預(yù)測(cè)大模型 盤古預(yù)測(cè)大模型是面向結(jié)構(gòu)化類數(shù)據(jù),基于10類2000個(gè)基模型空間,通過模型推薦、融合兩步優(yōu)化策略,構(gòu)建圖網(wǎng)絡(luò)架構(gòu)AI模型。 了解詳情 盤古科學(xué)計(jì)算大模型 科學(xué)計(jì)算大模型是面向氣象、醫(yī)藥、水務(wù)、機(jī)械、航天航空等領(lǐng)域,采用AI數(shù)據(jù)建模和AI方程求解的方法;從海

ModelArts推理部署_模型_AI應(yīng)用來源-華為云

入鏡像創(chuàng)建AI為應(yīng)用。 幫助文檔 收起 展開 本地準(zhǔn)備模型包 收起 展開 在本地準(zhǔn)備模型包,編寫模型配置文件和模型推理代碼,將準(zhǔn)備好的模型包上傳至對(duì)象存儲(chǔ)服務(wù)OBS,從OBS導(dǎo)入模型創(chuàng)建為AI應(yīng)用。 幫助文檔 收起 展開 AI Gellary訂閱模型 收起 展開 在AI Gall

通用文字識(shí)別_通用文本識(shí)別_【免費(fèi)】_OCR_在線文字識(shí)別

D文檔中的打印字符進(jìn)行檢測(cè)識(shí)別成可編輯的文本格式,以JSON格式返回識(shí)別結(jié)果。 文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測(cè)識(shí)別成可編輯的文本格式,以JSON格式返回識(shí)別結(jié)果。 了解更多

免費(fèi)AI客服電話_AI智能語音外呼系統(tǒng)_AI人工語音智能電話

3,000.00元/年 免費(fèi)AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機(jī)器特征 免費(fèi)AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機(jī)器特征 免費(fèi)AI客服電話-內(nèi)置ASR引擎 支持ASR,NLP,NLU,TTS等技術(shù)數(shù)據(jù)整合識(shí)別、響應(yīng)飛速提升 免費(fèi)AI客服電話-多輪會(huì)話 領(lǐng)先

ModelArts模型訓(xùn)練_模型訓(xùn)練簡(jiǎn)介_如何訓(xùn)練模型

ModelArts模型訓(xùn)練 ModelArts模型訓(xùn)練簡(jiǎn)介 ModelArts模型訓(xùn)練,俗稱“建模”,指通過分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個(gè)或多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測(cè)、評(píng)價(jià)等結(jié)果。

在線文字轉(zhuǎn)語音_【免費(fèi)】_文本轉(zhuǎn)換語音_文字轉(zhuǎn)換成真人語音_文字轉(zhuǎn)音頻

在線文字轉(zhuǎn)語音 - 智能教育 在線文字轉(zhuǎn)語音 - 智能教育 將書本上的文本內(nèi)容合成為語音,接近真人的發(fā)音可模擬真人教學(xué)場(chǎng)景,實(shí)現(xiàn)課文的朗讀和帶讀,幫助學(xué)生更好地理解和掌握教學(xué)內(nèi)容 優(yōu)勢(shì) 效果自然 合成音效流暢、自然,在音色、自然度等方面接近人聲 個(gè)性定制 根據(jù)喜好選擇不同的發(fā)聲人 免費(fèi)試用 立即購買

文本校對(duì)_在線文字校對(duì)_文字校對(duì)

了解更多 文本校對(duì)相關(guān)文章推薦 識(shí)別ocr_識(shí)別接口api_ocr平臺(tái) 表格ocr_在線ocr_ocr平臺(tái)系統(tǒng) 實(shí)時(shí)語音識(shí)別_錄音文件識(shí)別_語言生成 網(wǎng)絡(luò)虛擬號(hào)碼發(fā)送短信_(tái)免費(fèi)用虛擬號(hào)碼發(fā)短信 免費(fèi)云服務(wù)_云免費(fèi)試用_免費(fèi)套餐_服務(wù)器體驗(yàn) 免費(fèi)的試用云主機(jī)_免費(fèi)云主機(jī)_免費(fèi)云主機(jī)試用一年

免費(fèi)的企業(yè)用郵箱_mail企業(yè)郵箱_免費(fèi)注冊(cè)企業(yè)郵箱

選擇企業(yè)郵箱。 企業(yè)郵箱購買計(jì)費(fèi) 華為云有免費(fèi)企業(yè)郵箱嗎 您可以多關(guān)注和華為云企業(yè)郵箱相關(guān)的活動(dòng),當(dāng)前可以免費(fèi)試用15天,在15天內(nèi)相當(dāng)于免費(fèi)企業(yè)郵箱。 注冊(cè)企業(yè)郵箱收費(fèi)嗎 注冊(cè)企業(yè)郵箱一般是需要收費(fèi)的,但各個(gè)廠商有活動(dòng)時(shí),可能有可以免費(fèi)試用的活動(dòng)。您可以關(guān)注華為云的企業(yè)郵箱活動(dòng)。

GaussDB數(shù)據(jù)庫模型_GaussDB是什么_高斯數(shù)據(jù)庫模型

華為數(shù)據(jù)庫GaussDB_GaussDB數(shù)據(jù)庫的優(yōu)點(diǎn)_【免費(fèi)】_GaussDB分布式數(shù)據(jù)庫_數(shù)據(jù)庫平臺(tái) 關(guān)系數(shù)據(jù)庫管理系統(tǒng)_數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫應(yīng)用 數(shù)據(jù)庫軟件免費(fèi)版 云數(shù)據(jù)庫免費(fèi)_云數(shù)據(jù)庫免費(fèi)試用 免費(fèi)數(shù)據(jù)庫GaussDB NoSQL_云數(shù)據(jù)庫_數(shù)據(jù)庫免費(fèi)免費(fèi)云數(shù)據(jù)庫 MySQL數(shù)據(jù)庫入門 云數(shù)據(jù)庫和普通數(shù)據(jù)庫

免費(fèi)ai文本模型

ModelArts Studio大模型即服務(wù)平臺(tái)部署成功的模型服務(wù)支持在其他業(yè)務(wù)環(huán)境中調(diào)用。本文以我的服務(wù)為例,調(diào)用部署的模型服務(wù)。您也可以調(diào)用預(yù)置服務(wù)-免費(fèi)服務(wù)、預(yù)置服務(wù)-商用服務(wù)或自定義接入點(diǎn)。

操作場(chǎng)景

在企業(yè)AI應(yīng)用開發(fā)過程中,開發(fā)人員通常需要將訓(xùn)練好的模型部署到實(shí)際業(yè)務(wù)環(huán)境中。然而,傳統(tǒng)方法需要手動(dòng)配置環(huán)境、處理依賴關(guān)系、編寫部署腳本,整個(gè)過程耗時(shí)且容易出錯(cuò),且存在環(huán)境復(fù)雜、遷移困難、維護(hù)成本高、版本更新麻煩等問題。

ModelArts Studio(MaaS)大模型即服務(wù)平臺(tái)提供了一站式解決方案,提供統(tǒng)一的API接口方便業(yè)務(wù)系統(tǒng)調(diào)用,并提供監(jiān)控和日志功能便于運(yùn)維管理。

計(jì)費(fèi)說明

在調(diào)用模型推理服務(wù)的過程中,輸入內(nèi)容首先會(huì)被分詞(tokenize),轉(zhuǎn)換為模型可識(shí)別的Token。在調(diào)用MaaS預(yù)置服務(wù)時(shí),將根據(jù)實(shí)際使用的Tokens數(shù)量進(jìn)行計(jì)費(fèi)。計(jì)費(fèi)詳情請(qǐng)參見計(jì)費(fèi)說明。

約束限制

對(duì)于支持圖片上傳的模型,單個(gè)圖片文件的大小不超過10MB。如果以Base64編碼形式上傳圖片,需確保編碼后的圖片小于10MB。

前提條件

步驟一:獲取API Key

在調(diào)用MaaS部署的模型服務(wù)時(shí),需要填寫API Key用于接口的鑒權(quán)認(rèn)證。最多可創(chuàng)建30個(gè)密鑰。每個(gè)密鑰僅在創(chuàng)建時(shí)顯示一次,請(qǐng)確保妥善保存。如果密鑰丟失,無法找回,需要重新創(chuàng)建API Key以獲取新的訪問密鑰。更多信息,請(qǐng)參見在ModelArts Studio(MaaS)管理API Key

  1. 登錄ModelArts Studio(MaaS)控制臺(tái),在頂部導(dǎo)航欄選擇目標(biāo)區(qū)域。
  2. 在左側(cè)導(dǎo)航欄,單擊“API Key管理”
  3. “API Key管理”頁面,單擊“創(chuàng)建API Key”,填寫標(biāo)簽和描述信息后,單擊“確定”。

    標(biāo)簽和描述信息在創(chuàng)建完成后,不支持修改。

    表1 創(chuàng)建API Key參數(shù)說明

    參數(shù)

    說明

    標(biāo)簽

    自定義API Key的標(biāo)簽。標(biāo)簽具有唯一性,不可重復(fù)。僅支持大小寫英文字母、數(shù)字、下劃線、中劃線,長(zhǎng)度范圍為1~100個(gè)字符。

    描述

    自定義API Key的描述,長(zhǎng)度范圍為1~100個(gè)字符。

  4. “您的密鑰”對(duì)話框,復(fù)制密鑰并保存至安全位置。
  5. 保存完畢后,單擊“關(guān)閉”。

    單擊“關(guān)閉”后將無法再次查看密鑰。

步驟二:調(diào)用MaaS模型服務(wù)進(jìn)行預(yù)測(cè)

  1. ModelArts Studio(MaaS)控制臺(tái)左側(cè)導(dǎo)航欄,選擇“在線推理”。
  2. “在線推理”頁面,單擊“我的服務(wù)”頁簽,在目標(biāo)服務(wù)右側(cè),單擊操作列的“更多 > 調(diào)用說明”
  3. “關(guān)閉 內(nèi)容審核 服務(wù)”對(duì)話框,選擇是否啟用內(nèi)容審核(默認(rèn)啟用)。
    • 啟用內(nèi)容審核,可以阻止在線推理中的輸入輸出中出現(xiàn)不合規(guī)的內(nèi)容,但可能會(huì)對(duì)接口性能產(chǎn)生較大影響。
    • 關(guān)閉內(nèi)容審核服務(wù),將不會(huì)審核在線推理中的輸入輸出,模型服務(wù)可能會(huì)有違規(guī)風(fēng)險(xiǎn),請(qǐng)謹(jǐn)慎關(guān)閉。

      關(guān)閉“內(nèi)容審核”開關(guān),需要在彈窗中確認(rèn)是否停用內(nèi)容審核服務(wù),勾選“我已閱讀并同意上述說明”后,單擊“確定”關(guān)閉。

  4. “調(diào)用說明”頁面,選擇接口類型,復(fù)制調(diào)用示例,修改接口信息和API Key后用于業(yè)務(wù)環(huán)境調(diào)用模型服務(wù)API。

    Rest API、OpenAI SDK的示例代碼如下。

    • Rest API示例代碼如下所示:
      • 使用Python調(diào)用示例。
        import requests
        import json
        
        if __name__ == '__main__':
            url = "https:/example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions"
            api_key = "<your_apiKey>"  # 把<your_apiKey>替換成已獲取的API Key。
        
            # Send request.
            headers = {
                'Content-Type': 'application/json',
                'Authorization': f'Bearer {api_key}'
            }
            data = {
                "model": "******",  # 調(diào)用時(shí)的模型名稱。
                "max_tokens": 1024,  # 最大輸出token數(shù)。
                "messages": [
                    {"role": "system", "content": "You are a helpful assistant."},
                    {"role": "user", "content": "hello"}
                ],
                # 是否開啟流式推理,默認(rèn)為False,表示不開啟流式推理。
                "stream": False,
                # 在流式輸出時(shí)是否展示使用的token數(shù)目。只有當(dāng)stream為True時(shí)該參數(shù)才會(huì)生效。
                # "stream_options": {"include_usage": True},
                # 控制采樣隨機(jī)性的浮點(diǎn)數(shù),值較低時(shí)模型更具確定性,值較高時(shí)模型更具創(chuàng)造性。"0"表示貪婪取樣。默認(rèn)為0.6。
                "temperature": 0.6
            }
        	response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
        	# Print result.     
        	print(response.status_code)     
        	print(response.text)
      • 使用cURL調(diào)用示例。
        curl -X POST "https://example.com/v1/chat/completions" \
          -H "Content-Type: application/json" \
          -H "Authorization: Bearer $API_KEY" \
          -d '{ 
            "model": "DeepSeek-R1",
            "messages": [
              {"role": "system", "content": "You are a helpful assistant."},
              {"role": "user", "content": "你好"}
            ],
            "stream": true,
            "stream_options": { "include_usage": true },
            "temperature": 0.6
          }'
    • 使用OpenAI SDK調(diào)用示例。
      # 安裝環(huán)境命令。
      pip install --upgrade "openai>=1.0"
      # OpenAI SDK調(diào)用示例。
      from openai import OpenAI
      
      if __name__ == '__main__':
      	base_url = "https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06******/v1"
      	api_key = "<your_apiKey>"  # 把<your_apiKey>替換成已獲取的API Key。
      
      	client = OpenAI(api_key=api_key, base_url=base_url)
      
      	response = client.chat.completions.create(
      		model="******",
      		messages=[
      			{"role": "system", "content": "You are a helpful assistant"},
      			{"role": "user", "content": "Hello"},
      		],
      		max_tokens=1024,
      		temperature=0.6,
      		stream=False
      	)
      	# Print result.     
              print(response.choices[0].message.content)

    模型服務(wù)的API與vLLM相同,表2僅介紹關(guān)鍵參數(shù),詳細(xì)參數(shù)解釋請(qǐng)參見vLLM官網(wǎng)。使用昇騰云909 鏡像 的模型,開啟流式輸出時(shí),需要新增stream_options參數(shù),值為{"include_usage":true},才會(huì)打印token數(shù)。

    表2 請(qǐng)求參數(shù)說明

    參數(shù)

    是否必選

    默認(rèn)值

    參數(shù)類型

    描述

    url

    Str

    調(diào)用時(shí)的API地址。假設(shè)URL為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} , 其中{endpoint}僅支持如下接口,詳細(xì)介紹請(qǐng)參見接口調(diào)用說明。

    • /v1/chat/completions
    • /v1/models

    model

    Str

    調(diào)用時(shí)的模型名稱。

    在ModelArts Studio大模型即服務(wù)平臺(tái)的“在線推理”頁面,選擇調(diào)用的模型服務(wù),單擊操作列的“更多 > 調(diào)用”,在調(diào)用頁面可以獲取“模型名稱”。

    messages

    -

    Array

    請(qǐng)求輸入的問題。

    messages.role

    Str

    不同的role對(duì)應(yīng)不同的消息類型。

    • system:開發(fā)人員輸入的指令,例如模型應(yīng)遵循的答復(fù)格式、扮演的角色等。
    • user:用戶輸入的消息,包括提示詞和上下文信息。
    • assistant:模型生成的回復(fù)內(nèi)容。
    • tool:模型調(diào)用工具返回的信息。

    messages.content

    Str

    • 當(dāng)role為system時(shí):給AI模型設(shè)定的人設(shè)。
      {"role": "system","content": "你是一個(gè)樂于助人的AI助手"}
    • 當(dāng)role為user時(shí):用戶輸入的問題。
      {"role": "user","content": "9.11和9.8哪個(gè)大?"}
    • 當(dāng)role為assistant時(shí):AI模型輸出的答復(fù)內(nèi)容。
      {"role": "assistant","content": "9.11大于9.8"}
    • 當(dāng)role為tool時(shí):AI模型調(diào)用的工具響應(yīng)信息。
      {"role": "tool", "content": "上海今天天氣晴,氣溫10度"}

    stream_options

    Object

    該參數(shù)用于配置在流式輸出時(shí)是否展示使用的token數(shù)目。只有當(dāng)stream為True的時(shí)候該參數(shù)才會(huì)激活生效。如果您需要統(tǒng)計(jì)流式輸出模式下的token數(shù)目,可將該參數(shù)配置為stream_options={"include_usage":True}。

    max_tokens

    16

    Int

    當(dāng)前任務(wù)允許的生成Token數(shù)上限,包括模型輸出的Tokens和深度思考的Reasoning Tokens。

    top_k

    -1

    Int

    在生成過程中,候選集大小限定了采樣的范圍。以取值50為例,這意味著每一步僅會(huì)考慮得分排在前50位的Token構(gòu)成候選集進(jìn)行隨機(jī)抽樣。增大此值將提高輸出的隨機(jī)性,減小此值會(huì)增強(qiáng)輸出的確定性。

    top_p

    1.0

    Float

    模型核采樣(nucleus sampling)。僅保留累計(jì)概率剛好超過閾值p的那一部分詞,其余全部屏蔽,最后在這份候選詞里重新歸一化并采樣。

    設(shè)置值越小,候選詞越少,模型輸出越集中和保守;設(shè)置值越大,候選詞越多,模型輸出越開放和多樣。

    通常情況只建議調(diào)整temperature或top_p,不要同時(shí)修改兩個(gè)參數(shù)。

    取值范圍:0~1,設(shè)置為“1”表示考慮所有Tokens。

    temperature

    0.6

    Float

    模型采樣溫度。設(shè)置的值越高,模型輸出越隨機(jī);設(shè)置的值越低,輸出越確定。

    通常情況只建議調(diào)整temperature或top_p,不要同時(shí)修改兩個(gè)參數(shù)。

    temperature取值建議:DeepSeek-R1、DeepSeek-V3、Qwen3系列建議值為0.6,Qwen2.5-VL系列建議值為0.2。

    stop

    None

    None/Str/List

    用于停止生成的字符串列表。返回的輸出將不包含停止字符串。

    例如,設(shè)置為["你","好"]時(shí),在生成文本過程中,遇到“你”或者“好”將停止文本生成。

    stream

    False

    Bool

    是否開啟流式推理。默認(rèn)為False,表示不開啟流式推理。

    n

    1

    Int

    為每個(gè)輸入的消息生成的響應(yīng)數(shù)。

    • 不使用beam_search場(chǎng)景下,n取值建議為1≤n≤10。如果n>1時(shí),必須確保不使用greedy_sample采樣,也就是top_k > 1,temperature > 0。
    • 使用beam_search場(chǎng)景下,n取值建議為1<n≤10。如果n=1,會(huì)導(dǎo)致推理請(qǐng)求失敗。
    說明:

    n建議取值不超過10,n值過大會(huì)導(dǎo)致性能劣化,顯存不足時(shí),推理請(qǐng)求會(huì)失敗。

    use_beam_search

    False

    Bool

    是否使用beam_search替換采樣。

    使用該參數(shù)時(shí),如下參數(shù)必須按要求設(shè)置。

    • n:大于1
    • top_p:1.0
    • top_k:-1
    • temperature:0.0

    presence_penalty

    0.0

    Float

    presence_penalty表示會(huì)根據(jù)當(dāng)前生成的文本中新出現(xiàn)的詞語進(jìn)行獎(jiǎng)懲。取值范圍[-2.0,2.0]。

    frequency_penalty

    0.0

    Float

    frequency_penalty會(huì)根據(jù)當(dāng)前生成的文本中各個(gè)詞語的出現(xiàn)頻率進(jìn)行獎(jiǎng)懲。取值范圍[-2.0,2.0]。

    length_penalty

    1.0

    Float

    length_penalty表示在beam search過程中,對(duì)于較長(zhǎng)的序列,模型會(huì)給予較大的懲罰。

    使用該參數(shù)時(shí),必須添加如下三個(gè)參數(shù),且必須按要求設(shè)置。

    • top_k:-1
    • use_beam_search:true
    • best_of:大于1
    • 普通requests包、OpenAI SDK、curl命令的返回示例如下所示:
      {
          "id": "cmpl-29f7a172056541449eb1f9d31c*****",
          "object": "chat.completion",
          "created": 17231*****,
          "model": "******",
          "choices": [
              {
                  "index": 0,
                  "message": {
                      "role": "assistant",
                      "content": "你好!很高興能為你提供幫助。有什么問題我可以回答或幫你解決嗎?"
                  },
                  "logprobs": null,
                  "finish_reason": "stop",
                  "stop_reason": null
              }
          ],
          "usage": {
              "prompt_tokens": 20,
              "total_tokens": 38,
              "completion_tokens": 18
          }
      }
    • 思維鏈模型的返回示例如下所示:
      messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]
      response = client.chat.completions.create(model=model, messages=messages)
      reasoning_content = response.choices[0].message.reasoning_content
      content = response.choices[0].message.content
      print("reasoning_content:", reasoning_content)
      print("content:", content)
    表3 返回參數(shù)說明

    參數(shù)

    參數(shù)類型

    描述

    id

    Str

    請(qǐng)求ID。

    object

    Str

    請(qǐng)求任務(wù)。

    created

    Int

    請(qǐng)求生成的時(shí)間戳。

    model

    Str

    調(diào)用的模型名。

    choices

    Array

    模型生成內(nèi)容。

    usage

    Object

    請(qǐng)求輸入長(zhǎng)度、輸出長(zhǎng)度和總長(zhǎng)度。

    • prompt_tokens:輸入Tokens數(shù)。
    • completion_tokens:輸出Tokens數(shù)。
    • total_tokens:總Tokens數(shù)。

    總Tokens數(shù) = 輸入Tokens數(shù) + 輸出Tokens數(shù)

    reasoning_content

    Str

    當(dāng)模型支持思維鏈時(shí),模型的思考內(nèi)容。對(duì)于支持思維鏈的模型,開啟流式輸出時(shí),會(huì)首先在reasoning_content字段輸出思考內(nèi)容,然后在content中輸出回答內(nèi)容。

    content

    Str

    模型的回答內(nèi)容。

    當(dāng)調(diào)用失敗時(shí),可以根據(jù)錯(cuò)誤碼調(diào)整腳本或運(yùn)行環(huán)境。
    表4 常見錯(cuò)誤碼

    錯(cuò)誤碼

    錯(cuò)誤內(nèi)容

    說明

    400

    Bad Request

    請(qǐng)求包含語法錯(cuò)誤。

    403

    Forbidden

    服務(wù)器拒絕執(zhí)行。

    404

    Not Found

    服務(wù)器找不到請(qǐng)求的網(wǎng)頁。

    500

    Internal Server Error

    服務(wù)內(nèi)部錯(cuò)誤。

內(nèi)容審核說明

  • 流式請(qǐng)求
    • 如果觸發(fā)內(nèi)容審核,則會(huì)返回錯(cuò)誤:錯(cuò)誤碼403。您可以通過錯(cuò)誤碼ModelArts.81011來判斷。返回內(nèi)容如下:
      {
          "error_code": "ModelArts.81011",
          "error_msg": "May contain sensitive information, please try again."
      }
      圖1 報(bào)錯(cuò)示例
    • 如果未觸發(fā)內(nèi)容審核,則使用postman調(diào)用返回參考如下,返回碼200。
      圖2 正常返回示例
    • 如果輸出有敏感信息,則會(huì)在輸出流后面拼接如下數(shù)據(jù):
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":"這是流式響應(yīng)的開始。"},"index":0}]
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":" 繼續(xù)輸出結(jié)果。"},"index":0}]
      data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"finish_reason":"content_filter","index":0}]}
      data: [DONE]

      觸發(fā)內(nèi)容審核之后,"finish_reason"是"content_filter";正常的流式停止是 "finish_reason":"stop"。

  • 非流式請(qǐng)求
    • 如果觸發(fā)內(nèi)容審核,則會(huì)返回錯(cuò)誤:錯(cuò)誤碼403。您可以通過錯(cuò)誤碼ModelArts.81011來判斷。

      返回內(nèi)容如下:

      {
          "error_code": "ModelArts.81011",
          "error_msg": "May contain sensitive information, please try again."
      }
      
    • 如果未觸發(fā),則正常返回,示例如下:
      圖3 正常返回示例

接口調(diào)用說明

假設(shè)API地址為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} ,其中{endpoint}僅支持如下接口:

  • /v1/chat/completions
  • /v1/models

注意:

  • /v1/models使用GET方法不需要請(qǐng)求體,而/v1/chat/completions需要POST請(qǐng)求方式和對(duì)應(yīng)的JSON請(qǐng)求體。
  • 通用請(qǐng)求頭為Authorization: Bearer YOUR_API_KEY,對(duì)于POST請(qǐng)求,還需包含Content-Type: application/json。
表5 接口說明

類型/接口

/v1/models

/v1/chat/completions

請(qǐng)求方法

GET

POST

用途

獲取當(dāng)前支持的模型列表。

用于聊天對(duì)話型生成調(diào)用。

請(qǐng)求體說明

無需請(qǐng)求體,僅需通過請(qǐng)求頭傳入認(rèn)證信息。

  • model:使用的模型標(biāo)識(shí),例如 "GLM-4-9B"。
  • messages:對(duì)話消息數(shù)組,每條消息需要包含role(如 "user" 或 "assistant")和content。
  • 其他可選參數(shù):例如temperature(生成溫度)、max_tokens等,用于控制生成結(jié)果的多樣性和長(zhǎng)度。

請(qǐng)求示例

GET https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/models HTTP/1.1
Authorization: Bearer YOUR_API_KEY
POST https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions HTTP/1.1
Content-Type: application/json
Authorization: Bearer YOUR_API_KEY

{
  "model": "******",
  "messages": [
    {"role": "user", "content": "Hello, how are you?"}
  ],
  "temperature": 0.7
}

響應(yīng)示例

{
  "data": [
    {
      "id": "******",
      "description": "最新一代大模型"
    },
    {
      "id": "******",
      "description": "性價(jià)比較高的替代方案"
    }
  ]
}
{
  "id": "******",
  "object": "chat.completion",
  "choices": [
    {
      "index": 0,
      "message": {"role": "assistant", "content": "I'm doing well, thank you! How can I help you today?"}
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 25,
    "total_tokens": 40
  }
}

常見問題

在ModelArts Studio(MaaS) 創(chuàng)建API Key后需要等待多久才能生效?

MaaS API Key在創(chuàng)建后不會(huì)立即生效,通常需要等待幾分鐘才能生效。

免費(fèi)ai文本模型常見問題

更多常見問題 >>
  • 模型轉(zhuǎn)換,即將開源框架的網(wǎng)絡(luò)模型(如Caffe、TensorFlow等),通過ATC(Ascend Tensor Compiler)模型轉(zhuǎn)換工具,將其轉(zhuǎn)換成昇騰AI處理器支持的離線模型。

  • 盤古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與大模型能力相結(jié)合,重塑千行百業(yè),成為各組織、企業(yè)、個(gè)人的專家助手。

  • 華為云云市場(chǎng)云蝠智能為企業(yè)提供包括銷售線索挖掘、語音外呼、電話機(jī)器人、智能質(zhì)檢、企業(yè)微信SCRM在內(nèi)的服務(wù)體系,大量的應(yīng)用于地產(chǎn)、金融、教育等行業(yè),為企業(yè)的客戶聯(lián)絡(luò)降本增效

  • 華為云學(xué)院潛心打造,用心打磨的普惠AI體系化好課——《AI專業(yè)學(xué)習(xí)路徑》,讓你系統(tǒng)get AI 技術(shù)!華為云AI專家,多年豐富經(jīng)驗(yàn),傾囊相授;一站式學(xué)習(xí)體驗(yàn),漸進(jìn)式賦能,由淺入深,綜合提升技能;還配套學(xué)習(xí)群及時(shí)交流群,專家1v1答疑,伴你輕松開啟AI學(xué)習(xí)之旅。普惠AI觸及每個(gè)企業(yè),每個(gè)開發(fā)者,讓智能無所不及!

  • AI一站式開發(fā)平臺(tái)ModelArts橫空出世,零基礎(chǔ)AI開發(fā)人員的福音。學(xué)習(xí)本課程,帶你了解AI模型訓(xùn)練,不會(huì)編程、不會(huì)算法、不會(huì)高數(shù),一樣可以構(gòu)建出自己專屬的AI模型。

  • 近年來越來越多的行業(yè)采用AI技術(shù)提升效率、降低成本,然而AI落地的過程確并不容易,AI在具體與業(yè)務(wù)結(jié)合時(shí)常常依賴于業(yè)務(wù)數(shù)據(jù)的采集、處理、模型訓(xùn)練、調(diào)優(yōu)、編排、部署和運(yùn)維等很多環(huán)節(jié)。華為云ModelArts是全流程AI開發(fā)平臺(tái),包含了AI應(yīng)用的開發(fā)、部署和分享交易,通過解決AI開發(fā)各個(gè)環(huán)節(jié)所遇到的核心問題,ModelArts有效解決了AI落地難的問題,將極大促進(jìn)AI技術(shù)的普惠。本議題將分享ModelArts的主要關(guān)鍵技術(shù)和應(yīng)用案例。

更多相關(guān)專題