豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè) 查看全部 學(xué)習(xí)資源 學(xué)習(xí)資源 AI開發(fā)基本流程介紹 自動(dòng)學(xué)習(xí)簡(jiǎn)介 使用預(yù)置算法構(gòu)建模型 使用自定義算法構(gòu)建模型 查看全部 即刻領(lǐng)取 免費(fèi)試用 產(chǎn)品 開啟您的大模型之旅 企業(yè)免費(fèi)試用 您可能感興趣的產(chǎn)品 您可能感興趣的產(chǎn)品 盤古大模型
文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古預(yù)測(cè)大模型能力與規(guī)格 盤古大模型快速入門 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū) 優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè)
全新上線:大模型防火墻 全新上線:大模型防火墻 全面守護(hù)AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 全面守護(hù)AI應(yīng)用安全,防范提示詞攻擊,確保內(nèi)容合規(guī)與數(shù)據(jù)隱私 免費(fèi)試用大模型防火墻公測(cè)上線,可申請(qǐng)免費(fèi)試用一個(gè)月 申請(qǐng)公測(cè) 了解更多 提示詞攻擊防護(hù) 識(shí)別并攔截惡意提示詞,防止大模型被誘導(dǎo)生成不當(dāng)內(nèi)容。
華為云會(huì)議,更專業(yè)“會(huì)”更好 華為云會(huì)議,更專業(yè)“會(huì)”更好 注冊(cè)免費(fèi)送50方云會(huì)議室,支持最多50人同時(shí)入會(huì) 注冊(cè)免費(fèi)送50方云會(huì)議室,支持最多50人同時(shí)入會(huì) 購(gòu)買咨詢 免費(fèi)體驗(yàn) 產(chǎn)品優(yōu)勢(shì) 高清視頻會(huì)議 4K超高清數(shù)據(jù)共享,1080p高清視頻,首家移動(dòng)端720p,端到端時(shí)延<200ms,高清流暢
華為云會(huì)議,更專業(yè)“會(huì)”更好 注冊(cè)免費(fèi)送50方云會(huì)議室,支持最多50人同時(shí)入會(huì) 免費(fèi)領(lǐng)取 套餐訂購(gòu)咨詢 云會(huì)議 手機(jī)/Windows/macOS多端接入,隨時(shí)隨地入會(huì) 網(wǎng)絡(luò)研討會(huì) 會(huì)議+直播融合體驗(yàn),3000人實(shí)時(shí)在線互動(dòng) 智能會(huì)議室 提供全系列會(huì)議硬件終端,軟硬一體智能會(huì)議體驗(yàn) API&SDK
優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè) 查看全部 學(xué)習(xí)資源 學(xué)習(xí)資源 AI開發(fā)基本流程介紹 自動(dòng)學(xué)習(xí)簡(jiǎn)介 使用預(yù)置算法構(gòu)建模型 使用自定義算法構(gòu)建模型 查看全部 即刻領(lǐng)取 免費(fèi)試用 產(chǎn)品 開啟您的大模型之旅 企業(yè)免費(fèi)試用
內(nèi)全量構(gòu)建的極速構(gòu)建、支持億級(jí)測(cè)試用例資產(chǎn)復(fù)用、千萬(wàn)級(jí)壓測(cè)先進(jìn)能力。 更智能: CodeArts引用大模型AIGC的突破,已實(shí)現(xiàn)代碼智能生成、測(cè)試文本用例智能生成等,后續(xù)CodeArts會(huì)不斷創(chuàng)新探索,將AI技術(shù)貫穿軟件開發(fā)生命周期始終。 更安全: CodeArts致力從運(yùn)行態(tài)的
業(yè)務(wù)套件 分權(quán)分域管理 基礎(chǔ)智能語(yǔ)音助手 審批模型數(shù) 50 個(gè) 限時(shí)免費(fèi),更多權(quán)益 標(biāo)準(zhǔn)版本 基礎(chǔ)版本的一切功能 審批模型數(shù) 100 個(gè) 分支條件數(shù)量 50 個(gè) 發(fā)票識(shí)別 選項(xiàng)關(guān)聯(lián) 電子簽署 立即購(gòu)買 個(gè)性定制,高階服務(wù) 旗艦版本 標(biāo)準(zhǔn)版本的一切功能 審批模型數(shù) 1000 個(gè) 分支條件數(shù)量
開源鏡像開發(fā) ModelBox AI應(yīng)用開發(fā) ModelBox是一套專門為AI開發(fā)者提供的易于使用,高效,高擴(kuò)展的AI推理開發(fā)框架,它可以幫助AI開發(fā)者快速完成從模型文件到AI推理應(yīng)用的開發(fā)和上線工作,降低AI算法落地門檻,同時(shí)帶來(lái)AI應(yīng)用的高穩(wěn)定性和極致性能。 基于ModelBox開源社區(qū)源碼開發(fā)AI應(yīng)用
智慧監(jiān)控AI模型綜合集成了人臉識(shí)別模型、安全帽識(shí)別模型、口罩佩戴識(shí)別模型、車牌識(shí)別模型、車輛占道識(shí)別模型5種AI模型。一,人臉識(shí)別服務(wù) 人臉識(shí)別模型目前提供授權(quán)認(rèn)證、模型加載、人臉注冊(cè)、人臉識(shí)別、人臉刪除、特征提取六個(gè)接口服務(wù)。 授權(quán)認(rèn)證:需先進(jìn)行授權(quán)認(rèn)證,才能夠正常使用人臉識(shí)別服務(wù);
《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》明確,具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)在提供服務(wù)之日起十個(gè)工作日內(nèi)通過(guò)互聯(lián)網(wǎng)信息服務(wù)算法備案系統(tǒng)填報(bào)服務(wù)提供者的名稱、服務(wù)形式、應(yīng)用領(lǐng)域、算法類型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息 方便
湘江鯤鵬目前在人工智能大模型領(lǐng)域擁有算力、數(shù)據(jù)、算法三大關(guān)鍵要素的經(jīng)驗(yàn)積累,構(gòu)建了大模型三個(gè)方面的差異化競(jìng)爭(zhēng)力,盤古大模型AI專業(yè)服務(wù)覆蓋從前期咨詢、規(guī)劃設(shè)計(jì),到數(shù)據(jù)工程、模型訓(xùn)練,再到應(yīng)用工程及模型運(yùn)維的完整流程。基于華為盤古提供的AI專業(yè)服務(wù)包,致力于為企業(yè)提供一站式人工智能解決方案
云塢網(wǎng)絡(luò)專注于利用先進(jìn)的AI云計(jì)算、大數(shù)據(jù)和人工智能技術(shù),為企業(yè)提供卓越的ChatGPT行業(yè)解決方案。幫助企業(yè)快速實(shí)現(xiàn)數(shù)字化、智能化和綠色化轉(zhuǎn)型。 系統(tǒng)定制開發(fā):我們可以為客戶提供系統(tǒng)的定制開發(fā)服務(wù),幫助客戶實(shí)現(xiàn)更多的個(gè)性化功能和業(yè)務(wù)流程需求。,數(shù)據(jù)遷移:我們幫助客戶將現(xiàn)有系統(tǒng)的
angChain等流行的大模型開發(fā)框架,構(gòu)建企業(yè)級(jí)AI應(yīng)用;團(tuán)隊(duì)擁有成熟的軟件工程技術(shù)和管理能力。6. 大模型使用的技術(shù)支持,用戶使用大模型平臺(tái),解答用戶使用過(guò)程遇到的問(wèn)題;大模型與應(yīng)用對(duì)接集成,以及進(jìn)行日常巡檢、故障處理、模型升級(jí)等服務(wù)。4. 工業(yè)數(shù)據(jù)模型(CAD模型、CAE模
太杉天尊大模型AIGC場(chǎng)景解決方案是以AI場(chǎng)景解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。具備自研的行業(yè)模型能力,主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。太杉天尊大模型AIGC場(chǎng)景解決方案,是一款專為滿足政府企
公司集成了世界領(lǐng)先的底層大模型,具備打通跨模型和工具鏈的平臺(tái),提供從需求分析、數(shù)據(jù)收集、模型設(shè)計(jì)、訓(xùn)練優(yōu)化、評(píng)估、系統(tǒng)集成、用戶界面設(shè)計(jì)、部署維護(hù)、合規(guī)性檢查、技術(shù)支持、性能監(jiān)控、擴(kuò)展性設(shè)計(jì)、定制服務(wù)到持續(xù)研發(fā)一站式AI大模型定制研發(fā)服務(wù)。光啟慧語(yǔ)是一家圍繞大模型全棧開展技術(shù)研發(fā)和產(chǎn)品
數(shù)據(jù)質(zhì)量。4. 模型訓(xùn)練:?設(shè)計(jì)調(diào)優(yōu)方案,實(shí)施模型訓(xùn)練,并進(jìn)行模型評(píng)測(cè)。?熟悉盤古大模型工作流和云服務(wù)操作,確保模型效果優(yōu)化。5. 應(yīng)用工程:?提供基于大模型能力的Agent開發(fā)和應(yīng)用對(duì)接服務(wù)。?具備良好的軟件開發(fā)和溝通能力,實(shí)現(xiàn)大模型與應(yīng)用的無(wú)縫對(duì)接。6. 模型運(yùn)維: ?提供技
天尊大模型AIGC場(chǎng)景解決方案配套服務(wù)是太杉AIGC解決方案的人工服務(wù),是以AI應(yīng)用解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。天尊大模型AIGC場(chǎng)景解決方案配套服務(wù)是太
了解詳情 盤古預(yù)測(cè)大模型 盤古預(yù)測(cè)大模型是面向結(jié)構(gòu)化類數(shù)據(jù),基于10類2000個(gè)基模型空間,通過(guò)模型推薦、融合兩步優(yōu)化策略,構(gòu)建圖網(wǎng)絡(luò)架構(gòu)AI模型。 了解詳情 盤古科學(xué)計(jì)算大模型 科學(xué)計(jì)算大模型是面向氣象、醫(yī)藥、水務(wù)、機(jī)械、航天航空等領(lǐng)域,采用AI數(shù)據(jù)建模和AI方程求解的方法;從海
3,000.00元/年 免費(fèi)AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機(jī)器特征 免費(fèi)AI客服電話-智能AI客戶聯(lián)絡(luò)中心-AI智能電話機(jī)器特征 免費(fèi)AI客服電話-內(nèi)置ASR引擎 支持ASR,NLP,NLU,TTS等技術(shù)數(shù)據(jù)整合識(shí)別、響應(yīng)飛速提升 免費(fèi)AI客服電話-多輪會(huì)話 領(lǐng)先
ModelArts支持本地準(zhǔn)備模型包,編寫模型配置文件和模型推理代碼,將準(zhǔn)備好的模型包上傳至對(duì)象存儲(chǔ)服務(wù)OBS,從OBS導(dǎo)入模型創(chuàng)建為AI應(yīng)用。 制作模型包,則需要符合一定的模型包規(guī)范。模型包里面必需包含“model”文件夾,“model”文件夾下面放置模型文件,模型配置文件,模型推理代碼文件。
ModelArts模型訓(xùn)練 ModelArts模型訓(xùn)練簡(jiǎn)介 ModelArts模型訓(xùn)練,俗稱“建模”,指通過(guò)分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個(gè)或多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測(cè)、評(píng)價(jià)等結(jié)果。
選擇企業(yè)郵箱。 企業(yè)郵箱購(gòu)買計(jì)費(fèi) 華為云有免費(fèi)企業(yè)郵箱嗎 您可以多關(guān)注和華為云企業(yè)郵箱相關(guān)的活動(dòng),當(dāng)前可以免費(fèi)試用15天,在15天內(nèi)相當(dāng)于免費(fèi)企業(yè)郵箱。 注冊(cè)企業(yè)郵箱收費(fèi)嗎 注冊(cè)企業(yè)郵箱一般是需要收費(fèi)的,但各個(gè)廠商有活動(dòng)時(shí),可能有可以免費(fèi)試用的活動(dòng)。您可以關(guān)注華為云的企業(yè)郵箱活動(dòng)。
華為數(shù)據(jù)庫(kù)GaussDB_GaussDB數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)_【免費(fèi)】_GaussDB分布式數(shù)據(jù)庫(kù)_數(shù)據(jù)庫(kù)平臺(tái) 關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)_數(shù)據(jù)庫(kù)管理系統(tǒng)、數(shù)據(jù)庫(kù)應(yīng)用 數(shù)據(jù)庫(kù)軟件免費(fèi)版 云數(shù)據(jù)庫(kù)免費(fèi)_云數(shù)據(jù)庫(kù)免費(fèi)試用 免費(fèi)數(shù)據(jù)庫(kù)GaussDB NoSQL_云數(shù)據(jù)庫(kù)_數(shù)據(jù)庫(kù)免費(fèi)嗎 免費(fèi)云數(shù)據(jù)庫(kù) MySQL數(shù)據(jù)庫(kù)入門 云數(shù)據(jù)庫(kù)和普通數(shù)據(jù)庫(kù)
域名1元起,免費(fèi)云解析 郵箱免費(fèi)試用 0元體驗(yàn)旗艦版的產(chǎn)品 企業(yè)郵箱購(gòu)買計(jì)費(fèi) 華為云企業(yè)郵箱有折扣活動(dòng)嗎 您可以多關(guān)注和華為云企業(yè)郵箱相關(guān)的活動(dòng),當(dāng)前華為云企業(yè)郵箱可以享受最低5折優(yōu)惠。 注冊(cè)企業(yè)郵箱收費(fèi)嗎 注冊(cè)企業(yè)郵箱一般是需要收費(fèi)的,但各個(gè)廠商有活動(dòng)時(shí),可能有可以免費(fèi)試用的活動(dòng)。您可以關(guān)注華為云的企業(yè)郵箱活動(dòng)。
.email域名注冊(cè) 什么是.email域名注冊(cè)? 域名注冊(cè)(Domain Registration)是用戶付費(fèi)獲取Internet上某一域名一段時(shí)間使用權(quán)的過(guò)程。華為云域名注冊(cè)服務(wù)提供域名的注冊(cè)、購(gòu)買、實(shí)名認(rèn)證以及管理功能。 華為云的域名注冊(cè)服務(wù)與新網(wǎng)合作,因此通過(guò)華為云注冊(cè)的
這些DeepSeek模型在多項(xiàng)能力上與OpenAI的o1-mini相當(dāng),為開發(fā)者提供了強(qiáng)大的AI能力。 在MaaS平臺(tái)上,DeepSeek-R1蒸餾模型已經(jīng)部署上線,開發(fā)者可以通過(guò)在線體驗(yàn)或API調(diào)用來(lái)使用這些模型。為了幫助開發(fā)者快速驗(yàn)證和開發(fā)創(chuàng)新的AI應(yīng)用,平臺(tái)還提供了200
免費(fèi)ai模型
在 ModelArts Studio大模型即服務(wù)平臺(tái)部署成功的模型服務(wù)支持在其他業(yè)務(wù)環(huán)境中調(diào)用。本文以我的服務(wù)為例,調(diào)用部署的模型服務(wù)。您也可以調(diào)用預(yù)置服務(wù)-免費(fèi)服務(wù)、預(yù)置服務(wù)-商用服務(wù)或自定義接入點(diǎn)。
操作場(chǎng)景
在企業(yè)AI應(yīng)用開發(fā)過(guò)程中,開發(fā)人員通常需要將訓(xùn)練好的模型部署到實(shí)際業(yè)務(wù)環(huán)境中。然而,傳統(tǒng)方法需要手動(dòng)配置環(huán)境、處理依賴關(guān)系、編寫部署腳本,整個(gè)過(guò)程耗時(shí)且容易出錯(cuò),且存在環(huán)境復(fù)雜、遷移困難、維護(hù)成本高、版本更新麻煩等問(wèn)題。
ModelArts Studio(MaaS)大模型即服務(wù)平臺(tái)提供了一站式解決方案,提供統(tǒng)一的API接口方便業(yè)務(wù)系統(tǒng)調(diào)用,并提供監(jiān)控和日志功能便于運(yùn)維管理。
計(jì)費(fèi)說(shuō)明
在調(diào)用模型推理服務(wù)的過(guò)程中,輸入內(nèi)容首先會(huì)被分詞(tokenize),轉(zhuǎn)換為模型可識(shí)別的Token。在調(diào)用MaaS預(yù)置服務(wù)時(shí),將根據(jù)實(shí)際使用的Tokens數(shù)量進(jìn)行計(jì)費(fèi)。計(jì)費(fèi)詳情請(qǐng)參見計(jì)費(fèi)說(shuō)明。
約束限制
對(duì)于支持圖片上傳的模型,單個(gè)圖片文件的大小不超過(guò)10MB。如果以Base64編碼形式上傳圖片,需確保編碼后的圖片小于10MB。
前提條件
- 使用預(yù)置服務(wù):在“在線推理”頁(yè)面的“預(yù)置服務(wù)”頁(yè)簽,使用有效期內(nèi)的免費(fèi)服務(wù)或者已開通商用服務(wù)(付費(fèi)狀態(tài)為“開通”)。具體操作,請(qǐng)參見ModelArts Studio(MaaS)在線推理服務(wù)。
- 使用我的服務(wù):在“在線推理”頁(yè)面的“我的服務(wù)”頁(yè)簽,服務(wù)列表存在運(yùn)行中、更新中或升級(jí)中的模型服務(wù)。具體操作,請(qǐng)參見使用ModelArts Studio(MaaS)部署模型服務(wù)。
- 使用自定義接入點(diǎn):已創(chuàng)建自定義接入點(diǎn)。具體操作,請(qǐng)參見在ModelArts Studio(MaaS)創(chuàng)建自定義接入點(diǎn)。
步驟一:獲取API Key
在調(diào)用MaaS部署的模型服務(wù)時(shí),需要填寫API Key用于接口的鑒權(quán)認(rèn)證。最多可創(chuàng)建30個(gè)密鑰。每個(gè)密鑰僅在創(chuàng)建時(shí)顯示一次,請(qǐng)確保妥善保存。如果密鑰丟失,無(wú)法找回,需要重新創(chuàng)建API Key以獲取新的訪問(wèn)密鑰。更多信息,請(qǐng)參見在ModelArts Studio(MaaS)管理API Key。
- 登錄ModelArts Studio(MaaS)控制臺(tái),在頂部導(dǎo)航欄選擇目標(biāo)區(qū)域。
- 在左側(cè)導(dǎo)航欄,單擊“API Key管理”。
- 在“API Key管理”頁(yè)面,單擊“創(chuàng)建API Key”,填寫標(biāo)簽和描述信息后,單擊“確定”。
標(biāo)簽和描述信息在創(chuàng)建完成后,不支持修改。
表1 創(chuàng)建API Key參數(shù)說(shuō)明 參數(shù)
說(shuō)明
標(biāo)簽
自定義API Key的標(biāo)簽。標(biāo)簽具有唯一性,不可重復(fù)。僅支持大小寫英文字母、數(shù)字、下劃線、中劃線,長(zhǎng)度范圍為1~100個(gè)字符。
描述
自定義API Key的描述,長(zhǎng)度范圍為1~100個(gè)字符。
- 在“您的密鑰”對(duì)話框,復(fù)制密鑰并保存至安全位置。
- 保存完畢后,單擊“關(guān)閉”。
單擊“關(guān)閉”后將無(wú)法再次查看密鑰。
步驟二:調(diào)用MaaS模型服務(wù)進(jìn)行預(yù)測(cè)
- 在ModelArts Studio(MaaS)控制臺(tái)左側(cè)導(dǎo)航欄,選擇“在線推理”。
- 在“在線推理”頁(yè)面,單擊“我的服務(wù)”頁(yè)簽,在目標(biāo)服務(wù)右側(cè),單擊操作列的“更多 > 調(diào)用說(shuō)明”。
- 在“關(guān)閉 內(nèi)容審核 服務(wù)”對(duì)話框,選擇是否啟用內(nèi)容審核(默認(rèn)啟用)。
- 在“調(diào)用說(shuō)明”頁(yè)面,選擇接口類型,復(fù)制調(diào)用示例,修改接口信息和API Key后用于業(yè)務(wù)環(huán)境調(diào)用模型服務(wù)API。
Rest API、OpenAI SDK的示例代碼如下。
- Rest API示例代碼如下所示:
- 使用Python調(diào)用示例。
import requests import json if __name__ == '__main__': url = "https:/example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions" api_key = "<your_apiKey>" # 把<your_apiKey>替換成已獲取的API Key。 # Send request. headers = { 'Content-Type': 'application/json', 'Authorization': f'Bearer {api_key}' } data = { "model": "******", # 調(diào)用時(shí)的模型名稱。 "max_tokens": 1024, # 最大輸出token數(shù)。 "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "hello"} ], # 是否開啟流式推理,默認(rèn)為False,表示不開啟流式推理。 "stream": False, # 在流式輸出時(shí)是否展示使用的token數(shù)目。只有當(dāng)stream為True時(shí)該參數(shù)才會(huì)生效。 # "stream_options": {"include_usage": True}, # 控制采樣隨機(jī)性的浮點(diǎn)數(shù),值較低時(shí)模型更具確定性,值較高時(shí)模型更具創(chuàng)造性。"0"表示貪婪取樣。默認(rèn)為0.6。 "temperature": 0.6 } response = requests.post(url, headers=headers, data=json.dumps(data), verify=False) # Print result. print(response.status_code) print(response.text) - 使用cURL調(diào)用示例。
curl -X POST "https://example.com/v1/chat/completions" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $API_KEY" \ -d '{ "model": "DeepSeek-R1", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你好"} ], "stream": true, "stream_options": { "include_usage": true }, "temperature": 0.6 }'
- 使用Python調(diào)用示例。
- 使用OpenAI SDK調(diào)用示例。
# 安裝環(huán)境命令。 pip install --upgrade "openai>=1.0"
# OpenAI SDK調(diào)用示例。 from openai import OpenAI if __name__ == '__main__': base_url = "https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06******/v1" api_key = "<your_apiKey>" # 把<your_apiKey>替換成已獲取的API Key。 client = OpenAI(api_key=api_key, base_url=base_url) response = client.chat.completions.create( model="******", messages=[ {"role": "system", "content": "You are a helpful assistant"}, {"role": "user", "content": "Hello"}, ], max_tokens=1024, temperature=0.6, stream=False ) # Print result. print(response.choices[0].message.content)
模型服務(wù)的API與vLLM相同,表2僅介紹關(guān)鍵參數(shù),詳細(xì)參數(shù)解釋請(qǐng)參見vLLM官網(wǎng)。使用昇騰云909鏡像的模型,開啟流式輸出時(shí),需要新增stream_options參數(shù),值為{"include_usage":true},才會(huì)打印token數(shù)。
表2 請(qǐng)求參數(shù)說(shuō)明 參數(shù)
是否必選
默認(rèn)值
參數(shù)類型
描述
url
是
無(wú)
Str
調(diào)用時(shí)的API地址。假設(shè)URL為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} , 其中{endpoint}僅支持如下接口,詳細(xì)介紹請(qǐng)參見接口調(diào)用說(shuō)明。
- /v1/chat/completions
- /v1/models
model
是
無(wú)
Str
調(diào)用時(shí)的模型名稱。
在ModelArts Studio大模型即服務(wù)平臺(tái)的“在線推理”頁(yè)面,選擇調(diào)用的模型服務(wù),單擊操作列的“更多 > 調(diào)用”,在調(diào)用頁(yè)面可以獲取“模型名稱”。
messages
是
-
Array
請(qǐng)求輸入的問(wèn)題。
messages.role
是
無(wú)
Str
不同的role對(duì)應(yīng)不同的消息類型。
- system:開發(fā)人員輸入的指令,例如模型應(yīng)遵循的答復(fù)格式、扮演的角色等。
- user:用戶輸入的消息,包括提示詞和上下文信息。
- assistant:模型生成的回復(fù)內(nèi)容。
- tool:模型調(diào)用工具返回的信息。
messages.content
是
無(wú)
Str
- 當(dāng)role為system時(shí):給AI模型設(shè)定的人設(shè)。
{"role": "system","content": "你是一個(gè)樂(lè)于助人的AI助手"} - 當(dāng)role為user時(shí):用戶輸入的問(wèn)題。
{"role": "user","content": "9.11和9.8哪個(gè)大?"} - 當(dāng)role為assistant時(shí):AI模型輸出的答復(fù)內(nèi)容。
{"role": "assistant","content": "9.11大于9.8"} - 當(dāng)role為tool時(shí):AI模型調(diào)用的工具響應(yīng)信息。
{"role": "tool", "content": "上海今天天氣晴,氣溫10度"}
stream_options
否
無(wú)
Object
該參數(shù)用于配置在流式輸出時(shí)是否展示使用的token數(shù)目。只有當(dāng)stream為True的時(shí)候該參數(shù)才會(huì)激活生效。如果您需要統(tǒng)計(jì)流式輸出模式下的token數(shù)目,可將該參數(shù)配置為stream_options={"include_usage":True}。
max_tokens
否
16
Int
當(dāng)前任務(wù)允許的生成Token數(shù)上限,包括模型輸出的Tokens和深度思考的Reasoning Tokens。
top_k
否
-1
Int
在生成過(guò)程中,候選集大小限定了采樣的范圍。以取值50為例,這意味著每一步僅會(huì)考慮得分排在前50位的Token構(gòu)成候選集進(jìn)行隨機(jī)抽樣。增大此值將提高輸出的隨機(jī)性,減小此值會(huì)增強(qiáng)輸出的確定性。
top_p
否
1.0
Float
模型核采樣(nucleus sampling)。僅保留累計(jì)概率剛好超過(guò)閾值p的那一部分詞,其余全部屏蔽,最后在這份候選詞里重新歸一化并采樣。
設(shè)置值越小,候選詞越少,模型輸出越集中和保守;設(shè)置值越大,候選詞越多,模型輸出越開放和多樣。
通常情況只建議調(diào)整temperature或top_p,不要同時(shí)修改兩個(gè)參數(shù)。
取值范圍:0~1,設(shè)置為“1”表示考慮所有Tokens。
temperature
否
0.6
Float
模型采樣溫度。設(shè)置的值越高,模型輸出越隨機(jī);設(shè)置的值越低,輸出越確定。
通常情況只建議調(diào)整temperature或top_p,不要同時(shí)修改兩個(gè)參數(shù)。
temperature取值建議:DeepSeek-R1、DeepSeek-V3、Qwen3系列建議值為0.6,Qwen2.5-VL系列建議值為0.2。
stop
否
None
None/Str/List
用于停止生成的字符串列表。返回的輸出將不包含停止字符串。
例如,設(shè)置為["你","好"]時(shí),在生成文本過(guò)程中,遇到“你”或者“好”將停止文本生成。
stream
否
False
Bool
是否開啟流式推理。默認(rèn)為False,表示不開啟流式推理。
n
否
1
Int
為每個(gè)輸入的消息生成的響應(yīng)數(shù)。
- 不使用beam_search場(chǎng)景下,n取值建議為1≤n≤10。如果n>1時(shí),必須確保不使用greedy_sample采樣,也就是top_k > 1,temperature > 0。
- 使用beam_search場(chǎng)景下,n取值建議為1<n≤10。如果n=1,會(huì)導(dǎo)致推理請(qǐng)求失敗。
說(shuō)明:n建議取值不超過(guò)10,n值過(guò)大會(huì)導(dǎo)致性能劣化,顯存不足時(shí),推理請(qǐng)求會(huì)失敗。
use_beam_search
否
False
Bool
是否使用beam_search替換采樣。
使用該參數(shù)時(shí),如下參數(shù)必須按要求設(shè)置。
- n:大于1
- top_p:1.0
- top_k:-1
- temperature:0.0
presence_penalty
否
0.0
Float
presence_penalty表示會(huì)根據(jù)當(dāng)前生成的文本中新出現(xiàn)的詞語(yǔ)進(jìn)行獎(jiǎng)懲。取值范圍[-2.0,2.0]。
frequency_penalty
否
0.0
Float
frequency_penalty會(huì)根據(jù)當(dāng)前生成的文本中各個(gè)詞語(yǔ)的出現(xiàn)頻率進(jìn)行獎(jiǎng)懲。取值范圍[-2.0,2.0]。
length_penalty
否
1.0
Float
length_penalty表示在beam search過(guò)程中,對(duì)于較長(zhǎng)的序列,模型會(huì)給予較大的懲罰。
使用該參數(shù)時(shí),必須添加如下三個(gè)參數(shù),且必須按要求設(shè)置。
- top_k:-1
- use_beam_search:true
- best_of:大于1
- 普通requests包、OpenAI SDK、curl命令的返回示例如下所示:
{ "id": "cmpl-29f7a172056541449eb1f9d31c*****", "object": "chat.completion", "created": 17231*****, "model": "******", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "你好!很高興能為你提供幫助。有什么問(wèn)題我可以回答或幫你解決嗎?" }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 20, "total_tokens": 38, "completion_tokens": 18 } } - 思維鏈模型的返回示例如下所示:
messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}] response = client.chat.completions.create(model=model, messages=messages) reasoning_content = response.choices[0].message.reasoning_content content = response.choices[0].message.content print("reasoning_content:", reasoning_content) print("content:", content)
表3 返回參數(shù)說(shuō)明 參數(shù)
參數(shù)類型
描述
id
Str
請(qǐng)求ID。
object
Str
請(qǐng)求任務(wù)。
created
Int
請(qǐng)求生成的時(shí)間戳。
model
Str
調(diào)用的模型名。
choices
Array
模型生成內(nèi)容。
usage
Object
請(qǐng)求輸入長(zhǎng)度、輸出長(zhǎng)度和總長(zhǎng)度。
- prompt_tokens:輸入Tokens數(shù)。
- completion_tokens:輸出Tokens數(shù)。
- total_tokens:總Tokens數(shù)。
總Tokens數(shù) = 輸入Tokens數(shù) + 輸出Tokens數(shù)
reasoning_content
Str
當(dāng)模型支持思維鏈時(shí),模型的思考內(nèi)容。對(duì)于支持思維鏈的模型,開啟流式輸出時(shí),會(huì)首先在reasoning_content字段輸出思考內(nèi)容,然后在content中輸出回答內(nèi)容。
content
Str
模型的回答內(nèi)容。
當(dāng)調(diào)用失敗時(shí),可以根據(jù)錯(cuò)誤碼調(diào)整腳本或運(yùn)行環(huán)境。表4 常見錯(cuò)誤碼 錯(cuò)誤碼
錯(cuò)誤內(nèi)容
說(shuō)明
400
Bad Request
請(qǐng)求包含語(yǔ)法錯(cuò)誤。
403
Forbidden
服務(wù)器拒絕執(zhí)行。
404
Not Found
服務(wù)器找不到請(qǐng)求的網(wǎng)頁(yè)。
500
Internal Server Error
服務(wù)內(nèi)部錯(cuò)誤。
- Rest API示例代碼如下所示:
內(nèi)容審核說(shuō)明
- 流式請(qǐng)求
- 如果觸發(fā)內(nèi)容審核,則會(huì)返回錯(cuò)誤:錯(cuò)誤碼403。您可以通過(guò)錯(cuò)誤碼ModelArts.81011來(lái)判斷。返回內(nèi)容如下:
{ "error_code": "ModelArts.81011", "error_msg": "May contain sensitive information, please try again." }圖1 報(bào)錯(cuò)示例
- 如果未觸發(fā)內(nèi)容審核,則使用postman調(diào)用返回參考如下,返回碼200。
圖2 正常返回示例
- 如果輸出有敏感信息,則會(huì)在輸出流后面拼接如下數(shù)據(jù):
data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":"這是流式響應(yīng)的開始。"},"index":0}] data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"delta":{"content":" 繼續(xù)輸出結(jié)果。"},"index":0}] data: {"id":"chatcmpl-*********************","object":"chat.completion","created":1678067605,"model":"******","choices":[{"finish_reason":"content_filter","index":0}]} data: [DONE]觸發(fā)內(nèi)容審核之后,"finish_reason"是"content_filter";正常的流式停止是 "finish_reason":"stop"。
- 如果觸發(fā)內(nèi)容審核,則會(huì)返回錯(cuò)誤:錯(cuò)誤碼403。您可以通過(guò)錯(cuò)誤碼ModelArts.81011來(lái)判斷。返回內(nèi)容如下:
- 非流式請(qǐng)求
接口調(diào)用說(shuō)明
假設(shè)API地址為https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/{endpoint} ,其中{endpoint}僅支持如下接口:
- /v1/chat/completions
- /v1/models
注意:
- /v1/models使用GET方法不需要請(qǐng)求體,而/v1/chat/completions需要POST請(qǐng)求方式和對(duì)應(yīng)的JSON請(qǐng)求體。
- 通用請(qǐng)求頭為Authorization: Bearer YOUR_API_KEY,對(duì)于POST請(qǐng)求,還需包含Content-Type: application/json。
|
類型/接口 |
/v1/models |
/v1/chat/completions |
|---|---|---|
|
請(qǐng)求方法 |
GET |
POST |
|
用途 |
獲取當(dāng)前支持的模型列表。 |
用于聊天對(duì)話型生成調(diào)用。 |
|
請(qǐng)求體說(shuō)明 |
無(wú)需請(qǐng)求體,僅需通過(guò)請(qǐng)求頭傳入認(rèn)證信息。 |
|
|
請(qǐng)求示例 |
GET https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/models HTTP/1.1 Authorization: Bearer YOUR_API_KEY |
POST https://example.com/v1/infers/937cabe5-d673-47f1-9e7c-2b4de06*****/v1/chat/completions HTTP/1.1
Content-Type: application/json
Authorization: Bearer YOUR_API_KEY
{
"model": "******",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
],
"temperature": 0.7
} |
|
響應(yīng)示例 |
{
"data": [
{
"id": "******",
"description": "最新一代大模型"
},
{
"id": "******",
"description": "性價(jià)比較高的替代方案"
}
]
} |
{
"id": "******",
"object": "chat.completion",
"choices": [
{
"index": 0,
"message": {"role": "assistant", "content": "I'm doing well, thank you! How can I help you today?"}
}
],
"usage": {
"prompt_tokens": 15,
"completion_tokens": 25,
"total_tokens": 40
}
} |
常見問(wèn)題
在ModelArts Studio(MaaS) 創(chuàng)建API Key后需要等待多久才能生效?
MaaS API Key在創(chuàng)建后不會(huì)立即生效,通常需要等待幾分鐘才能生效。
免費(fèi)ai模型常見問(wèn)題
更多常見問(wèn)題 >>-
模型轉(zhuǎn)換,即將開源框架的網(wǎng)絡(luò)模型(如Caffe、TensorFlow等),通過(guò)ATC(Ascend Tensor Compiler)模型轉(zhuǎn)換工具,將其轉(zhuǎn)換成昇騰AI處理器支持的離線模型。
-
盤古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與大模型能力相結(jié)合,重塑千行百業(yè),成為各組織、企業(yè)、個(gè)人的專家助手。
-
華為云云市場(chǎng)云蝠智能為企業(yè)提供包括銷售線索挖掘、語(yǔ)音外呼、電話機(jī)器人、智能質(zhì)檢、企業(yè)微信SCRM在內(nèi)的服務(wù)體系,大量的應(yīng)用于地產(chǎn)、金融、教育等行業(yè),為企業(yè)的客戶聯(lián)絡(luò)降本增效
-
華為云學(xué)院潛心打造,用心打磨的普惠AI體系化好課——《AI專業(yè)學(xué)習(xí)路徑》,讓你系統(tǒng)get AI 技術(shù)!華為云AI專家,多年豐富經(jīng)驗(yàn),傾囊相授;一站式學(xué)習(xí)體驗(yàn),漸進(jìn)式賦能,由淺入深,綜合提升技能;還配套學(xué)習(xí)群及時(shí)交流群,專家1v1答疑,伴你輕松開啟AI學(xué)習(xí)之旅。普惠AI觸及每個(gè)企業(yè),每個(gè)開發(fā)者,讓智能無(wú)所不及!
-
近年來(lái)越來(lái)越多的行業(yè)采用AI技術(shù)提升效率、降低成本,然而AI落地的過(guò)程確并不容易,AI在具體與業(yè)務(wù)結(jié)合時(shí)常常依賴于業(yè)務(wù)數(shù)據(jù)的采集、處理、模型訓(xùn)練、調(diào)優(yōu)、編排、部署和運(yùn)維等很多環(huán)節(jié)。華為云ModelArts是全流程AI開發(fā)平臺(tái),包含了AI應(yīng)用的開發(fā)、部署和分享交易,通過(guò)解決AI開發(fā)各個(gè)環(huán)節(jié)所遇到的核心問(wèn)題,ModelArts有效解決了AI落地難的問(wèn)題,將極大促進(jìn)AI技術(shù)的普惠。本議題將分享ModelArts的主要關(guān)鍵技術(shù)和應(yīng)用案例。
-
ModelArts是一個(gè)一站式的開發(fā)平臺(tái),能夠支撐開發(fā)者從數(shù)據(jù)到AI應(yīng)用的全流程開發(fā)過(guò)程。包含數(shù)據(jù)處理、模型訓(xùn)練、模型管理、模型部署等操作,并且提供AI Gallery功能,能夠在市場(chǎng)內(nèi)與其他開發(fā)者分享模型。
免費(fèi)ai模型教程視頻
最佳實(shí)踐視頻幫助您快速了解搭建流程 了解更多
-
NAIE模型訓(xùn)練服務(wù)演示
以數(shù)據(jù)中心PUE優(yōu)化為例進(jìn)行模型訓(xùn)練服務(wù)和數(shù)據(jù)中心PUE優(yōu)化模型生成服務(wù)操作演示,使開發(fā)者快速熟悉NAIE模型訓(xùn)練服務(wù)和數(shù)據(jù)中心PUE優(yōu)化模型生成服務(wù)。 -
數(shù)據(jù)中心AI模型開發(fā)
使用電信領(lǐng)域一站式模型開發(fā)服務(wù),從數(shù)據(jù)預(yù)處理,到特征提取、模型訓(xùn)練、模型驗(yàn)證,本服務(wù)為開發(fā)者提供開發(fā)環(huán)境、模擬驗(yàn)證環(huán)境,API和一系列開發(fā)工具,幫助開發(fā)者快速高效開發(fā)電信領(lǐng)域模型。 -
3.1 電信AI模型訓(xùn)練平臺(tái)簡(jiǎn)介
精選視頻內(nèi)容,邀您觀看
更多相關(guān)專題
- 熱門產(chǎn)品
- 大模型即服務(wù)平臺(tái) MaaS
- Flexus云服務(wù)
- 云服務(wù)器
- 盤古大模型
- SSL證書
- 華為云WeLink
- 實(shí)用工具
- 文字識(shí)別
- 漏洞掃描
- 華為云會(huì)議
- 云服務(wù)健康看板
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:B1.B2-20200593 | 域名注冊(cè)服務(wù)機(jī)構(gòu)許可:黔D3-20230001 | 代理域名注冊(cè)服務(wù)機(jī)構(gòu):新網(wǎng)、西數(shù)
