推理部署

AI模型開發(fā)完成后，在ModelArts服務(wù)中可以將AI模型創(chuàng)建為AI應(yīng)用，將AI應(yīng)用快速部署為推理服務(wù)，您可以通過調(diào)用API的方式把AI推理能力集成到自己的IT平臺(tái)。

1、開發(fā)模型：模型開發(fā)可以在ModelArts服務(wù)中進(jìn)行，也可以在您的本地開發(fā)環(huán)境進(jìn)行，本地開發(fā)的模型需要上傳到華為云OBS服務(wù)。制作模型包可參見模型包規(guī)范介紹。

2、創(chuàng)建AI應(yīng)用：把模型文件和推理文件導(dǎo)入到ModelArts的模型倉庫中，進(jìn)行版本化管理，并構(gòu)建為可運(yùn)行的AI應(yīng)用。

3、部署服務(wù)：把AI應(yīng)用在資源池中部署為容器實(shí)例，注冊(cè)外部可訪問的推理API。

4、推理：在您的應(yīng)用中增加對(duì)推理API的調(diào)用，在業(yè)務(wù)流程中集成AI推理能力。

創(chuàng)建AI應(yīng)用

創(chuàng)建AI應(yīng)用的幾種場(chǎng)景

ModelArts AI應(yīng)用支持如下幾種場(chǎng)景的導(dǎo)入方式：

從訓(xùn)練中選擇：在ModelArts中創(chuàng)建訓(xùn)練作業(yè)，并完成模型訓(xùn)練，在得到滿意的模型后，可以將訓(xùn)練后得到的模型創(chuàng)建為AI應(yīng)用，用于部署服務(wù)。獲取數(shù)據(jù)的問題。
從OBS中選擇：如果您使用常用框架在本地完成模型開發(fā)和訓(xùn)練，可以將本地的模型按照模型包規(guī)范上傳至OBS桶中，從OBS將模型導(dǎo)入至ModelArts中，創(chuàng)建為AI應(yīng)用，直接用于部署服務(wù)。
從容器鏡像中選擇：針對(duì)ModelArts目前不支持的AI引擎，可以通過自定義鏡像的方式將編寫的模型鏡像導(dǎo)入ModelArts，創(chuàng)建為AI應(yīng)用，用于部署服務(wù)。
從模板中選擇：相同功能的模型配置信息重復(fù)率高，將相同功能的配置整合成一個(gè)通用的模板，通過使用該模板，可以方便快捷的導(dǎo)入模型，創(chuàng)建為AI應(yīng)用，而不用編寫config.json配置文件。

四種來源的區(qū)別

從訓(xùn)練中選擇元模型

如果您在ModelArts中創(chuàng)建訓(xùn)練作業(yè)，并完成模型訓(xùn)練。在得到滿意的模型后，可以將訓(xùn)練后得到的模型創(chuàng)建為AI應(yīng)用，用于部署上線。

從OBS中選擇元模型

如果您使用常用引擎在本地完成模型開發(fā)和訓(xùn)練，可以將您的模型上傳至OBS中，直接用于部署上線。ModelArts預(yù)置鏡像支持的AI引擎及其Runtime請(qǐng)參見推理支持的AI引擎。

從容器鏡像中選擇

針對(duì)ModelArts目前不支持的AI引擎，可以通過模型鏡像的方式將本地的模型導(dǎo)入ModelArts。通過配置健康檢查，支持在線服務(wù)進(jìn)行無損滾動(dòng)升級(jí)。

從模板中選擇元模型

因?yàn)橄嗤δ艿哪Ｐ团渲眯畔⒅貜?fù)率高，ModelArts提供模型模板方便您快捷地導(dǎo)入模型，創(chuàng)建AI應(yīng)用，而不用編寫配置文件。

您需要根據(jù)模型格式、模型AI引擎、模型運(yùn)行環(huán)境選擇對(duì)應(yīng)的模板。

部署服務(wù)

部署類型

在完成AI應(yīng)用的創(chuàng)建后，可在“部署上線”頁面對(duì)AI應(yīng)用進(jìn)行部署。ModelArts當(dāng)前支持如下幾種部署類型：

在線服務(wù)：將AI應(yīng)用部署為一個(gè)Web Service，并且提供在線預(yù)測(cè)與監(jiān)控功能。
批量服務(wù)：批量服務(wù)可對(duì)批量數(shù)據(jù)進(jìn)行推理，完成數(shù)據(jù)處理后自動(dòng)停止。
邊緣服務(wù)：通過智能邊緣平臺(tái)，在邊緣節(jié)點(diǎn)將AI應(yīng)用部署為一個(gè)Web Service。

部署為在線服務(wù)

AI應(yīng)用準(zhǔn)備完成后，您可以將AI應(yīng)用部署為在線服務(wù)，對(duì)在線服務(wù)進(jìn)行預(yù)測(cè)和調(diào)用。ModelArts支持可以把服務(wù)部署到公共資源池或者專屬資源池，專屬資源池不與其他用戶共享，更加高效。

部署為批量服務(wù)

AI應(yīng)用準(zhǔn)備完成后，您可以將AI應(yīng)用部署為批量服務(wù)。選擇您上傳數(shù)據(jù)的OBS目錄，ModelArts批量服務(wù)輸入數(shù)據(jù)支持圖片和csv格式文件，單張圖片建議小于10MB，輸入數(shù)據(jù)格式為csv時(shí)，建議文件大小不超過12MB。

部署為邊緣服務(wù)

AI應(yīng)用準(zhǔn)備完成后，您可以將AI應(yīng)用部署為邊緣服務(wù)。邊緣服務(wù)依賴智能邊緣平臺(tái)（IEF），部署前需要有IEF的委托權(quán)限。ModelArts當(dāng)前支持節(jié)點(diǎn)、節(jié)點(diǎn)組部署邊緣服務(wù)。

推理

服務(wù)預(yù)測(cè)

AI應(yīng)用部署為在線服務(wù)成功后，您可以在“預(yù)測(cè)”頁簽進(jìn)行代碼調(diào)試或添加文件測(cè)試。根據(jù)AI應(yīng)用定義的輸入請(qǐng)求不同（JSON文本或文件），ModelArts測(cè)試服務(wù)包括如下兩種方式：

JSON文本預(yù)測(cè)：如當(dāng)前部署服務(wù)的AI應(yīng)用，其輸入類型指定的為JSON文本類，即不含有文件類型的輸入，可以在“預(yù)測(cè)”頁簽輸入JSON代碼進(jìn)行服務(wù)預(yù)測(cè)。
文件預(yù)測(cè)：如當(dāng)前部署服務(wù)的AI應(yīng)用，其輸入類型指定為文件類，可包含圖片、音頻或視頻等場(chǎng)景，可以在“預(yù)測(cè)”頁簽添加圖片進(jìn)行服務(wù)預(yù)測(cè)。

JSON文本預(yù)測(cè)

ModelArts支持文本預(yù)測(cè)，如果您的輸入類型為文本，請(qǐng)注意測(cè)試服務(wù)文本應(yīng)小于12MB。

圖片預(yù)測(cè)

ModelArts支持圖片預(yù)測(cè)，如果您的輸入類型為圖片，請(qǐng)注意測(cè)試服務(wù)單張圖片輸入應(yīng)小于8MB。圖片支持以下類型：“png”、“psd”、“jpg”、“jpeg”、“bmp”、“gif”、“webp”、“psd”、“svg”、“tiff”。

推理部署常見問題

創(chuàng)建AI應(yīng)用失敗，如何定位和處理問題？

ModelArts創(chuàng)建AI應(yīng)用失敗有兩種場(chǎng)景：創(chuàng)建AI應(yīng)用時(shí)直接報(bào)錯(cuò)或者是調(diào)用API報(bào)錯(cuò)和創(chuàng)建AI應(yīng)用任務(wù)下發(fā)成功，但最終AI應(yīng)用創(chuàng)建失敗。
1、創(chuàng)建AI應(yīng)用時(shí)直接報(bào)錯(cuò)或者是調(diào)用API報(bào)錯(cuò)。一般都是輸入?yún)?shù)不合法導(dǎo)致的。您可以根據(jù)提示信息進(jìn)行排查修改即可。
2、創(chuàng)建AI應(yīng)用任務(wù)下發(fā)成功，但最終AI應(yīng)用創(chuàng)建失敗。需要從以下幾個(gè)方面進(jìn)行排查：
?在AI應(yīng)用詳情頁面，查看“事件”頁簽中的事件信息。根據(jù)事件信息分析AI應(yīng)用失敗原因，進(jìn)行處理。
?如果AI用狀態(tài)為“構(gòu)建失敗”，可以在AI應(yīng)用詳情頁面，查看“事件”頁簽中的“查看構(gòu)建日志”。構(gòu)建日志中有對(duì)應(yīng)的構(gòu)建鏡像失敗的詳細(xì)原因，根據(jù)構(gòu)建失敗的原因進(jìn)行排查處理。
查看FAQ詳情。
服務(wù)啟動(dòng)失敗

ModelArts服務(wù)啟動(dòng)失敗的原因比較多樣，可能有如下幾種情況：
?AI應(yīng)用本身問題，無法啟動(dòng)
?鏡像中配置的端口錯(cuò)誤
?健康檢查配置有問題
?模型推理代碼customize_service.py編寫有問題
查看FAQ詳情。
服務(wù)預(yù)測(cè)失敗

ModelArts服務(wù)預(yù)測(cè)需要經(jīng)過客戶端、外部網(wǎng)絡(luò)、APIG、Dispatch、模型服務(wù)多個(gè)環(huán)節(jié)。每個(gè)環(huán)節(jié)出現(xiàn)都會(huì)導(dǎo)致服務(wù)預(yù)測(cè)失敗。
圖1 推理服務(wù)流程圖
?出現(xiàn)APIG.XXXX類型的報(bào)錯(cuò)，表示請(qǐng)求在APIG（API網(wǎng)關(guān)）出現(xiàn)問題而被攔截。
?出現(xiàn)Modelart.XXXX類型的報(bào)錯(cuò)，表示請(qǐng)求在Dispatcher出現(xiàn)問題而被攔截。
?當(dāng)使用推理的鏡像并且出現(xiàn)MR.XXXX類型的錯(cuò)誤時(shí)，表示已進(jìn)入模型服務(wù)，一般是模型推理代碼編寫有問題。請(qǐng)根據(jù)構(gòu)建日志報(bào)錯(cuò)信息，定位服務(wù)預(yù)測(cè)失敗原因，修改模型推理代碼后，重新導(dǎo)入模型進(jìn)行預(yù)測(cè)。
?出現(xiàn)其他情況，優(yōu)先檢查客戶端和外部網(wǎng)絡(luò)是否有問題。
查看FAQ詳情。

精選文章推薦

更多相關(guān)文章精選推薦，帶您了解更多華為云產(chǎn)品

查看更多收起

ModelArts相關(guān)精選推薦

查看更多收起

五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

ModelArts 推理部署

ModelArts 推理部署

推理部署

創(chuàng)建AI應(yīng)用

創(chuàng)建AI應(yīng)用的幾種場(chǎng)景

四種來源的區(qū)別

從訓(xùn)練中選擇元模型

從OBS中選擇元模型

從容器鏡像中選擇

從模板中選擇元模型

部署服務(wù)

部署類型

部署為在線服務(wù)

部署為批量服務(wù)

部署為邊緣服務(wù)

推理

服務(wù)預(yù)測(cè)

JSON文本預(yù)測(cè)

圖片預(yù)測(cè)

推理部署常見問題

推理部署常見問題

精選文章推薦

ModelArts相關(guān)精選推薦

五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

ModelArts 推理部署

ModelArts 推理部署

推理部署

創(chuàng)建AI應(yīng)用

創(chuàng)建AI應(yīng)用的幾種場(chǎng)景

四種來源的區(qū)別

從訓(xùn)練中選擇元模型

從OBS中選擇元模型

從容器鏡像中選擇

從模板中選擇元模型

部署服務(wù)

部署類型

部署為在線服務(wù)

部署為批量服務(wù)

部署為邊緣服務(wù)

推理

服務(wù)預(yù)測(cè)

JSON文本預(yù)測(cè)

圖片預(yù)測(cè)

推理部署常見問題

推理部署常見問題

精選文章推薦

ModelArts快速入門案例

ModelArts相關(guān)精選推薦