全鏈路專業(yè)服務,讓大模型從可用到好用 · 6大階段30+專業(yè)服務,覆蓋大模型建設全流程,加速政企落地大模型 · 創(chuàng)新運營服務模式,實現(xiàn)全場景模型經(jīng)驗沉淀、全流程運營賦能產(chǎn)業(yè),快速孵化大模型場景化應用 大模型混合云十大創(chuàng)新技術 大模型混合云十大創(chuàng)新技術 了解詳情 十大創(chuàng)新技術 加速構建企業(yè)專屬大模型
盤古NLP大模型 盤古NLP大模型 優(yōu)秀的模型結構,完善的工程化能力,最貼合行業(yè)落地的NLP大模型 超大參數(shù)規(guī)模,最貼合行業(yè)落地的NLP大模型 重磅發(fā)布盤古NLP 718B深度思考模型,多專家+大稀疏比的MOE新架構,昇騰親和設計,高效訓推 專家咨詢 ModelArts Studio控制臺
使用預置算法構建模型 使用自定義算法構建模型 查看全部 即刻領取 免費試用 產(chǎn)品 開啟您的大模型之旅 企業(yè)免費試用 您可能感興趣的產(chǎn)品 您可能感興趣的產(chǎn)品 大模型開發(fā)平臺ModelArts Studio 一站式大模型工具鏈平臺 ModelArts 面向開發(fā)者的AI平臺
盤古大模型 PanguLargeModels 盤古大模型 PanguLargeModels 盤古大模型是面向B端行業(yè)的大模型,包含L0中5類基礎大模型、L1行業(yè)大模型及L2場景模型三層架構 盤古大模型是面向B端行業(yè)的大模型,包含L0中5類基礎大模型、L1行業(yè)大模型及L2場景模型三層架構
化區(qū)域的基礎大模型。 全球模型 提供高精度的全球模型,無需定制和訓練,直接訂閱即可推理 多種部署形態(tài) 支持公有云、混合云、邊緣多種形態(tài),滿足不同需求 文檔與學習成長 盤古大模型 盤古大模型 什么是盤古大模型 盤古科學計算大模型能力與規(guī)格 盤古大模型用戶指南 如何調用盤古大模型API
古多模態(tài)大模型為基座,持續(xù)優(yōu)化萬興天幕音視頻大模型2.0,構建其音視頻垂類能力。 廣汽集團 廣汽借助華為云盤古多模態(tài)大模型,打造業(yè)界首個支持點云生成的大模型,為其端到端仿真高效迭代提供強有力支撐。 文檔與學習成長 盤古大模型 盤古大模型 什么是盤古大模型 盤古多模態(tài)大模型能力與規(guī)格
大模型混合云TOP N 場景 大模型混合云TOP N 場景 1對1咨詢 了解華為云Stack 大模型行業(yè)場景落地三要素 大模型行業(yè)場景落地三要素 場景是大模型行業(yè)落地的關鍵所在,而在場景落地過程中,數(shù)據(jù)、經(jīng)驗和生態(tài)是核心要素,數(shù)據(jù)的數(shù)量和質量決定模型效果上限;經(jīng)驗就像“名師指導”
多語種內容審核,平臺全面保護 一站式大模型開發(fā)平臺 一站式大模型開發(fā)平臺 ModelArts Studio大模型開發(fā)平臺是集數(shù)據(jù)管理、模型訓練、模型部署于一體的綜合平臺,專為開發(fā)和應用大模型而設計,旨在為開發(fā)者提供簡單、高效的大模型開發(fā)和部署方式 為什么選擇大模型開發(fā)平臺ModelArts
大模型安全護欄 ModelArts Guard 大模型安全護欄 ModelArts Guard 大模型安全護欄(ModelArts Guard),做配套大模型的內容安全防線 大模型安全護欄(ModelArts Guard),做配套大模型的安全防線,開放兼容,適用盤古大模型和三方大模型
《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》明確,具有輿論屬性或者社會動員能力的算法推薦服務提供者應當在提供服務之日起十個工作日內通過互聯(lián)網(wǎng)信息服務算法備案系統(tǒng)填報服務提供者的名稱、服務形式、應用領域、算法類型、算法自評估報告、擬公示內容等信息 方便
湘江鯤鵬目前在人工智能大模型領域擁有算力、數(shù)據(jù)、算法三大關鍵要素的經(jīng)驗積累,構建了大模型三個方面的差異化競爭力,盤古大模型AI專業(yè)服務覆蓋從前期咨詢、規(guī)劃設計,到數(shù)據(jù)工程、模型訓練,再到應用工程及模型運維的完整流程?;谌A為盤古提供的AI專業(yè)服務包,致力于為企業(yè)提供一站式人工智能解決方案
等,以及整體的規(guī)劃設計(需求、思路、方案、架構、落地周期、預算等)。3. 數(shù)據(jù)的咨詢、治理和梳理,數(shù)據(jù)的采集(各業(yè)務系統(tǒng)中的多種業(yè)務模型、網(wǎng)絡等等),數(shù)據(jù)的標注,關聯(lián)關系的定義,以及數(shù)據(jù)導入。4. 基于具體任務和對應的數(shù)據(jù)分布,設計適合的微調訓練框架和方案;使用不同的調參策略和技
,滿足企業(yè)在不同地點的工作需求。5、我們保證了業(yè)務的高質量數(shù)據(jù)供給。我們的工作站擁有強大的數(shù)據(jù)處理能力,可以提供高質量的數(shù)據(jù),幫助企業(yè)做出更好的決策??偟膩碚f,太杉天尊大模型AIGC場景解決方案具備功能強大、安全可靠、易于使用的特點,是政府的得力助手,企業(yè)的重要伙伴。1、數(shù)據(jù)私有化;
%+,能夠為客戶提供定制化的解決方案。 公司集成了世界領先的底層大模型,具備打通跨模型和工具鏈的平臺能力,采用最新的人工智能技術和算法,能夠基于業(yè)務場景,支持大規(guī)模數(shù)據(jù)處理和復雜的模型訓練,根據(jù)客戶的特定需求調整模型參數(shù)和功能,確保為客戶提供高效、可靠的技術服務,以滿足業(yè)務目標。
擇和技術方案設計。?提供NLP/CV等大模型的訓練集數(shù)據(jù)標準設計指導。2. 規(guī)劃設計:?提供需求調研服務,基于盤古大模型的能力進行科學合理的方案設計和模型選擇。?完成需求調研報告和方案設計報告的輸出及交付。?提供L0盤古大模型服務部署方案的規(guī)劃設計及部署實施服務。3. 數(shù)據(jù)工程:
注&撰寫根據(jù)大模型微調數(shù)據(jù)標注規(guī)范,通過配套工具進行數(shù)據(jù)標注。 八、數(shù)據(jù)轉換與導入 完成數(shù)據(jù)格式的轉換,可進行跨網(wǎng)絡環(huán)境的數(shù)據(jù)導入。 九、調優(yōu)方案設計 根據(jù)大模型訓練及調優(yōu)工具和平臺,輸出大模型調優(yōu)方案。 十、模型訓練實施1. 基于大模型訓練所需的云服務,完成大模型訓練及微調。2
、安全的工作環(huán)境。1、我們特別注重數(shù)據(jù)私有化。我們采用最新的數(shù)據(jù)加密技術,確保企業(yè)的數(shù)據(jù)安全。每一個工作站都擁有獨立的存儲空間,企業(yè)的數(shù)據(jù)不會被未經(jīng)授權的第三方訪問。2、我們提供了場景定制的服務。我們的工作站可以根據(jù)企業(yè)的具體需求,進行個性化設計,以滿足企業(yè)在不同場景下的工作需求
出門問問大模型“序列猴子”是一款具備多模態(tài)生成能力的大語言模型,模型以語言為核心的能力體系涵蓋“知識、對話、數(shù)學、邏輯、推理、規(guī)劃”六個維度,能夠同時支持文字生成、圖片生成、3D內容生成、語言生成和語音識別等不同任務。出門問問大模型“序列猴子”是一款具備多模態(tài)生成能力的大語言模型,模
深厚的行業(yè)積累,分層解耦的架構,多樣化的部署模式 深厚的行業(yè)積累,分層解耦的架構,多樣化的部署模式 技術扎根 全棧技術創(chuàng)新,極致算力加速大模型開發(fā),打造世界AI另一極 全棧技術創(chuàng)新,極致算力加速大模型開發(fā),打造世界AI另一極 開放同飛 打造云原生應用平臺AppArts,成立大模型高質量數(shù)據(jù)聯(lián)盟
安全云腦_自定義告警模型 安全云腦的威脅運營功能提供豐富的威脅檢測模型,幫助您從海量的安全日志中,發(fā)現(xiàn)威脅、生成告警;同時,提供豐富的安全響應劇本,幫助您對告警進行自動研判、處置,并對安全防線和安全配置自動加固。 威脅運營中的智能建模支持利用模型對管道中的日志數(shù)據(jù)進行掃描,如果不在模型設置范圍內容,將產(chǎn)生告警提示。
ModelArts提供了模型訓練的功能,方便您查看訓練情況并不斷調整您的模型參數(shù)。您還可以基于不同的數(shù)據(jù),選擇不同規(guī)格的資源池用于模型訓練。除支持用戶自己開發(fā)的模型外,ModelArts還提供了從AI Gallery訂閱算法,您可以不關注模型開發(fā),直接使用AI Gallery的算法,通過算法參數(shù)的調整,得到一個滿意的模型。
當前ModelArts推理基礎鏡像使用的python的logging模塊,采用的是默認的日志級別Warnning,即當前只有warning級別的日志可以默認查詢出來。如果想要指定INFO等級的日志能夠查詢出來,需要在代碼中指定logging的輸出日志等級為INFO級別。 在推理代碼所在的py文件中,指定
py”結尾的文件。 文件數(shù)(含文件、文件夾數(shù)量)不超過1024個。 文件總大小不超過5GB。 ModelArts訓練好后的模型如何獲??? 使用自動學習產(chǎn)生的模型只能在ModelArts上部署上線,無法下載至本地使用。 使用自定義算法或者訂閱算法訓練生成的模型,會存儲至用戶指定的OBS路徑中,供用戶下載。
用戶創(chuàng)建Notebook時所選用的鏡像是經(jīng)過多次保存的自定義鏡像或用戶自行注冊的鏡像,基于該鏡像所創(chuàng)建的Notebook已經(jīng)無法再執(zhí)行鏡像保存的操作了。 解決方法 使用公共鏡像或其他的自定義鏡像來創(chuàng)建Notebook,完成鏡像保存操作。 ModelArts-產(chǎn)品相關介紹 更快的普惠AI平臺 ModelArts產(chǎn)品文檔
的實時監(jiān)控和分析,以及生產(chǎn)計劃的優(yōu)化和調整。又壹MES的服務特點包括:高度定制化、靈活可擴展、易于集成、可靠穩(wěn)定。他們的團隊擁有豐富的行業(yè)經(jīng)驗和技術實力,能夠根據(jù)客戶的需求和現(xiàn)有的生產(chǎn)環(huán)境,提供量身定制的解決方案。他們的系統(tǒng)可以根據(jù)企業(yè)的需求進行靈活的擴展和定制,以適應不同規(guī)模和
同的訪問權限,以達到不同員工之間的權限隔離,通過IAM進行精細的權限管理。 VPC和子網(wǎng) 虛擬私有云(Virtual Private Cloud, VPC)為云數(shù)據(jù)庫構建隔離的、用戶自主配置和管理的虛擬網(wǎng)絡環(huán)境,提升用戶云上資源的安全性,簡化用戶的網(wǎng)絡部署。您可以在VPC中定義安
助您安全的控制華為云資源的訪問。 如果華為云賬號已經(jīng)能滿足您的要求,不需要創(chuàng)建獨立的IAM用戶進行權限管理,您可以跳過本章節(jié),不影響您使用GaussDB服務的其它功能。 通過IAM,您可以在華為云賬號中給員工創(chuàng)建IAM用戶,并授權控制他們對華為云資源的訪問范圍。例如您的員工中有負
ai大模型的定義
搜索大模型插件通過模型服務將AI能力集成到Elasticsearch集群中,實現(xiàn)語義向量搜索、語義排序等高級功能。其核心流程是基于業(yè)務需求(如語義搜索、智能推薦)定義模型類型(Embedding/Rerank等),并綁定對應的AI服務地址,確保上層應用能通過向量索引正確調用服務接口。
- 語義搜索:依賴Embedding模型服務,將文本轉換為向量,實現(xiàn)相似性檢索。
- 智能推薦:組合使用Embedding模型服務(生成用戶/物品向量)和Rerank模型服務,優(yōu)化推薦結果排序。
前提條件
確認Elasticsearch集群已啟用搜索大模型插件,操作指導請參見開啟搜索大模型插件。
支持的模型服務
搜索大模型插件支持接入多種模型服務,具體支持的模型服務清單如表1 支持的模型服務所示。
獲取獨享版集群的訪問地址
- 登錄 云搜索服務 管理控制臺。
- 在左側導航欄,選擇“集群管理 > Elasticsearch”。
- 在集群列表,單擊目標集群名稱,進入集群詳情頁。
- 選擇“依賴服務管理”頁簽,進入依賴服務列表。
- 在依賴服務列表,選擇目標服務,單擊操作列的“查看詳情”跳轉到獨享版集群的基本信息頁面。
- 獲取“內網(wǎng)訪問IPv4地址”即獨享版集群的訪問地址,后續(xù)配置模型服務需要使用。
圖1 獲取集群訪問地址
登錄Kibana
登錄Kibana進入命令執(zhí)行頁面。Elasticsearch集群支持多種客戶端訪問,本文僅以 CSS 服務集成的Kibana為例介紹配置指導。
- 登錄 云搜索 服務管理控制臺。
- 在左側導航欄,選擇“集群管理 > Elasticsearch”。
- 在集群列表,選擇目標集群,單擊操作列的“Kibana”,登錄Kibana。
- 在Kibana左側導航欄選擇“Dev Tools”,進入操作頁面。
控制臺左側是命令輸入框,其右側的三角形圖標為執(zhí)行按鈕,右側區(qū)域則顯示執(zhí)行結果。
配置模型服務
當模型創(chuàng)建完成后,根據(jù)業(yè)務需要配置模型服務。下面介紹了各類模型服務的配置指導。
配置Embedding模型服務
在Kibana中執(zhí)行以下命令,配置Embedding模型服務。其中,模型類型必須是semantic_vector。
PUT _inference/model_service/{service_name} { "description": "搜索大模型-語義向量化", "service_config": { "semantic_vector": { "service_urls" : ["http://{endpoint}/app/search/v1/vector"], "algorithm": "GRAPH", "metric": "inner_product", "dimension": "768", "timeout_ms": 30000 } } }
|
參數(shù) |
是否必選 |
參數(shù)類型 |
描述 |
|---|---|---|---|
|
service_name |
是 |
String |
模型服務的名稱。自定義,如pangu_vector。 |
|
service_urls |
是 |
List<String> |
訪問模型服務的接口URL。 支持配置多個訪問地址,用逗號分隔。 配置格式:http://{endpoint}/app/search/v1/vector,endpoint參考獲取獨享版集群的訪問地址獲取。 舉例:http://192.168.0.85:18088/app/search/v1/vector |
|
method |
否 |
String |
模型服務的訪問方法。 由Embedding模型服務決定,搜索大模型使用的是POST,保持默認值即可。 取值范圍:POST、GET、PUT 默認值:POST |
|
algorithm |
否 |
String |
模型服務支持的向量索引算法。 取值范圍:
默認值:GRAPH |
|
metric |
否 |
String |
計算向量之間距離的度量方式。 取值范圍:
默認值:inner_product |
|
dimension |
否 |
String |
向量數(shù)據(jù)維度。 由Embedding模型服務決定,必須配置為768,保持默認值即可。 取值范圍:1~4096 默認值:768 |
|
timeout_ms |
否 |
int |
訪問模型服務的超時時間,超時會請求失敗。 單位:ms(毫秒) 最小值:3000 默認值:10000 |
|
content_length |
否 |
int |
模型服務支持單個文檔屬性的最大值,超過最大值將進行文本截斷。 默認值:-1(小于0代表不進行長度截斷) |
|
embedding_type |
否 |
String |
配置Embedding模型的查詢類型。
取值范圍:
默認值:query2doc |
配置Rerank模型服務
在Kibana中執(zhí)行以下命令,配置Rerank模型服務。其中,模型類型必須是reorder。
PUT _inference/model_service/{service_name} { "description": "搜索大模型-精排模型", "service_config": { "reorder": { "service_urls": ["http://{endpoint}/app/search/v1/rerank"], "timeout_ms": 60000 } } }
|
參數(shù) |
是否必選 |
參數(shù)類型 |
描述 |
|---|---|---|---|
|
service_name |
是 |
String |
模型服務的名稱。自定義,如pangu_ranking。 |
|
service_urls |
是 |
List<String> |
訪問模型服務的接口URL。 支持配置多個訪問地址,用逗號分隔。 配置格式:http://{endpoint}/app/search/v1/rerank,endpoint參考獲取獨享版集群的訪問地址獲取。 舉例:http://192.168.0.85:18088/app/search/v1/rerank |
|
method |
否 |
String |
模型服務的訪問方法。 由Rerank模型服務決定,搜索大模型使用的是POST,保持默認值即可。 取值范圍:POST、GET、PUT 默認值:POST |
|
timeout_ms |
否 |
int |
訪問模型服務的超時時間,超時會請求失敗。 單位:ms(毫秒) 最小值:3000 默認值:10000 |
|
content_length |
否 |
int |
模型服務支持單個文檔屬性的最大值,超過最大值將進行文本截斷。 默認值:-1(小于0代表不進行長度截斷) |
管理模型服務
搜索大模型插件深度集成Kibana命令行界面(CLI),支持對模型服務進行更新、監(jiān)控、擴縮容等全生命周期管理。如表4所示,可以通過標準CLI命令執(zhí)行更新(update)、刪除(delete)等核心操作管理模型服務。
|
操作類型 |
API命令 |
請求示例 |
響應示例 |
|---|---|---|---|
|
更新模型服務 |
POST _inference/model_service/{service_name}/update |
更新Embedding模型服務: POST _inference/model_service/pangu_vector/update
{
"description": "搜索大模型-語義向量化模型更新",
"service_config": {
"semantic_vector": {
"service_urls": ["http://{endpoint}/app/search/v1/vector"],
"timeout_ms": 60000
}
}
} |
返回更新后的模型服務信息: {
"service_name" : "pangu_vector",
"service_type" : "remote",
"description" : "搜索大模型-語義向量化模型更新",
"create_time" : 1747966388508,
"service_config" : {
"semantic_vector" : {
"embedding_type" : "query2doc",
"service_urls" : [
"http://{endpoint}/app/search/v1/vector"],
"method" : "POST",
"timeout_ms" : 60000,
"max_conn" : 200,
"security" : false,
"dimension" : "768",
"algorithm" : "GRAPH",
"metric" : "inner_product"
}
}
} |
|
檢查模型服務連通性 |
GET _inference/model_service/{service_name}/check |
檢查Embedding模型服務的連通性: GET _inference/model_service/pangu_vector/check |
{
"acknowledged" : true
} |
|
查看模型服務 |
|
查看Embedding模型服務的配置信息: GET _inference/model_service/pangu_vector |
返回模型服務信息: {
"count" : 1,
"model_service_configs" : [
{
"service_name" : "pangu_vector",
"service_type" : "remote",
"description" : "搜索大模型-語義向量化模型",
"create_time" : 1747966388508,
"service_config" : {
"semantic_vector" : {
"embedding_type" : "query2doc",
"service_urls" : ["http://{endpoint}/app/search/v1/vector"],
"method" : "POST",
"timeout_ms" : 60000,
"max_conn" : 200,
"security" : false,
"dimension" : "768",
"algorithm" : "GRAPH",
"metric" : "inner_product"
}
}
}
]
} |
|
刪除模型服務配置(刪除后,索引將無法使用該模型服務) |
DELETE _inference/model_service/{service_name} |
刪除Embedding模型服務配置: DELETE _inference/model_service/pangu_vector |
{
"acknowledged" : true
} |
|
設置模型服務的數(shù)量上限(最多支持創(chuàng)建幾個模型服務) |
PUT _cluster/settings
{
"transient": {
"pg_search.inference.max_inference_model_service": 100 //最大值是1000,最小值是1,默認值是100。
}
} |
設置模型服務的數(shù)量上限為10: PUT _cluster/settings
{
"transient": {
"pg_search.inference.max_inference_model_service": 10
}
} |
{
"acknowledged" : true,
"persistent" : { },
"transient" : {
"pg_search" : {
"inference" : {
"max_inference_model_service" : "10"
}
}
}
} |
ai大模型的定義常見問題
更多常見問題 >>-
盤古大模型致力于深耕行業(yè),打造金融、政務、制造、礦山、氣象、鐵路等領域行業(yè)大模型和能力集,將行業(yè)知識know-how與大模型能力相結合,重塑千行百業(yè),成為各組織、企業(yè)、個人的專家助手。
-
模型轉換,即將開源框架的網(wǎng)絡模型(如Caffe、TensorFlow等),通過ATC(Ascend Tensor Compiler)模型轉換工具,將其轉換成昇騰AI處理器支持的離線模型。
-
OBS使用PUT操作為桶設置自定義域名,設置成功之后,用戶訪問桶的自定義域名就能訪問到桶。必須保證此自定義域名通過DNS能夠正確解析到OBS服務。
-
OBS使用DELETE操作來刪除桶的自定義域名。
-
本次Serverless應用中心上線文生圖應用,用戶無需下載源代碼、了解各種安裝部署知識、安裝復雜的依賴,通過華為云Serverless應用中心即可一鍵創(chuàng)建AI文生圖應用,體驗 “0” 構建門檻、“0” 資源閑置并具備極致彈性的Serverless AI繪圖能力。
-
在自然語言處理(NLP)領域中,使用語言模型預訓練方法在多項NLP任務上都獲得了不錯的提升,廣泛受到了各界的關注。本課程將簡單介紹一下預訓練的思想,幾個代表性模型和它們之間的關系。
更多相關專題
增值電信業(yè)務經(jīng)營許可證:B1.B2-20200593 | 域名注冊服務機構許可:黔D3-20230001 | 代理域名注冊服務機構:新網(wǎng)、西數(shù)