盤古行業(yè)大模型
盤古行業(yè)大模型
盤古行業(yè)大模型化解行業(yè)數(shù)據(jù)構(gòu)建難、模型效果調(diào)優(yōu)難、場(chǎng)景能力評(píng)測(cè)難三大難題,助力行業(yè)客戶更快、更優(yōu)構(gòu)建專業(yè)大模型
盤古行業(yè)大模型化解行業(yè)數(shù)據(jù)構(gòu)建難、模型效果調(diào)優(yōu)難、場(chǎng)景能力評(píng)測(cè)難三大難題,助力行業(yè)客戶更快、更優(yōu)構(gòu)建專業(yè)大模型
5大盤古行業(yè)Thinking大模型上線,行業(yè)場(chǎng)景一觸及達(dá)
5大盤古行業(yè)Thinking大模型上線,行業(yè)場(chǎng)景一觸及達(dá)

醫(yī)學(xué)Thinking大模型
千億醫(yī)學(xué)數(shù)據(jù)增訓(xùn),可勝任復(fù)雜醫(yī)療任務(wù)

金融Thinking大模型
智能投研、實(shí)時(shí)風(fēng)控、精準(zhǔn)營(yíng)銷,金融大模型驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)

政務(wù)Thinking大模型
賦能政策研判、民生服務(wù)與城市治理,助力數(shù)字政府建設(shè)

工業(yè)Thinking大模型
聚焦礦山、鋼鐵、電力、油氣4大垂直領(lǐng)域,引領(lǐng)智能化升級(jí)

汽車Thinking大模型
讓研發(fā)更高效,讓生產(chǎn)更智能,讓服務(wù)更貼心

醫(yī)學(xué)Thinking大模型
千億醫(yī)學(xué)數(shù)據(jù)增訓(xùn),可勝任復(fù)雜醫(yī)療任務(wù)

金融Thinking大模型
智能投研、實(shí)時(shí)風(fēng)控、精準(zhǔn)營(yíng)銷,金融大模型驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)

政務(wù)Thinking大模型
賦能政策研判、民生服務(wù)與城市治理,助力數(shù)字政府建設(shè)

工業(yè)Thinking大模型
聚焦礦山、鋼鐵、電力、油氣4大垂直領(lǐng)域,引領(lǐng)智能化升級(jí)

汽車Thinking大模型
讓研發(fā)更高效,讓生產(chǎn)更智能,讓服務(wù)更貼心
應(yīng)用場(chǎng)景
應(yīng)用場(chǎng)景
醫(yī)學(xué)大模型 | 病歷生成助手
基于盤古醫(yī)學(xué)大模型的醫(yī)學(xué)信息理解能力和抽取能力,可實(shí)現(xiàn)生成規(guī)范的電子病歷。AI病歷生成技術(shù)可以應(yīng)用于不同的醫(yī)療服務(wù)模式,滿足門診、住院、互聯(lián)網(wǎng)醫(yī)院、健康管理各種場(chǎng)景的醫(yī)療需求場(chǎng)景,提升醫(yī)療接診效率。
金融大模型 | 金融智能投顧
依托盤古金融大模型對(duì)宏觀經(jīng)濟(jì)、市場(chǎng)動(dòng)態(tài)、公司財(cái)報(bào)、輿情信息等多源異構(gòu)金融數(shù)據(jù)的深度理解與實(shí)時(shí)分析能力,為個(gè)人及機(jī)構(gòu)投資者提供個(gè)性化資產(chǎn)配置方案、動(dòng)態(tài)投資組合優(yōu)化、智能風(fēng)險(xiǎn)評(píng)估、市場(chǎng)洞察解讀等核心服務(wù)。
汽車大模型 | 測(cè)試設(shè)計(jì)助手
工業(yè)大模型 | 礦采安全助手
政務(wù)大模型 | 政務(wù)辦公助手
賦能智慧政務(wù)?;诒P古政務(wù)大模型核心能力,實(shí)現(xiàn)公文智能生成、材料高效整理、審批流程輔助、會(huì)議管理優(yōu)化,全面支撐政策研究與數(shù)據(jù)分析,提升政府辦公效率與決策精準(zhǔn)度。
醫(yī)學(xué)大模型 | 病歷生成助手
金融大模型 | 金融智能投顧
汽車大模型 | 測(cè)試設(shè)計(jì)助手
工業(yè)大模型 | 礦采安全助手
政務(wù)大模型 | 政務(wù)辦公助手
使能百模千態(tài),加速千行萬業(yè)走向智能化
使能百模千態(tài),加速千行萬業(yè)走向智能化
中國(guó)農(nóng)科院基于華為云盤古行業(yè)大模型和AI4S科學(xué)計(jì)算平臺(tái),通過多智能體系統(tǒng)協(xié)同,實(shí)現(xiàn)了從“AI讀文獻(xiàn)篩選候選基因”到“AI分析多組學(xué)數(shù)據(jù)驗(yàn)證基因功能”,再到“AI輔助設(shè)計(jì)實(shí)驗(yàn)方案”的全流程數(shù)智化閉環(huán)。從而實(shí)現(xiàn)育種時(shí)間與成本的數(shù)量級(jí)降低和效率的指數(shù)級(jí)提升,引領(lǐng)農(nóng)業(yè)進(jìn)入真正的數(shù)智化時(shí)代。
盤古工業(yè)大模型涵蓋百萬級(jí)礦山領(lǐng)域地質(zhì)技術(shù)、安全監(jiān)管、洗選化工、機(jī)械電氣類數(shù)據(jù),助力山東能源快速構(gòu)建企業(yè)AI智能化底座,實(shí)現(xiàn)生產(chǎn)全流程的智能感知、數(shù)據(jù)融合與決策優(yōu)化,推動(dòng)煤礦開采向少人化、無人化轉(zhuǎn)型升級(jí)。
模型評(píng)測(cè)
模型評(píng)測(cè)
FinanceIQ是一個(gè)專注于金融領(lǐng)域的中文評(píng)估數(shù)據(jù)集,重點(diǎn)評(píng)估大語(yǔ)言模型在金融場(chǎng)景下的知識(shí)和推理能力,包含注冊(cè)會(huì)計(jì)師(CPA)、銀行從業(yè)資格、基金從業(yè)資格、證券從業(yè)資格等多項(xiàng)金融領(lǐng)域考試
FinanceIQ是一個(gè)專注于金融領(lǐng)域的中文評(píng)估數(shù)據(jù)集,重點(diǎn)評(píng)估大語(yǔ)言模型在金融場(chǎng)景下的知識(shí)和推理能力,包含注冊(cè)會(huì)計(jì)師(CPA)、銀行從業(yè)資格、基金從業(yè)資格、證券從業(yè)資格等多項(xiàng)金融領(lǐng)域考試
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
保險(xiǎn)從業(yè)資格CICE |
86.96 |
81.88 |
86.23 |
基金從業(yè)資格 |
90.71 |
86.12 |
86.24 |
期貨從業(yè)資格 |
92.15 |
84.99 |
87.76 |
注冊(cè)會(huì)計(jì)師(CPA) |
91.00 |
81.01 |
81.46 |
理財(cái)規(guī)劃師 |
89.49 |
82.03 |
80.00 |
稅務(wù)師 |
87.91 |
74.80 |
83.81 |
精算師-金融數(shù)學(xué) |
71.59 |
34.09 |
79.55 |
經(jīng)濟(jì)師 |
95.96 |
92.12 |
92.88 |
證券從業(yè)資格 |
88.27 |
83.25 |
81.63 |
銀行從業(yè)資格 |
91.48 |
88.02 |
87.06 |
加權(quán)匯總
|
90.39 |
83.53 |
84.69 |
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
保險(xiǎn)從業(yè)資格CICE |
86.96 |
81.88 |
86.23 |
基金從業(yè)資格 |
90.71 |
86.12 |
86.24 |
期貨從業(yè)資格 |
92.15 |
84.99 |
87.76 |
注冊(cè)會(huì)計(jì)師(CPA) |
91.00 |
81.01 |
81.46 |
理財(cái)規(guī)劃師 |
89.49 |
82.03 |
80.00 |
稅務(wù)師 |
87.91 |
74.80 |
83.81 |
精算師-金融數(shù)學(xué) |
71.59 |
34.09 |
79.55 |
經(jīng)濟(jì)師 |
95.96 |
92.12 |
92.88 |
證券從業(yè)資格 |
88.27 |
83.25 |
81.63 |
銀行從業(yè)資格 |
91.48 |
88.02 |
87.06 |
加權(quán)匯總
|
90.39 |
83.53 |
84.69 |
* 以上數(shù)據(jù)集均使用了 \\boxed 指令控制模型輸出,通過嚴(yán)格的 rule-based verifier 精確判定模型輸出結(jié)果的正誤
OpenFinData是由東方財(cái)富與上海人工智能實(shí)驗(yàn)室聯(lián)合發(fā)布的開源金融評(píng)測(cè)數(shù)據(jù)集。該數(shù)據(jù)集代表了最真實(shí)的產(chǎn)業(yè)場(chǎng)景需求,其金融場(chǎng)景覆蓋較全且專業(yè)性質(zhì)深
OpenFinData是由東方財(cái)富與上海人工智能實(shí)驗(yàn)室聯(lián)合發(fā)布的開源金融評(píng)測(cè)數(shù)據(jù)集。該數(shù)據(jù)集代表了最真實(shí)的產(chǎn)業(yè)場(chǎng)景需求,其金融場(chǎng)景覆蓋較全且專業(yè)性質(zhì)深
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
data_inspection |
85.00 |
81.67 |
78.33 |
emotion_identification |
89.33 |
86.67 |
78.67 |
entity_disambiguation |
73.33 |
78.67 |
72.00 |
entity_recognition |
74.67 |
81.33 |
86.67 |
financial_facts |
97.33 |
80.00 |
48.00 |
financial_terminology |
90.67 |
64.00 |
22.67 |
intent_understanding |
94.67 |
92.00 |
97.33 |
metric_calculation |
94.29 |
70.00 |
92.86 |
value_extraction |
98.57 |
95.71 |
95.71 |
加權(quán)匯總
|
88.62 |
81.07 |
74.31 |
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
data_inspection |
85.00 |
81.67 |
78.33 |
emotion_identification |
89.33 |
86.67 |
78.67 |
entity_disambiguation |
73.33 |
78.67 |
72.00 |
entity_recognition |
74.67 |
81.33 |
86.67 |
financial_facts |
97.33 |
80.00 |
48.00 |
financial_terminology |
90.67 |
64.00 |
22.67 |
intent_understanding |
94.67 |
92.00 |
97.33 |
metric_calculation |
94.29 |
70.00 |
92.86 |
value_extraction |
98.57 |
95.71 |
95.71 |
加權(quán)匯總
|
88.62 |
81.07 |
74.31 |
* 以上數(shù)據(jù)集均使用了 \\boxed 指令控制模型輸出,通過嚴(yán)格的 rule-based verifier 精確判定模型輸出結(jié)果的正誤
CFLUE 是中國(guó)金融語(yǔ)言理解評(píng)估基準(zhǔn),旨在評(píng)估大型語(yǔ)言模型(LLMs)在各個(gè)維度上的能力,它提供了針對(duì)知識(shí)評(píng)估和應(yīng)用評(píng)估量身定制的數(shù)據(jù)集
CFLUE 是中國(guó)金融語(yǔ)言理解評(píng)估基準(zhǔn),旨在評(píng)估大型語(yǔ)言模型(LLMs)在各個(gè)維度上的能力,它提供了針對(duì)知識(shí)評(píng)估和應(yīng)用評(píng)估量身定制的數(shù)據(jù)集
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
注冊(cè)會(huì)計(jì)師 |
92.76 |
80.04 |
82.24 |
證券從業(yè)資格 |
89.54 |
85.62 |
83.66 |
基金從業(yè)資格 |
94.35 |
93.45 |
92.86 |
反假貨幣知識(shí) |
91.67 |
80.00 |
85.00 |
銀從中級(jí)資格 |
89.39 |
79.25 |
81.13 |
初級(jí)會(huì)計(jì)職稱 |
96.49 |
88.07 |
90.88 |
銀行初級(jí)資格 |
91.17 |
84.11 |
84.99 |
初級(jí)經(jīng)濟(jì)師 |
89.76 |
83.41 |
82.68 |
金融理財(cái)師(AFP) |
85.62 |
76.03 |
86.30 |
證券專項(xiàng)考試 |
93.39 |
86.78 |
86.78 |
期貨從業(yè)資格 |
86.21 |
77.59 |
83.62 |
中級(jí)經(jīng)濟(jì)師 |
88.89 |
82.77 |
81.80 |
黃金從業(yè)資格 |
78.82 |
65.88 |
60.00 |
保險(xiǎn)從業(yè)資格 |
92.75 |
84.06 |
78.26 |
中國(guó)精算師 |
69.23 |
46.15 |
84.62 |
加權(quán)匯總
|
90.50 |
82.76 |
83.90 |
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
注冊(cè)會(huì)計(jì)師 |
92.76 |
80.04 |
82.24 |
證券從業(yè)資格 |
89.54 |
85.62 |
83.66 |
基金從業(yè)資格 |
94.35 |
93.45 |
92.86 |
反假貨幣知識(shí) |
91.67 |
80.00 |
85.00 |
銀從中級(jí)資格 |
89.39 |
79.25 |
81.13 |
初級(jí)會(huì)計(jì)職稱 |
96.49 |
88.07 |
90.88 |
銀行初級(jí)資格 |
91.17 |
84.11 |
84.99 |
初級(jí)經(jīng)濟(jì)師 |
89.76 |
83.41 |
82.68 |
金融理財(cái)師(AFP) |
85.62 |
76.03 |
86.30 |
證券專項(xiàng)考試 |
93.39 |
86.78 |
86.78 |
期貨從業(yè)資格 |
86.21 |
77.59 |
83.62 |
中級(jí)經(jīng)濟(jì)師 |
88.89 |
82.77 |
81.80 |
黃金從業(yè)資格 |
78.82 |
65.88 |
60.00 |
保險(xiǎn)從業(yè)資格 |
92.75 |
84.06 |
78.26 |
中國(guó)精算師 |
69.23 |
46.15 |
84.62 |
加權(quán)匯總
|
90.50 |
82.76 |
83.90 |
* 以上數(shù)據(jù)集均使用了 \\boxed 指令控制模型輸出,通過嚴(yán)格的 rule-based verifier 精確判定模型輸出結(jié)果的正誤
Fin-eval是由螞蟻集團(tuán)、上海財(cái)經(jīng)大學(xué)聯(lián)合推出金融評(píng)測(cè)集覆蓋財(cái)富管理、保險(xiǎn)、投資研究等多個(gè)金融場(chǎng)景以及金融專業(yè)主題學(xué)科
Fin-eval是由螞蟻集團(tuán)、上海財(cái)經(jīng)大學(xué)聯(lián)合推出金融評(píng)測(cè)集覆蓋財(cái)富管理、保險(xiǎn)、投資研究等多個(gè)金融場(chǎng)景以及金融專業(yè)主題學(xué)科
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
accounting |
91.57 |
86.52 |
88.76 |
finance |
90.30 |
82.34 |
83.83 |
economy |
89.45 |
90.30 |
93.67 |
certificate |
88.62 |
86.23 |
90.12 |
加權(quán)匯總
|
89.83 |
85.75 |
88.44 |
評(píng)估類型 |
Pangu-Finance-NLP-N2-128k |
Deepseek-R1 |
Qwen3-32B |
---|---|---|---|
accounting |
91.57 |
86.52 |
88.76 |
finance |
90.30 |
82.34 |
83.83 |
economy |
89.45 |
90.30 |
93.67 |
certificate |
88.62 |
86.23 |
90.12 |
加權(quán)匯總
|
89.83 |
85.75 |
88.44 |
* 以上數(shù)據(jù)集均使用了 \\boxed 指令控制模型輸出,通過嚴(yán)格的 rule-based verifier 精確判定模型輸出結(jié)果的正誤