7月7日,在華為開發(fā)者大會 2023 上,華為云盤古大模型3.0亮相。
華為常務董事、華為云CEO張平安介紹道,華為云盤古大模型3.0是一個完全面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu):L0層的基礎大模型、L1層行業(yè)大模型以及L2層場景模型。
L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎大模型,提供滿足行業(yè)場景中的多種技能需求。盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。
L1層是N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。
L2層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網(wǎng)點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景,為客戶提供“開箱即用”的模型服務。
張平安表示盤古大模型3.0“不做詩只做事”,將圍繞“行業(yè)重塑”“技術扎根”“開放同飛”三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務。據(jù)介紹,盤古大模型已在金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路、氣象等諸多行業(yè)發(fā)揮巨大價值。
在政務領域,華為云攜手深圳市福田區(qū)政務服務數(shù)據(jù)管理局,上線了基于盤古政務大模型的福田政務智慧助手小福,能夠精準理解民眾咨詢意圖,改變傳統(tǒng)的一網(wǎng)通辦模式,把老百姓的話語轉(zhuǎn)化為政府辦事的語言。盤古政務大模型對超過20萬條政務數(shù)據(jù)進行精調(diào),包括12345熱線、政策文件、政務百科等,掌握了豐富的法律法規(guī)、辦事流程等行業(yè)知識?;诒P古政務大模型的小福,在一網(wǎng)通辦業(yè)務中體現(xiàn)出行業(yè)性、專業(yè)性、領先性和惠民性。
在煤礦領域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業(yè),不僅能讓煤礦工人的工作環(huán)境更加舒適,而且可以極大地減少安全事故。
據(jù)公開資料,華為盤古系列基礎大模型于2021發(fā)布,包括NLP、CV和科學計算大模三大基礎大模型,后續(xù)發(fā)布了礦山、藥物分子、氣象、海浪等行業(yè)大模型;2022年4月升級到2.0版本,發(fā)布層次化開發(fā)方案 ( LO, L1,L2) ,打造工業(yè)級盤古大模型。
據(jù)了解,基于華為的AI根技術,大模型訓練效能可以調(diào)優(yōu)到業(yè)界主流GPU的1.1倍。華為在最底層構(gòu)建了以鯤鵬和昇騰為基礎的AI算力云平臺,以及異構(gòu)計算架構(gòu)CANN、全場景AI框架昇思MindSpore,AI開發(fā)生產(chǎn)線ModelArts等,為大模型開發(fā)和運行提供分布式并行加速,算子和編譯優(yōu)化、集群級通信優(yōu)化等關鍵能力。
眾所周知算力是訓練大模型的基礎。在本次大會上,張平安宣布單集群2000PFlops算力的昇騰AI云服務在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰AI云服務除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時,這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。