盤(pán)古大模型3.0發(fā)布 華為云CEO張平安:盤(pán)古大模型不會(huì)寫(xiě)詩(shī),只會(huì)做事
每經(jīng)記者:王晶 每經(jīng)編輯:梁梟
當(dāng)前,國(guó)內(nèi)大模型進(jìn)展不斷。7月7日,在華為開(kāi)發(fā)者大會(huì)2023(Cloud)上,華為常務(wù)董事、華為云CEO張平安發(fā)布了盤(pán)古大模型3.0。據(jù)他介紹,盤(pán)古大模型3.0是一個(gè)面向行業(yè)的大模型系列,包括“5 N X”三層架構(gòu)。
傳統(tǒng)的AI開(kāi)發(fā)模式下,一個(gè)場(chǎng)景對(duì)應(yīng)一個(gè)模型,數(shù)據(jù)質(zhì)量差、樣本少,模型精度差,并且應(yīng)用場(chǎng)景相對(duì)單一。不同行業(yè)、不同場(chǎng)景對(duì)AI的需求既復(fù)雜且碎片化,每個(gè)痛點(diǎn)都需要進(jìn)行定制化地開(kāi)發(fā)和改造;另一方面,AI算法從理論上能夠極大提升產(chǎn)品及服務(wù)的價(jià)值量,但由于開(kāi)發(fā)過(guò)程中存在大量的碎片化因素,不同的應(yīng)用場(chǎng)景往往需要獨(dú)立的架構(gòu)設(shè)計(jì)與調(diào)參,效率相對(duì)較低?!靶∽鞣皇健钡腁I開(kāi)發(fā)模式在一定程度上限制了生產(chǎn)力。
華為云CEO張平安 圖片來(lái)源:官方供圖
從華為盤(pán)古大模型的進(jìn)化路徑可以看出,主要分為L(zhǎng)0、L1、L2三個(gè)階段。L0指基礎(chǔ)大模型,L1是在L0基礎(chǔ)上導(dǎo)入行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練后衍生出的行業(yè)大模型,L2是在L1基礎(chǔ)上結(jié)合行業(yè)細(xì)分場(chǎng)景得到的推理模型,上層是在下層的基礎(chǔ)上演化而來(lái),層層遞進(jìn)。國(guó)金證券認(rèn)為,華為盤(pán)古大模型是一種工業(yè)化AI開(kāi)發(fā)的新模式,可以解決小模型的定制化難題,使一個(gè)模型應(yīng)用到多個(gè)場(chǎng)景中。
具體來(lái)看,其中,L0層包括自然語(yǔ)言、視覺(jué)、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型,包括NLP(自然語(yǔ)言處理)大模型的知識(shí)問(wèn)答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力。
L1層是指N個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開(kāi)數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤(pán)古大模型的L0和L1層上,為客戶訓(xùn)練自己的專(zhuān)有大模型。L2層則提供面向各行業(yè)中更細(xì)化場(chǎng)景的模型,如先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景等。
公開(kāi)資料顯示,華為盤(pán)古大模型于2020年啟動(dòng)研發(fā)。2021年4月,華為發(fā)布了NLP大模型、視覺(jué)大模型和科學(xué)計(jì)算大模型。此后,盤(pán)古大模型在性能、深度、架構(gòu)方面及數(shù)據(jù)增強(qiáng)方面持續(xù)升級(jí)。當(dāng)前,盤(pán)古大模型的核心定位是為各行各業(yè)賦能。
會(huì)上,張平安分別介紹了盤(pán)古大模型在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮的價(jià)值。
例如,在煤礦領(lǐng)域,盤(pán)古礦山大模型已經(jīng)在全國(guó)8個(gè)礦井規(guī)模使用,一個(gè)大模型可以覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個(gè)細(xì)分場(chǎng)景,讓更多的煤礦工人能夠在地面上作業(yè),減少安全事故;在氣象領(lǐng)域,原來(lái)預(yù)測(cè)一個(gè)臺(tái)風(fēng)未來(lái)10天的路徑,需要在3000臺(tái)服務(wù)器的高性能計(jì)算機(jī)集群上花費(fèi)5小時(shí)進(jìn)行仿真。現(xiàn)在基于預(yù)訓(xùn)練的盤(pán)古氣象大模型,10秒內(nèi)就可以獲得更精確的預(yù)測(cè)結(jié)果。
張平安表示,華為的盤(pán)古大模型不會(huì)寫(xiě)詩(shī),只會(huì)做事。它要幫助各行各業(yè),在各個(gè)領(lǐng)域都要讓AI來(lái)賦予它們價(jià)值。比如金融、礦山、政務(wù),有很多工作小組都派下去?!拔覀円恢眻?jiān)持的方向就是‘AI for Industries’”
每日經(jīng)濟(jì)新聞