隨著新一波AI浪潮的到來,一場(chǎng)全新的、數(shù)字化的轉(zhuǎn)型升級(jí)正在各行各業(yè)上演。對(duì)數(shù)字化進(jìn)程已行至“深水區(qū)”的石油化工行業(yè)而言,如何借這波浪潮向下“深潛”,推動(dòng)行業(yè)向高質(zhì)量發(fā)展轉(zhuǎn)型,成為業(yè)內(nèi)專家在日前舉行的2024華為全聯(lián)接大會(huì)上深入研討的話題。
“我們需要把常規(guī)的化工知識(shí),還有設(shè)計(jì)規(guī)則、實(shí)驗(yàn)規(guī)律都結(jié)合起來,設(shè)計(jì)制造化工領(lǐng)域的AI大模型?!敝袊茖W(xué)院大連化學(xué)物理研究所研究員葉茂說。
自2023年ChatGPT面世起,AI大模型技術(shù)在全球興起。大模型的能力和應(yīng)用快速演進(jìn),但對(duì)于強(qiáng)知識(shí)性、重經(jīng)驗(yàn)積累的化工行業(yè)來說,依托現(xiàn)有的通用大模型,設(shè)計(jì)開發(fā)化工垂直領(lǐng)域的AI模型,仍是行業(yè)擁抱AI的重點(diǎn)。
葉茂認(rèn)為,現(xiàn)有的通用大模型相當(dāng)于接受完整通識(shí)教育的“高中生”,學(xué)習(xí)能力很強(qiáng),什么知識(shí)都知道一點(diǎn),但并不太專業(yè)。而通過知識(shí)數(shù)據(jù)訓(xùn)練的專業(yè)模型就相當(dāng)于化工專業(yè)的“本科生”,對(duì)化工知識(shí)的運(yùn)用能力更強(qiáng),但還不能直接去工廠或者設(shè)計(jì)院“上崗”,需要更進(jìn)一步將專業(yè)模型訓(xùn)練為在垂直領(lǐng)域應(yīng)用的智能體模型。
據(jù)介紹,目前中國科學(xué)院大連化學(xué)物理研究所已經(jīng)和華為合作開發(fā)出了面向化工工藝流程研發(fā)的智能化工大模型1.0版本,基本能夠?qū)崿F(xiàn)化工知識(shí)的快速檢索、反應(yīng)動(dòng)力學(xué)的自動(dòng)生成以及工藝流程的制度化設(shè)計(jì),未來還將推出包含三級(jí)工廠生成和智能中試系統(tǒng)的2.0版本。
“不是每個(gè)企業(yè)都要建設(shè)大規(guī)模AI算力,也不是每個(gè)企業(yè)都要訓(xùn)練自己的基礎(chǔ)大模型?!比A為副董事長、輪值董事長徐直軍表示,并非所有的應(yīng)用都要追求“大”。從華為盤古模型在不同行業(yè)的實(shí)踐來看,十億參數(shù)模型可以滿足科學(xué)計(jì)算、預(yù)測(cè)決策等業(yè)務(wù)場(chǎng)景的需求,比如降雨預(yù)測(cè)、藥物分子優(yōu)化、工藝參數(shù)預(yù)測(cè);而百億參數(shù)模型就可以初步滿足面向自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)、多模態(tài)的需求,比如在特定領(lǐng)域場(chǎng)景的知識(shí)問答、代碼生成、安全檢測(cè)。而更加復(fù)雜的,面向NLP、多模態(tài)的任務(wù)如信貸評(píng)估、中樞調(diào)度、智能投資顧問等,可以用千億參數(shù)模型來完成。”
他指出,AI服務(wù)器特別是AI算力集群,對(duì)供電、散熱等數(shù)據(jù)中心機(jī)房環(huán)境要求極高,且隨著大模型越來越大,AI算力也將走向更大規(guī)模,而且變化節(jié)奏快。隨著AI服務(wù)器快速升級(jí)換代,數(shù)據(jù)中心機(jī)房面臨要么浪費(fèi)、要么滿足不了需求的困境。同時(shí),訓(xùn)練出基礎(chǔ)大模型的關(guān)鍵是數(shù)據(jù),而準(zhǔn)備足夠多的高質(zhì)量數(shù)據(jù)是很大挑戰(zhàn)。
“企業(yè)應(yīng)用場(chǎng)景的多樣性,決定了我們必須構(gòu)建起多模態(tài)、多尺寸的模型,實(shí)現(xiàn)場(chǎng)景與模型的最優(yōu)匹配,滿足企業(yè)對(duì)大模型經(jīng)濟(jì)性和專業(yè)性的需求。”華為常務(wù)董事、華為云CEO張平安說。
在實(shí)際應(yīng)用中,通用大模型、專業(yè)大模型、垂直領(lǐng)域大模型并非是簡單的遞進(jìn)關(guān)系,而是需要多種模型互相協(xié)作,構(gòu)成專業(yè)的智能體“團(tuán)隊(duì)”。
中國化工學(xué)會(huì)副秘書長胡杰認(rèn)為,化工行業(yè)實(shí)現(xiàn)智能化需要多模態(tài)大模型與專業(yè)模型協(xié)同進(jìn)化,建立復(fù)雜系統(tǒng)在垂直領(lǐng)域的大模型。具體來說,首先是基于大數(shù)據(jù)的智能方法,以自動(dòng)化策略驅(qū)動(dòng)建立虛擬化學(xué)實(shí)驗(yàn)室;然后借助知識(shí)蒸餾技術(shù),將大模型的能力傳遞給專業(yè)模型;再利用大語言模型獲取多模態(tài)數(shù)據(jù),利用小科學(xué)(專業(yè))模型提高精準(zhǔn)性,由大數(shù)據(jù)生成多個(gè)專業(yè)模型;最后再由專業(yè)模型作為“教師”,幫助大模型快速收斂。
“我們希望未來能夠通過多個(gè)智能體的協(xié)同,承擔(dān)開發(fā)和設(shè)計(jì)工程師的部分功能,快速生成數(shù)字化工廠設(shè)計(jì),并與現(xiàn)有的工廠數(shù)據(jù)進(jìn)行功能對(duì)比?;蛘撸ㄟ^智能體對(duì)數(shù)據(jù)的挖掘和分析,將實(shí)體工廠變成數(shù)字化的虛擬工廠?!比~茂說。