華為盤古模型能帶來什么
大模型開始“卷”起來了。
去年年底,ChatGPT往喧囂已久卻未有波瀾的AI“湖面”投擲了一枚“石頭”,僅用2個月時間就收獲了1億用戶。
當(dāng)學(xué)生用其寫論文、程序員讓其輔助生成代碼,甚至作為小編的我都借助ChatGPT起標(biāo)題時,AI大模型如綿綿細(xì)雨無聲地融入了我們的日常生活。
“一石激起千層浪。”忽然間,國內(nèi)的大模型如雨后春筍般興旺起來。當(dāng)3月份辦公室還在“馬冬梅”般討論著百度的大模型究竟是“文言一心”還是“文心一言”時,4月份阿里巴巴的“通義千問”,5月份科大訊飛的“星火認(rèn)知”、科學(xué)院的“紫東太初2.0”又席卷而來。
近日,在聯(lián)通官宣了“鴻湖”大模型后,電信也聲稱將要發(fā)布 “TeleChat”大模型,移動的“九天”1+N大模型也在“蠢蠢欲動”。連運(yùn)營商都開始進(jìn)軍大模型了,難道說大模型賽道真的成為互聯(lián)網(wǎng)領(lǐng)域的“兵家必爭之地”了嗎?
今日,華為也開始發(fā)布了盤古大模型3.0。盡管業(yè)界大模型層出不窮,但從注冊“盤古”“PANGU”商標(biāo)專利,到爆料又辟謠盤古大模型稱“盤谷Chat”,華為大模型的一舉一動仍是受到了業(yè)界的關(guān)注。
其實(shí),華為從2020年就開始立項(xiàng)大模型研究,在2021年4月也就是前兩年的HDC大會上,華為就發(fā)布了盤古NLP大模型1.0和盤古視覺大模型。當(dāng)時,時任華為云CEO的余承東還給予了“華為云盤古大模型是一款在AI產(chǎn)業(yè)界非常、非常、非常震撼的產(chǎn)品”重要事情說三遍的稱贊。
2021年的盤古NLP大模型,不僅是業(yè)內(nèi)首個千億參數(shù)的中文大模型,而且在預(yù)訓(xùn)練階段學(xué)習(xí)了超過40TB行業(yè)文本數(shù)據(jù)和400萬小時的行業(yè)語音數(shù)據(jù),具有1100億參數(shù)。在大模型中,參數(shù)占有重要的分量。所謂的AI大模型就是將海量數(shù)據(jù)導(dǎo)入具有億量級參數(shù)的模型中,機(jī)器通過完成類似“完形填空”的任務(wù)后,終被訓(xùn)練成具有邏輯推理和分析能力的人工智能。目前大模型參數(shù)均在千萬億級別,GPT-3擁有1750億參數(shù)(即175B)。而后,在2021年5月,大版本參數(shù)量達(dá)2000億的“鵬程·盤古”大模型也重磅亮相,2021年的盤古大模型著實(shí)稱得上“厚積薄發(fā)”。
同時,2021年的盤古視覺(CV)大模型也是一個超30億參數(shù)的CV大模型。在預(yù)訓(xùn)練時就輸入了10億級圖像,能夠同時滿足底層圖像處理與高層語義的理解需求。
此后,華為又相繼推出了盤古科學(xué)計算大模型、用于藥物研發(fā)細(xì)分場景的大模型、盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型等。
就在華為正式發(fā)布盤古大模型3.0的前一天,又一個重磅的新聞刷屏——華為云盤古氣象大模型研究成果在《Nature》正刊發(fā)表。據(jù)了解,此模型是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI模型,速度相比傳統(tǒng)數(shù)值預(yù)報提速10000倍以上。這篇論文是近年來科技公司作為署名單位發(fā)表的《自然》正刊論文,《Nature》審稿人也對該成果給予高度評價。這一喜報又為盤古大模型3.0的發(fā)布平添了一份期待。
“千呼萬喚始出來”。今日,華為常務(wù)董事、華為云CEO張平安正式發(fā)布了華為盤古大模型3.0。面對大模型“神仙打架”的現(xiàn)狀,他談道:“自O(shè)penAI發(fā)布ChatGPT以來,各種大模型層出不窮,百家齊放。據(jù)不完全統(tǒng)計,全球已發(fā)布數(shù)百個大模型,僅在就發(fā)布了80多個。有些大模型會寫詩、會作畫。但華為盤古大模型不作詩、只做事,因?yàn)樗钊氲礁餍懈鳂I(yè)中去,賦能各行各業(yè)創(chuàng)造價值。”
華為對應(yīng)基礎(chǔ)大模型、行業(yè)大模型和細(xì)分場景大模型分為L0、L1和L2層。據(jù)張平安介紹,盤古大模型3.0是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu),其中,“5”指的是L0層的自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計算這5個基礎(chǔ)大模型;“N”是指L1層的N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型。也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓(xùn)練自己的專有大模型;“X”則表示L2層為客戶提供了更多細(xì)化場景的模型,提供無限“X”的可能性,L2更加專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景,為客戶提供“開箱即用”的模型服務(wù)。
值得一提的是,盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求。客戶既可以為自己的大模型加載獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級基礎(chǔ)模型,也可以單獨(dú)升級能力集。在L0和L1大模型的基礎(chǔ)上,華為云還為客戶提供了大模型行業(yè)開發(fā)套件,通過對客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。同時,根據(jù)客戶不同的數(shù)據(jù)安全與合規(guī)訴求,盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。
目前,盤古大模型已在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮著巨大價值。在政務(wù)領(lǐng)域,華為云攜手深圳市福田區(qū)政務(wù)服務(wù)數(shù)據(jù)管理局,上線了基于盤古政務(wù)大模型的福田政務(wù)智慧助手小福,能夠精準(zhǔn)理解民眾咨詢意圖,改變傳統(tǒng)的一網(wǎng)通辦模式,把老百姓的話語轉(zhuǎn)化為政府辦事的語言,讓城市更有愛;在煤礦領(lǐng)域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個細(xì)分場景,讓更多的煤礦工人能夠在地面上作業(yè),不僅能讓煤礦工人的工作環(huán)境更加舒適,而且可以極大地減少安全事故;在藥物研發(fā)領(lǐng)域,原來一款新藥研發(fā)平均需要10年時間、花費(fèi)10億美金。盤古藥物分子大模型助力西安交通大學(xué)附屬醫(yī)院劉冰教授團(tuán)隊發(fā)現(xiàn)全球40年來首個新靶點(diǎn)、新類別的抗生素,并將先導(dǎo)藥物研發(fā)周期縮短至1個月、研發(fā)成本降低70%……
“盤古為行業(yè)而生,就要為行業(yè)著想,更好地服務(wù)千行百業(yè)的客戶。”張平安表示,盤古大模型要讓每個行業(yè)、每個企業(yè)、每個人都擁有自己的專家助手,讓工作更高效更輕松。我們始終堅持AI for Industries的戰(zhàn)略,在深耕行業(yè)的道路上不斷前行。我堅信大模型將重塑千行百業(yè),而每一個開發(fā)者,都將是改變世界的英雄。
(AM 8:00-12:00 PM 14:00-18:00)