華為盤古大模型將于 7 月 7 日在開發(fā)者大會上公布重大升級
IT之家 6 月 26 日消息,此前市場有消息稱華為大模型“盤古 Chat”已申請相關商標,將于 7 月 7 日發(fā)布。對此,華為官方表示華為不會有“盤古 Chat”此類命名,也不“對標”業(yè)界產(chǎn)品。
現(xiàn)在,華為開發(fā)者大會 2023(Cloud)主題演講議程正式公布,其中顯示華為云盤古大模型將迎來重大升級。
(資料圖片僅供參考)
華為開發(fā)者大會 2023 (Cloud ) 大會將于 7 月 7 日在東莞拉開帷幕,同時在全球 10 余個國家,及中國 30 多個城市設有分會場,有條件的用戶可以買票前往現(xiàn)場進行觀摩。
華為開發(fā)者大會 2023(Cloud)主題演講議程顯示,華為常務董事、華為云 CEO 張平安將帶來“一切皆服務,AI 重塑千行百業(yè)”主題演講。華為云 EI 服務產(chǎn)品部部長尤鵬、華為云人工智能領域首席科學家田奇、華為諾亞方舟實驗室主任姚駿也將圍繞盤古大模型發(fā)表主題演講。
據(jù)介紹,盤古大模型將首次明確定位,即“為行業(yè)而生”;盤古基礎大模型的全棧創(chuàng)新和行業(yè)大模型的“煉成術(shù)”也將首次對外公布。
IT之家查詢公開資料獲悉,華為盤古系列基礎大模型于 2021 年正式對外發(fā)布,包括 NLP(自然語言處理)、CV(機器視覺)和科學計算大模型;后續(xù)又發(fā)布了礦山、藥物分子、氣象、海浪等行業(yè)大模型。
據(jù)介紹,NLP 是首個千億參數(shù)中文預訓練大模型,CV 大模型則首次達到 30 億參數(shù)。盤古 CV 大模型業(yè)界最大 CV 大模型、首次實現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學習能力上的業(yè)界第一;盤古氣象大模型提供秒級天氣預報;紫東.太初是全球首個圖、文、音三模態(tài)大模型。
對于盤古大模型定位,華為內(nèi)部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡結(jié)構(gòu)要強,能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
華為云官網(wǎng)顯示,盤古大模型由 NLP 大模型、CV 大模型、多模態(tài)大模型、科學計算大模型等多個大模型構(gòu)成,通過模型泛化,解決傳統(tǒng) AI 作坊式開發(fā)模式下不能解決的 AI 規(guī)?;?、產(chǎn)業(yè)化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統(tǒng)等等。
華為表示,盤古 NLP 大模型由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā),具備領先的語言理解和模型生成能力:在權(quán)威的中文語言理解評測基準 CLUE 榜單中,盤古 NLP 大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分 83.046,多項子任務得分業(yè)界領先,向人類水平(85.61)邁進了一大步。
具體來看,盤古 NLP 大模型首次使用 Encoder-Decoder 架構(gòu),兼顧 NLP 大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。下游應用中,僅需少量樣本和可學習參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配,這一模型在智能輿論以及智能營銷方面都有不錯的表現(xiàn)。
標簽: