亚洲国产高清在线观看视频_日韩欧美国产aⅴ另类_奇米影视7777久久精品_欧美 国产 亚洲 卡通 综合

您的位置:首頁(yè) > 財(cái)經(jīng) >

商湯“商量SenseChat 2.0”多個(gè)評(píng)測(cè)基準(zhǔn)綜合表現(xiàn)超GPT-3.5水平-世界看點(diǎn)


(資料圖片僅供參考)


近日,商湯科技公布了自研中文語(yǔ)言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三個(gè)權(quán)威大語(yǔ)言模型評(píng)測(cè)基準(zhǔn)的成績(jī)。

根據(jù)評(píng)測(cè)結(jié)果,“商量SenseChat 2.0”在三個(gè)測(cè)試集中表現(xiàn)均領(lǐng)先ChatGPT(即GPT-3.5),部分已十分接近GPT4的水平。實(shí)現(xiàn)了我國(guó)語(yǔ)言大模型研究的重要突破。

以MMLU為例,該測(cè)試是由美國(guó)加州大學(xué)伯克利分校、哥倫比亞大學(xué)、芝加哥大學(xué)及伊利諾伊大學(xué)厄巴納-香檳分校聯(lián)合打造的大規(guī)模多任務(wù)語(yǔ)言理解的評(píng)測(cè)基準(zhǔn),涵蓋了科學(xué)、技術(shù)、工程、數(shù)據(jù),人文、社會(huì)科學(xué)等領(lǐng)域的57個(gè)科目,難度從初級(jí)水平到高級(jí)專業(yè)水平,考驗(yàn)世界知識(shí)和解決問(wèn)題的能力。

在該評(píng)測(cè)中,“商量SenseChat 2.0”綜合得分為68.6,遠(yuǎn)超GLM-130B(45.7分)的得分,同時(shí)還超過(guò)了ChatGPT(67.3分)、LLaMA-65B(63.5分)僅落后GPT-4(86.4分),位居第二。在各主要子評(píng)測(cè)集中的表現(xiàn)如下:

今年4月,商湯正式發(fā)布“商湯日日新SenseNova”大模型體系以及自研中文語(yǔ)言大模型“商量SenseChat”。截至6月,全球范圍內(nèi)正式發(fā)布的大語(yǔ)言模型已超過(guò)40款,其中由中國(guó)廠商、高校、科研院所等發(fā)布的大語(yǔ)言模型近20款。

截至目前,已有近千家企業(yè)客戶通過(guò)申請(qǐng),應(yīng)用和體驗(yàn)“商量SenseChat 2.0”超強(qiáng)的長(zhǎng)文本理解、邏輯推理、多輪對(duì)話、情感分析、內(nèi)容創(chuàng)作、代碼生成等綜合能力,并且“商量SenseChat 2.0”還在服務(wù)客戶過(guò)程中,持續(xù)實(shí)現(xiàn)著快速迭代和提升,以及知識(shí)的實(shí)時(shí)更新。

(文章來(lái)源:上海證券報(bào)·中國(guó)證券網(wǎng))

標(biāo)簽:

相關(guān)閱讀

朝阳区| 湘潭市| 治县。| 应用必备| 苏尼特右旗| 宣武区| 顺义区| 大埔区| 峨山| 新河县| 诸暨市| 余庆县| 盘锦市| 临西县| 和顺县| 定日县| 任丘市| 多伦县| 通化市| 乐平市| 鄄城县| 汨罗市| 土默特左旗| 临沂市| 六安市| 平罗县| 潍坊市| 宜宾县| 连江县| 措美县| 龙里县| 南皮县| 达拉特旗| 平阳县| 永新县| 明光市| 罗江县| 贡觉县| 寿光市| 贵州省| 吴川市|