“自研+開(kāi)源”雙引擎降低AIGC使用門(mén)檻 商湯秒畫(huà)瞄準(zhǔn)B端用戶|天天新視野
在此前的商湯技術(shù)交流日上,商湯公布了前沿的人工智能“日日新SenseNova”大模型體系,基于該體系的AI內(nèi)容創(chuàng)作社區(qū)平臺(tái)“商湯秒畫(huà)SenseMirage”也一并亮相。
(相關(guān)資料圖)
值得注意的是,對(duì)于有進(jìn)階需求的模型創(chuàng)作者,秒畫(huà)平臺(tái)也可支持自行上傳數(shù)據(jù)集進(jìn)行finetune、自訓(xùn)練等功能,定制訓(xùn)練屬于自己風(fēng)格的LoRA模型?;诂F(xiàn)有商湯自研的文生圖模型的高度泛化性,B端用戶只需要拖拽20張左右的圖片作為訓(xùn)練集,最少僅需5分鐘就能完成一個(gè)高質(zhì)量模型的訓(xùn)練,顯著降低模型的訓(xùn)練門(mén)檻。
商湯集團(tuán)智慧決策與游戲事業(yè)部總經(jīng)理兼高級(jí)研究總監(jiān)劉宇介紹,商湯的平臺(tái)想做的是集模型、訓(xùn)練、推理和交流的一體化社區(qū),相比于目前市面上直接去做純文字到圖像生成的產(chǎn)品,在目標(biāo)和方向上有較大差別。
“自研+開(kāi)源”共筑秒畫(huà)差異化優(yōu)勢(shì)
“我們的核心競(jìng)爭(zhēng)力應(yīng)該在于我們打包了商湯自研的大模型、模型訓(xùn)練跟推理的加速,以及我們整個(gè)底層的專(zhuān)利,對(duì)于用戶來(lái)說(shuō),使用、體驗(yàn)的友好度都較好?!?/p>
在此前的商湯技術(shù)交流日上,商湯公布了前沿的人工智能研發(fā)成果“日日新SenseNova”大模型體系,以及基于該模型體系的多款A(yù)I應(yīng)用產(chǎn)品。
商湯科技董事長(zhǎng)兼CEO徐立在現(xiàn)場(chǎng)演示了“商湯秒畫(huà)SenseMirage”基于商湯自研AIGC模型的作畫(huà)能力,也介紹了秒畫(huà)平臺(tái)基于商湯大裝置的GPU算力支撐,可幫助用戶免除本地化部署流程,既能使用商湯自研作畫(huà)模型高效地生成高質(zhì)量?jī)?nèi)容,也可以將本地模型及其他第三方開(kāi)源模型一鍵導(dǎo)入,生成更多樣的內(nèi)容。
同時(shí),在市場(chǎng)AIGC產(chǎn)品普遍主打的文生圖能力之外,秒畫(huà)主要瞄準(zhǔn)B端用戶,提供特異性推理優(yōu)化服務(wù),用戶將開(kāi)源模型導(dǎo)入后會(huì)自動(dòng)采用秒畫(huà)底層的模型編譯技術(shù)進(jìn)行加速,實(shí)測(cè)在本地RTX3070顯卡需要10秒生成的圖片通過(guò)秒畫(huà)加速技術(shù)只需要2秒的推理時(shí)間就可以生成。
此外,秒畫(huà)還支持用戶上傳本地圖像,結(jié)合商湯自研作畫(huà)模型或者開(kāi)源模型來(lái)訓(xùn)練定制化LoRA模型,高效地生成個(gè)性化內(nèi)容。
商湯集團(tuán)智慧決策與游戲事業(yè)部總經(jīng)理兼高級(jí)研究總監(jiān)劉宇表示,除了商湯自研的文生圖能力,秒畫(huà)平臺(tái)還支持導(dǎo)入第三方的模型,并且能提供特異性加速功能,這也展示了商湯對(duì)于開(kāi)源模型的加速能力。
通過(guò)“自研+開(kāi)源”的模式,商湯的秒畫(huà)平臺(tái)將徹底區(qū)別于市面上現(xiàn)有的文生圖產(chǎn)品,拓展用戶服務(wù)的邊界。基于秒畫(huà),用戶在簡(jiǎn)單的文生圖功能之外,也能夠基于商湯的基模型,更低門(mén)檻地對(duì)自有小模型進(jìn)行訓(xùn)練、加速。
劉宇也表示,首先從產(chǎn)品層面來(lái)講,秒畫(huà)與市面上其他產(chǎn)品相比,AI繪圖只是其功能之一,“我們想做的事可能跟他們不太一樣,我們并不是想做一個(gè)輸入一句話,就能生成一張圖的功能。因?yàn)檫@種功能的商業(yè)價(jià)值并不是非常的大和完備,我們想做的是一個(gè)平臺(tái)?!?/p>
從平臺(tái)角度看,劉宇認(rèn)為,秒畫(huà)具有三大核心能力。首先是來(lái)自商湯本身的自研大模型,除了文生圖能力之外,商湯更希望幫助用戶能夠基于商湯本身強(qiáng)大的平臺(tái)算力及大模型能力,去微調(diào)用戶自己的大模型,“從長(zhǎng)期的商業(yè)價(jià)值上看,我們更想去給小B或者大B端客戶提供更強(qiáng)的基模型,使得他們能夠在自有領(lǐng)域基于商湯的基礎(chǔ)模型產(chǎn)生更好的垂類(lèi)大模型,去產(chǎn)生他們的商業(yè)價(jià)值?!?/p>
秒畫(huà)的另一個(gè)優(yōu)勢(shì)則來(lái)自商湯自身強(qiáng)大的算力能力。劉宇介紹,基于商湯本身的算力能力,秒畫(huà)作為一個(gè)平臺(tái),用戶能夠選擇使用商湯的模型、自訓(xùn)練的模型,或開(kāi)源模型,同時(shí),秒畫(huà)將為用戶提供模型特異性加速服務(wù),通過(guò)秒畫(huà)平臺(tái)的模型編譯技術(shù),自動(dòng)分析用戶上傳的模型結(jié)構(gòu)參數(shù),把它和底層的GPU加速算子進(jìn)行模型編譯,縮短模型的生成速度?!斑@是我們平臺(tái)的第二大優(yōu)勢(shì),也是商湯的傳統(tǒng)優(yōu)勢(shì),我們?cè)诖竽P偷叫∧P偷耐屏铀俜矫嬗蟹浅I詈竦募夹g(shù)積累?!眲⒂畋硎?。
另外,商湯希望基于開(kāi)源功能打造模型社區(qū)。“開(kāi)源界現(xiàn)在有很多的討論,像AI作畫(huà)的模型,很多都是基于之前的模型去微調(diào)出來(lái)的?!眲⒂罱榻B,商湯想整合、健全目前相對(duì)復(fù)雜的AI作畫(huà)社區(qū),未來(lái)基于秒畫(huà)平臺(tái),用戶可以利用商湯的基模型或基于其他前置模型訓(xùn)練自有模型,平臺(tái)內(nèi)部都會(huì)保留模型的依賴(lài)鏈條,進(jìn)而保障原始模型作者的權(quán)益。
大模型+大算力超前布局
各家對(duì)于AIGC的競(jìng)逐趨于白熱化,商湯的壁壘來(lái)自哪里?
劉宇認(rèn)為,大模型要足夠好有三個(gè)核心要素,首先是模型參數(shù)量要夠大能保證泛化上限足夠高,二是在同等參數(shù)量下,網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)要足夠高效。“怎么保證在同等大的體量下,我們的模型能夠比其他的大模型性能要強(qiáng),這需要我們?cè)诖竽P蜕窠?jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)上做很多的工作?!?/p>
第三,大模型的訓(xùn)練穩(wěn)定性需要被保障,劉宇介紹,“特別大的模型在優(yōu)化上有一個(gè)非常嚴(yán)重的問(wèn)題,當(dāng)這個(gè)模型特別大,訓(xùn)練一個(gè)任務(wù)所需要的GPU就會(huì)非常多(上千張的時(shí)候),訓(xùn)練的穩(wěn)定性就會(huì)變差,具體體現(xiàn)在大模型的收斂性、模型+數(shù)據(jù)3D并行的系統(tǒng)效率和千卡通信的穩(wěn)定性上?!倍虦呀?jīng)在大模型方面有非常多的技術(shù)積累,使得包括秒畫(huà)在內(nèi)的AIGC大模型,能夠在一個(gè)很長(zhǎng)的周期內(nèi),保持平穩(wěn)訓(xùn)練狀態(tài),進(jìn)而保證模型訓(xùn)練的效率。
算法、算力、數(shù)據(jù),如今已經(jīng)成為人工智能領(lǐng)域的寶藏,而商湯的布局則更加前瞻。這也是商湯如今在大模型領(lǐng)域快速建立差異化優(yōu)勢(shì)的核心原因。
在算力層面,2018年開(kāi)始,商湯在自建算力中心的基礎(chǔ)上,打造了SenseCore商湯AI大裝置的“原型機(jī)”,開(kāi)始攻克算力難題。到2020年,商湯再度斥資56億元,在上海臨港建設(shè)AIDC人工智能計(jì)算中心。2022年1月,AIDC正式開(kāi)始運(yùn)營(yíng)。
目前,商湯SenseCore AI大裝置持續(xù)擴(kuò)建,完成了2.7萬(wàn)塊GPU的部署并實(shí)現(xiàn)了5.0 exaFLOPS的算力輸出能力,以AI-as-a Service(AIaaS)的模式面向行業(yè)伙伴提供服務(wù)。目前最多可支持20個(gè)千億參數(shù)量大模型(以千卡并行)同時(shí)訓(xùn)練,最高可支持萬(wàn)億參數(shù)超大模型的訓(xùn)練。
基于商湯自研的AI大裝置,在大模型站上風(fēng)口之前,商湯對(duì)于大模型的推理部署、增量訓(xùn)練已經(jīng)是其常規(guī)業(yè)務(wù)。目前,商湯大模型的推理部署可以將推理的效率提升100%以上;基于大裝置,商湯將大模型微調(diào)的成本降低至原來(lái)的1/10。
未來(lái),大裝置有望成為人工智能大模型時(shí)代的重要基礎(chǔ)設(shè)施。扎根“大模型+大裝置”的技術(shù)路徑,商湯在這一輪AIGC機(jī)遇來(lái)臨時(shí),也更加得心應(yīng)手。
顯著降低B端使用門(mén)檻
商湯正在加速向其“賦能百業(yè)”的愿景靠近,AIGC時(shí)代,包括秒畫(huà)在內(nèi)的系列平臺(tái),將成為其中的重要一環(huán)。
劉宇認(rèn)為,秒畫(huà)是一個(gè)更快且效果更好的基模型,同時(shí)商湯更進(jìn)一步,為B端用戶提供SaaS和API的推理服務(wù)。“基于秒畫(huà)平臺(tái)的推理、特異性加速模型編譯技術(shù)和商湯大算力的基礎(chǔ)設(shè)施,服務(wù)下游的客戶,把我們的推理能力和模型能力用在它的垂類(lèi)里面,這是我們的一個(gè)愿景?!眲⒂畋硎?。
從秒畫(huà)目前建立的差異化優(yōu)勢(shì)來(lái)看,秒畫(huà)對(duì)于B端用戶而言,將是一個(gè)更加“友好”的AIGC平臺(tái),這也意味著商湯面臨的商業(yè)化前景將更加明朗。
在企業(yè)數(shù)字化轉(zhuǎn)型的過(guò)程中,中小企業(yè)面臨的數(shù)字化門(mén)檻成為其轉(zhuǎn)型的阻礙之一。劉宇認(rèn)為,商湯提供的秒畫(huà)等平臺(tái),核心目的就是為了降低AIGC和大模型的微調(diào)訓(xùn)練門(mén)檻,讓技術(shù)能夠在不具有這么多GPU或者甚至不具有這類(lèi)專(zhuān)業(yè)知識(shí)的中小B端的廠商、用戶里產(chǎn)生價(jià)值。
劉宇介紹,去年商湯在AIGC層面已經(jīng)有非常多的B端用戶,“當(dāng)時(shí)更多的是他們給需求,我們給他定制化,用商湯的技術(shù)能力和集成訓(xùn)練模型交付給他們,這也是AI平臺(tái)型行業(yè)的傳統(tǒng)做法?!眲⒂畋硎?,“現(xiàn)在商湯希望能夠通過(guò)秒畫(huà)這樣的平臺(tái),讓用戶自身可以以更低的門(mén)檻,不需要采購(gòu)GPU、不需要技術(shù)的理解和能力,僅僅通過(guò)一個(gè)網(wǎng)站的UI就可以生產(chǎn)自己的模型做推理部署?!?/p>
成本層面,劉宇算了一筆賬,用最小的訓(xùn)練大模型的硬件加上研究員的人力成本來(lái)計(jì)算,“基于生成質(zhì)量相對(duì)較差的開(kāi)源大模型,然后招一個(gè)研究員,買(mǎi)上幾臺(tái)服務(wù)器把它訓(xùn)練成企業(yè)自己的模型,至少應(yīng)該百萬(wàn)以上的成本。但是如果利用商湯的平臺(tái),在數(shù)據(jù)一致的情況下,可能就只需要付出幾千甚至幾百元的成本,就可以得到一個(gè)相同甚至更好的模型。”
劉宇認(rèn)為,商湯的產(chǎn)品從使用門(mén)檻和資金成本門(mén)檻上,都對(duì)B端用戶有了一個(gè)非常大的體驗(yàn)上的飛躍。
浙商證券認(rèn)為,以“秒畫(huà)”為例,產(chǎn)品實(shí)現(xiàn)了2秒出圖,不需要額外編程和調(diào)試,用戶可自定義生成圖片的數(shù)量、分辨率、長(zhǎng)寬比等,生成效果優(yōu)越,整體體驗(yàn)可對(duì)標(biāo)Midjourney?!拔覀冋J(rèn)為,商湯因其發(fā)展歷史和業(yè)務(wù)特點(diǎn),在CV領(lǐng)域擁有行業(yè)領(lǐng)先地位,是其跨模態(tài)模型三維化表現(xiàn)超預(yù)期的核心原因,可將其與文心一言等產(chǎn)品區(qū)別開(kāi)來(lái)。”
在算力、算法等核心能力層面,商湯優(yōu)勢(shì)明顯,對(duì)于商湯而言,通過(guò)“大模型+大算力”提供解決方案,能夠吸引更多下游用戶投入模型迭代,也有助于商湯進(jìn)一步積累相關(guān)數(shù)據(jù),提升產(chǎn)品迭代速率與產(chǎn)品體驗(yàn),進(jìn)而加速商業(yè)化布局,反哺公司業(yè)績(jī)。
(文章來(lái)源:每日經(jīng)濟(jì)新聞)
標(biāo)簽: