飛象網(wǎng)訊 (一飛/文)大模型落地持續(xù)加速中。
9月5日,騰訊宣布推出新一代大模型“混元Turbo”,相比前代模型,騰訊混元Turbo性能顯著提升,訓(xùn)練效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多個(gè)基準(zhǔn)測(cè)試上對(duì)標(biāo)GPT-4o,且第三方測(cè)評(píng)居國(guó)內(nèi)第一。
目前,混元Turbo已經(jīng)在騰訊云上線,輸入和輸出價(jià)格只有前代模型的一半。企業(yè)和開(kāi)發(fā)者可以通過(guò)API、專屬模型、精調(diào)模型等方式使用混元大模型相關(guān)能力。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,隨著大模型與生成式AI的技術(shù)突破,圖片、視頻、語(yǔ)言的理解與生成已經(jīng)有很大進(jìn)步,人與人的溝通、人與系統(tǒng)的交互方式,都可能會(huì)被重塑。最近半年,產(chǎn)業(yè)界對(duì)AI大模型的關(guān)注重點(diǎn),開(kāi)始從模型技術(shù)本身,轉(zhuǎn)到智能應(yīng)用落地上。用人工智能在已有業(yè)務(wù)場(chǎng)景中降本增效,提高經(jīng)營(yíng)效率,是行穩(wěn)致遠(yuǎn)的可靠路徑。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生
據(jù)介紹,騰訊已經(jīng)構(gòu)建起了全鏈路的大模型產(chǎn)品矩陣,包括底層基礎(chǔ)設(shè)施、幫助企業(yè)訓(xùn)練專屬模型的TI平臺(tái)和行業(yè)大模型解決方案,自研的混元大模型,構(gòu)建應(yīng)用的平臺(tái)工具,以及基于大模型的各類智能應(yīng)用。
會(huì)上,騰訊AI應(yīng)用“元寶”宣布品牌智能體專區(qū)正式上線,企業(yè)在騰訊元器上制作的智能體可以一鍵發(fā)布到品牌智能體專區(qū)。品牌智能體專區(qū)首批邀請(qǐng) 11 家合作伙伴入駐,打造精品AI智能體應(yīng)用生態(tài),涵蓋工作提效和生活?yuàn)蕵?lè)多個(gè)場(chǎng)景,用戶可以直接在“騰訊元寶”APP上體驗(yàn)豐富的品牌智能體應(yīng)用。
“面向場(chǎng)景創(chuàng)造價(jià)值才是大模型發(fā)展的意義。”騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲表示,大模型已經(jīng)在全球發(fā)展了兩年,一方面,模型性能不斷提升,圍繞著模型的產(chǎn)品使用門(mén)檻變得更低、更加易用;另一方面,企業(yè)積極探索大模型與自身業(yè)務(wù)場(chǎng)景的結(jié)合,大模型的落地場(chǎng)景變得更豐富、更縱深。
騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲
吳運(yùn)聲介紹,基于全矩陣的大模型產(chǎn)品,騰訊已經(jīng)服務(wù)了眾多客戶,在知識(shí)管理、智能客服、研發(fā)提效、智能營(yíng)銷、內(nèi)容生成、辦公協(xié)同、風(fēng)險(xiǎn)管控等場(chǎng)景中,幫助企業(yè)實(shí)現(xiàn)了降本增效和業(yè)務(wù)創(chuàng)新。
大模型工具持續(xù)升級(jí),更便捷、更易用
為了讓企業(yè)更快更便捷地開(kāi)發(fā)AI原生應(yīng)用,騰訊云在今年5月推出了三款PaaS產(chǎn)品知識(shí)引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,加速應(yīng)用落地。
通過(guò)大模型知識(shí)引擎,企業(yè)用自然語(yǔ)言和簡(jiǎn)單配置,5分鐘就可以開(kāi)發(fā)出一款大語(yǔ)言模型應(yīng)用,服務(wù)于客服營(yíng)銷、企業(yè)知識(shí)社區(qū)等業(yè)務(wù)場(chǎng)景。經(jīng)過(guò)幾個(gè)月的產(chǎn)品迭代,知識(shí)引擎產(chǎn)品在用戶需求識(shí)別與理解、企業(yè)知識(shí)處理、檢索和理解能力上,都有很大升級(jí)。同時(shí),知識(shí)引擎支持組件能力單獨(dú)輸出,企業(yè)可以按需購(gòu)買(mǎi)文檔解析、文檔拆分、向量化等能力,按需部署到自身的應(yīng)用中去。
在圖像創(chuàng)作引擎層面,基于混元生圖能力的升級(jí),圖像風(fēng)格化、AI寫(xiě)真、商品背景生成、模特?fù)Q裝等功能也進(jìn)一步實(shí)現(xiàn)了迭代。在AI寫(xiě)真層面,圖像創(chuàng)作引擎實(shí)現(xiàn)了免訓(xùn)練技術(shù)突破,輸入一張照片后可直接跳過(guò)訓(xùn)練環(huán)節(jié)等待,一鍵生成高清寫(xiě)真藝術(shù)照,整體出圖耗時(shí)縮短75%。
針對(duì)很多電商商家高頻使用的商品背景生成能力,圖像創(chuàng)作引擎可實(shí)現(xiàn)商品在不同場(chǎng)景中高度逼真的虛擬效果展示。在模特?fù)Q裝場(chǎng)景下,采用3D先驗(yàn)方案,提升重建人像效果,在高度保持模特臉部、手部細(xì)節(jié)的同時(shí),精確將服裝版型細(xì)節(jié)與模特身體特征對(duì)齊,確保換裝后的效果逼真自然。
基于混元的DiT架構(gòu)模型,視頻創(chuàng)作引擎也迎來(lái)了全新的升級(jí)。新增了圖片跳舞、圖片唱演和視頻轉(zhuǎn)譯等能力,已經(jīng)實(shí)現(xiàn)了單段舞蹈的生成時(shí)間從10分鐘下降至1分鐘級(jí)別,同時(shí)支持轉(zhuǎn)身、側(cè)身等難例舞蹈動(dòng)作。同時(shí),針對(duì)很多客戶有需求的視頻轉(zhuǎn)譯能力,視頻引擎接入了混元文生文大模型和 TTS 技術(shù),讓轉(zhuǎn)譯后的視頻能夠保留說(shuō)話人的音色特征,同時(shí)實(shí)現(xiàn)說(shuō)話人口型與目標(biāo)語(yǔ)種一致的視聽(tīng)效果。目前視頻轉(zhuǎn)譯功能支持超過(guò)15種小語(yǔ)種,覆蓋主流外語(yǔ)翻譯,可應(yīng)用于視頻本地化、跨境電商等場(chǎng)景。
為了幫助企業(yè)用戶更便捷地打造專屬模型,人工智能開(kāi)發(fā)平臺(tái)TI平臺(tái)也進(jìn)行了全新升級(jí)。
TI平臺(tái)致力于構(gòu)建面向?qū)崙?zhàn)的大模型精調(diào)工具鏈,幫助用戶訓(xùn)練出真正可用的大模型,并縮短模型開(kāi)發(fā)周期,提升研發(fā)效率與資源利用率。
高質(zhì)量的訓(xùn)練數(shù)據(jù)是精調(diào)出一個(gè)可落地大模型的前提條件。TI 平臺(tái)的多模態(tài)數(shù)據(jù)集管理和數(shù)據(jù)標(biāo)注能力,可提升大模型精調(diào)的數(shù)據(jù)準(zhǔn)備效率和訓(xùn)練數(shù)據(jù)質(zhì)量,從而提升大模型訓(xùn)練效率和最終效果。
在精調(diào)數(shù)據(jù)準(zhǔn)備層面,TI平臺(tái)全新支持面向多模態(tài)大模型的數(shù)據(jù)集管理和數(shù)據(jù)標(biāo)注,首創(chuàng)了基于Schema的標(biāo)注方法,支持用戶自動(dòng)生成個(gè)性化標(biāo)注工作臺(tái),支持文生文、圖生文、圖文改寫(xiě)、圖文混合問(wèn)答等主流場(chǎng)景下的全部細(xì)分任務(wù)類型。
落地加速,場(chǎng)景創(chuàng)新更豐富、更縱深
大模型要貼近場(chǎng)景創(chuàng)造價(jià)值已經(jīng)是業(yè)界的共識(shí)。騰訊目前已經(jīng)有700多款產(chǎn)品接入混元大模型,實(shí)現(xiàn)用戶體驗(yàn)的提升。騰訊全矩陣的大模型產(chǎn)品目前已經(jīng)在知識(shí)管理、智能客服、研發(fā)提效、智能營(yíng)銷、內(nèi)容生成、辦公協(xié)同、風(fēng)險(xiǎn)管控等落地。
在智能客服與知識(shí)管理場(chǎng)景中,基于大模型的生成能力,可以顯著提升復(fù)雜問(wèn)題的解決效率,提升回答質(zhì)量。長(zhǎng)安汽車與騰訊利用大模型知識(shí)引擎,整合汽車使用手冊(cè)等資料,有效解決了客戶在車輛使用和維護(hù)中的疑問(wèn),顯著提升了客戶服務(wù)體驗(yàn)。
在智能營(yíng)銷場(chǎng)景,大模型可以提升廣告素材的生產(chǎn)效率,增強(qiáng)營(yíng)銷活動(dòng)的趣味性和互動(dòng)性。比如蒙牛集團(tuán)利用圖生圖技術(shù),將用戶上傳的全家福轉(zhuǎn)化生成為特制的卡通畫(huà)風(fēng),助力會(huì)員拉新、提升用戶活躍。
在內(nèi)容創(chuàng)意場(chǎng)景,大模型可以讓內(nèi)容生產(chǎn)的周期大幅縮短,提供更多的創(chuàng)意玩法。比如,人民日?qǐng)?bào)、新華社等媒體結(jié)合混元的文生視頻能力進(jìn)行視頻創(chuàng)作。過(guò)去,視頻內(nèi)容需要一幀幀進(jìn)行設(shè)計(jì)和制作,制作周期短則數(shù)天,長(zhǎng)則數(shù)月,F(xiàn)在借助視頻生成能力,只需一段文字或者幾張圖片,就能在幾分鐘內(nèi)生成優(yōu)質(zhì)視頻內(nèi)容。
在研發(fā)提效領(lǐng)域,騰訊利用TI平臺(tái)等工具,幫助易車、閱文等企業(yè)搭建自己的大模型,顯著降低了模型構(gòu)建的時(shí)間和成本;另一方面,通過(guò)騰訊云AI代碼助手等工具,輔助開(kāi)發(fā)者提升研發(fā)的效率,幫助企業(yè)提升整體研發(fā)效能。
在辦公協(xié)同場(chǎng)景中,騰訊旗下的企業(yè)微信、騰訊會(huì)議、騰訊文檔都已經(jīng)接入了混元大模型。在大模型的助力下,企業(yè)微信可對(duì)英文郵件進(jìn)行智能檢查,輔助英文郵件糾錯(cuò),騰訊會(huì)議可以自動(dòng)總結(jié)會(huì)議紀(jì)要,騰訊文檔能夠自動(dòng)生成各類文檔。
在風(fēng)險(xiǎn)管控領(lǐng)域,風(fēng)控大模型可以解決傳統(tǒng)風(fēng)控中建模時(shí)間長(zhǎng)、效率低的難題。通過(guò)打包豐富的反欺詐知識(shí),實(shí)現(xiàn)“小樣本”訓(xùn)練遷移,快速構(gòu)建契合業(yè)務(wù)需求的風(fēng)控模型體系。比如,東風(fēng)日產(chǎn)汽車金融,基于少量提示樣本遷移,就完成了適配自身業(yè)務(wù)場(chǎng)景的風(fēng)控模型定制。相比于傳統(tǒng)的建模方式,模型KS性能提升超過(guò)20%,在跨場(chǎng)景的泛化性測(cè)試上性能提升53%。