2023年密集升級(jí)后,國(guó)內(nèi)大廠大模型的迭代節(jié)奏轉(zhuǎn)為小步快跑。5月9日,阿里云CTO周靖人揭開(kāi)了最新版大模型通義千問(wèn)2.5的面紗,并系統(tǒng)性披露了阿里云AI應(yīng)用的一系列新進(jìn)展。
站在C(用戶(hù))端角度,抖音旗下AIGC應(yīng)用豆包的月活用戶(hù)排名第一,且數(shù)據(jù)已拉開(kāi)差距。B端競(jìng)爭(zhēng)更加劍拔弩張,閉源開(kāi)源孰優(yōu)孰劣的背后是大模型技術(shù)、成本、商業(yè)化、生態(tài)的比拼,阿里云用1100億參數(shù)的開(kāi)源大模型證明自己的誠(chéng)意,3%的營(yíng)收同比增幅也實(shí)實(shí)在在地反映了阿里云的瓶頸。
新版本
和上線通義千問(wèn)2.1版本相比,阿里云這次公布2.5版本要高調(diào)得多!斑@個(gè)版本代表了全方位的能力提升”,周靖人用理解能力、邏輯推理、指令遵循、代碼能力舉例,2.5版本較2.1版本分別提升9%、16%、19%、10%。
將時(shí)間拉長(zhǎng),2023年4月通義大模型啟動(dòng)邀請(qǐng)測(cè)試,一年間行業(yè)發(fā)生的變化讓從業(yè)者都倍感驚訝。
在周靖人看來(lái),目前整個(gè)技術(shù)體系的發(fā)展在一個(gè)快速上升的渠道,不過(guò)目前市面上的大模型工具都還有提升空間。
為了證明自己的大模型能力,阿里云和同行的操作一致——援引評(píng)測(cè)結(jié)果:在權(quán)威基準(zhǔn)OpenCompass上,通義千問(wèn)2.5得分追平GPT-4 Turbo;通義千問(wèn)視覺(jué)理解模型Qwen-VL-Max在多個(gè)多模態(tài)標(biāo)準(zhǔn)測(cè)試中超越Gemini Ultra和GPT-4V,目前已在多家企業(yè)落地應(yīng)用;通義千問(wèn)代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手,是智能編碼助手通義靈碼的底座。
按照通義千問(wèn)官網(wǎng)的歸納,其基于大模型的服務(wù)共有10項(xiàng),包括大模型服務(wù)平臺(tái)阿里云百煉、AI閱讀助手通義智文、剛發(fā)布企業(yè)版的通義靈碼等。企業(yè)客戶(hù)和開(kāi)發(fā)者可以通過(guò)API(應(yīng)用程序編程接口)調(diào)用、模型下載等方式接入通義,個(gè)人用戶(hù)可從通義App、官網(wǎng)和小程序免費(fèi)使用通義家族全棧服務(wù)。
N合一
這些垂直領(lǐng)域的產(chǎn)品也在不斷調(diào)整。5月9日,“通義千問(wèn)App”更名為“通義App”。升級(jí)前,通義App設(shè)有三個(gè)入口:對(duì)話、智能體、頻道,升級(jí)后變?yōu)橹帧⒐ぞ、角色、頻道。2024年通義推出的“全民舞王”“全民唱演”“通義照相館”等應(yīng)用在頻道一欄。
兩個(gè)月前,通義聽(tīng)悟工程研發(fā)負(fù)責(zé)人邢君就向北京商報(bào)記者透露了通義聽(tīng)悟集成進(jìn)通義App的計(jì)劃。5月9日,阿里云相關(guān)人告訴北京商報(bào)記者,“目前,包括通義聽(tīng)悟、智文等通義家族產(chǎn)品能力已集成到通義App中”。
根據(jù)蘋(píng)果應(yīng)用商店數(shù)據(jù),通義在免費(fèi)效率榜單排在第13位,同類(lèi)的大模型產(chǎn)品還包括豆包、文心一言、訊飛星火、智譜清言、天工、kimi等。
第三方商業(yè)智能數(shù)據(jù)服務(wù)商QuestMobile發(fā)布的最新數(shù)據(jù)顯示,AIGC獨(dú)立App用戶(hù)量超7380萬(wàn),同比增長(zhǎng)8倍。2024年3月,豆包、文心一言、天工、訊飛星火、Kimi的月活用戶(hù)分別是2328.2萬(wàn)、1466.1萬(wàn)、966.1萬(wàn)、620.4萬(wàn)、589.7萬(wàn)。
這一排名等同于國(guó)內(nèi)大模型的能力嗎?文淵智庫(kù)創(chuàng)始人王超的答案是否定的,他告訴北京商報(bào)記者,“還是要以用戶(hù)的使用感受為第一,而不是月活規(guī)模。我個(gè)人的排名是Gemini免費(fèi)版、GPT3.5和Kimi差不多、通義千問(wèn)、文心一言”。
除獨(dú)立App外,小程序也是大模型接觸用戶(hù)的主要渠道。根據(jù)QuestMobile提供的Kimi和訊飛星火的數(shù)據(jù),2024年3月Kimi微信小程序月活用戶(hù)91.1萬(wàn),訊飛星火去重總用戶(hù)規(guī)模635.6萬(wàn)。
繼續(xù)開(kāi)源
“用戶(hù)活躍度能一定程度上反映大模型產(chǎn)品的市場(chǎng)格局。受到用戶(hù)屬性、產(chǎn)品體量和活躍度影響,目前豆包和文心一言的用戶(hù)量級(jí)明顯較高,但從產(chǎn)品功能來(lái)看,kimi的使用場(chǎng)景更為垂直,這意味著kimi近600萬(wàn)的活躍用戶(hù)黏性更高,用戶(hù)的忠誠(chéng)度和未來(lái)的運(yùn)營(yíng)空間也會(huì)更大!比疬_(dá)恒研究院經(jīng)理王清霖告訴北京商報(bào)記者,“通義這類(lèi)大模型產(chǎn)品也可以結(jié)合阿里自身的產(chǎn)品屬性?xún)?yōu)勢(shì),找到自己的發(fā)展方向和黏性用戶(hù)。”
開(kāi)源閉源的優(yōu)劣則是行業(yè)觀察者聚焦的重點(diǎn)。4月,百度CEO李彥宏公開(kāi)表示,“大家以前用開(kāi)源覺(jué)得便宜,其實(shí)在大模型場(chǎng)景下,開(kāi)源是最貴的。所以開(kāi)源模型會(huì)越來(lái)越落后”。5月9日,周靖人接受媒體采訪時(shí)回答的第一個(gè)問(wèn)題也與此有關(guān)!伴_(kāi)源對(duì)整個(gè)技術(shù)發(fā)展的意義大家都可以看到。阿里云自己做最先進(jìn)的AI模型,也敢于開(kāi)源,這對(duì)企業(yè)真正做創(chuàng)新性開(kāi)發(fā)將起到至關(guān)重要的作用,這一點(diǎn)在全球范圍已經(jīng)被多次證明,沒(méi)有再討論的必要。”
“坦率地說(shuō),不是所有的閉源公司的模型都能做得過(guò)開(kāi)源模型,首先閉源公司的模型水平要超過(guò)開(kāi)源模型的水準(zhǔn)!敝芫溉搜a(bǔ)充。
當(dāng)天,阿里云發(fā)布了最新款開(kāi)源模型1100億參數(shù)的Qwen1.5-110B,此前5億、18億、40億、70億、140億、320億和720億參數(shù)的大模型已經(jīng)開(kāi)源。
談到最近大火的長(zhǎng)文本處理能力,周靖人強(qiáng)調(diào)了兩點(diǎn),支持、先發(fā),“我們的長(zhǎng)文本處理功能其實(shí)是先于行業(yè)所有公司的,通義App單次可處理多達(dá)1000萬(wàn)字的長(zhǎng)文檔,還能同時(shí)解析100份不同格式的文檔。長(zhǎng)文本處理能力不光要看文本的長(zhǎng)度,還要基于場(chǎng)景做總結(jié)、歸納等,誰(shuí)的技術(shù)更強(qiáng)這種討論沒(méi)必要”。