首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 互聯(lián)網(wǎng) >> 正文

“最好的開源大模型”!報(bào)道稱Meta下周將推出2個(gè)小版本Llama 3 為暑期推出正式版鋪路

2024年4月9日 10:52  華爾街見聞  

當(dāng)?shù)貢r(shí)間周一,科技媒體The Information援引一位Meta員工消息報(bào)道稱,該公司計(jì)劃在下周推出兩個(gè)小型的Llama 3大語言模型(LLM),作為夏季推出正式版Llama 3的先行版本。

這兩個(gè)小模型的發(fā)布,預(yù)計(jì)將為Llama 3的正式亮相進(jìn)行鋪墊。Meta在去年7月份發(fā)布了Llama 2,此后,包括谷歌、馬斯克旗下的xAI與Mistral等在內(nèi)的數(shù)家公司發(fā)布了開源的大語言模型,競(jìng)爭十分激烈。

Llama 3直接對(duì)標(biāo)OpenAI的GPT-4,后者已經(jīng)成為一個(gè)強(qiáng)大的多模態(tài)模型,不僅能夠處理更長的文本,還支持圖像輸入。

報(bào)道稱,正式版Llama 3也將支持多模態(tài)處理,即同時(shí)理解和生成文本及圖片;而先行推出的兩個(gè)小版本則不具備這一能力。

一般而言,較小的模型成本更低,運(yùn)行更快,尤其在運(yùn)行大型模型成本高昂的當(dāng)下,其價(jià)值尤為凸顯。小型模型還便于開發(fā)者在移動(dòng)設(shè)備上開發(fā)人工智能軟件。

Meta此前已推出三個(gè)版本的Llama 2,其中最大的一個(gè)擁有700億個(gè)參數(shù),另外兩個(gè)版本分別擁有130億和70億個(gè)參數(shù)。

據(jù)硬AI此前文章,Llama 3的最大版本可能會(huì)擁有超過1400億個(gè)參數(shù)。

Meta還將在Llama 3中改進(jìn)Llama 2在響應(yīng)爭議性話題時(shí)過于保守的問題,研究人員計(jì)劃放松大模型在這一方面的限制,以便它更多地與用戶互動(dòng),提供背景信息,而不僅僅是拒絕回答。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
陳忠岳:中國聯(lián)通正在開展6G技術(shù)指標(biāo)制定等工作
精彩專題
CES 2024國際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國國際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像