首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯(lián)網|量子|元宇宙|博客|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 人工智能 >> 正文

OpenAI首款推理模型o1發(fā)布:比GPT-4o更慢、更貴

2024年9月13日 07:17  鳳凰網科技  

9月13日,OpenAI正式發(fā)布一個名為o1的新模型,這是一系列計劃中的“推理”模型中的首個,這些模型經過訓練,能夠比人類更快地回答更復雜的問題。同時發(fā)布的還有 o1-mini,這是一個更小、更便宜的版本,o1實際上就是此前傳聞熱議的草莓Strawberry模型。

對于OpenAI 來說,o1代表了向更廣泛目標——類人人工智能邁進的一步。更實際地說,它在編寫代碼和解決多步驟問題方面比之前的模型做得更好。但它也比GPT-4o更昂貴,使用起來更慢。OpenAI將這次o1的發(fā)布稱為“預覽”,強調它的初期階段。

ChatGPT Plus和Team用戶從今天開始就可以使用o1-preview和o1-mini,而企業(yè)和教育用戶將在下周初獲得訪問權限。OpenAI表示,它計劃將o1-mini的訪問權限擴展到所有免費用戶,但尚未設定發(fā)布日期。

開發(fā)者對o1的訪問非常昂貴:在API中,o1-preview的價格是每100萬個輸入tokens 15美元,每100萬個輸出tokens 60美元。相比之下,GPT-4o的價格是每100萬個輸入tokens 5美元,每100萬個輸出tokens 15 美元。

OpenAI的研究負責人杰里-特沃瑞克(Jerry Tworek)表示,o1背后的訓練與前代產品有本質區(qū)別,不過公司對具體細節(jié)含糊其辭。 他只透露,o1 “采用了全新的優(yōu)化算法和專門為其定制的新訓練數據集”。

由于這種新的訓練方法,OpenAI 表示模型應該更準確。“我們注意到這個模型產生的幻覺更少,” Tworek 說。但問題仍然存在!拔覀儾荒苷f我們已經解決了幻覺問題!

這個新模型與GPT-4o的主要區(qū)別在于,它在解決復雜問題(如編程和數學)方面比此前模型做得更好,同時也解釋了它的推理過程。

OpenAI的首席研究官鮑勃-麥格魯(Bob McGrew)表示,“這個模型在解決AP數學考試方面絕對比我強,而我在大學里輔修的是數學! 他指出,OpenAI 還用國際數學奧林匹克競賽的資格考試對 o1 進行了測試,GPT-4o 只正確解決了13%的問題,而o1則達到了 83%。

在“Codeforces”的在線編程競賽中,這種新模型在參賽者中的排名達到了第89位,OpenAI聲稱,這種模型的下一個更新版本將在物理、化學和生物學領域具有挑戰(zhàn)性的基準任務中取得與博士生類似的表現(xiàn)。

但是,o1 在很多領域并不像GPT-4o那樣能干。它在有關世界的事實知識方面做得并不好。它也沒有瀏覽網頁或處理文件和圖像的能力。盡管如此,該公司認為它代表了一種全新的能力。它被命名為o1是為了表示“將計數器重置為1”。

“我要坦白說:我認為我們傳統(tǒng)上在命名方面很糟糕,” McGrew 說。“所以我希望這是更明智、更清晰地向世界傳達我們在做什么的第一步。”

目前媒體還未能體驗到o1新模型,但OpenAI技術人員向媒體簡單介紹了新模型處理能力。他們要求它解決這個謎題:

“當公主的年齡是王子將來年齡的兩倍時,公主的年齡和王子現(xiàn)在的年齡一樣大,那時公主的年齡是她現(xiàn)在年齡的一半加上王子現(xiàn)在的年齡。王子和公主的年齡是多少?提供該問題的所有解決方案!

模型緩沖了30秒鐘,然后給出了正確答案。 OpenAI設計的界面可以在模型思考時顯示推理步驟。 讓人印象深刻的并不是它展示了自己的工作,而是o1在“刻意”模仿人類思維。 諸如“我很好奇”、“我正在思考”和“好的,讓我看看”這樣的句子營造出一種循序漸進的思考假象。

但這模型并不是在思考,它當然也不是人類。那么,為什么要設計它看起來像是在思考呢?

Tworek 認為,OpenAI 并不相信人工智能模型的思維等同于人類思維。 但他說,該界面旨在展示模型如何花更多時間處理和深入解決問題。 “在某些方面,它比以前的模型更有人情味”。

“我認為你會看到很多它感覺有點像外星人的方式,但也有它出奇地像人類的方式,” McGrew 說。模型被給予有限的時間來處理查詢,所以它可能會說,“哦,我快沒時間了,讓我快點給出答案!痹谒乃季S鏈早期,它可能看起來像是在頭腦風暴,說,“我可以這樣做或那樣做,我應該怎么做?”

隨著 OpenAI 據報道尋求以驚人的 1500 億美元估值籌集更多資金,其勢頭取決于更多的研究突破。該公司正在為 LLM 引入推理能力,因為它看到了一個未來,擁有能夠代表你做出決策和采取行動的自主系統(tǒng)或代理。

對于 AI 研究人員來說,破解推理是邁向類人智能的重要下一步。如果一個模型能夠超越模式識別,它可能會在醫(yī)學和工程等領域取得突破。目前,o1 的推理能力相對較慢,不像智能體,對開發(fā)者來說使用成本高昂。

“我們一直在花費數月時間研究推理,因為我們認為這實際上是關鍵突破,” McGrew 說!皬母旧险f,這是一種新的模型模式,以便能夠解決真正困難的問題,這是朝著類人智能水平邁進所必需的。”

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網絡的實踐和展望
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像