飛象網(wǎng)訊 9月7日正式啟動(dòng)、以“新搜索·新奇點(diǎn)”為主題的第二屆百度搜索創(chuàng)新大賽,歷經(jīng)3個(gè)月的角逐,最終吸引了2800多人報(bào)名,涵蓋了95所雙一流高校,最終28支團(tuán)隊(duì)獲獎(jiǎng),5萬名同學(xué)直接參與相關(guān)課程學(xué)習(xí),宣傳覆蓋100萬開發(fā)者群體。
百度集團(tuán)副總裁、百度搜索平臺(tái)負(fù)責(zé)人肖陽在頒獎(jiǎng)典禮致辭時(shí)表示,“在這次還遠(yuǎn)未到終局的大模型浪潮里,搜索的技術(shù)變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進(jìn)化。而這次的進(jìn)化,更需要?jiǎng)?chuàng)新力量的支持。而得益于創(chuàng)新大賽這個(gè)平臺(tái),搜索的技術(shù)變⾰基因,迅速和眾多年輕的血液產(chǎn)生了碰撞。 ”
NVIDIA 全球副總裁何濤在大賽頒獎(jiǎng)典禮致辭中也表示:“作為百度搜索創(chuàng)新大賽的技術(shù)合作伙伴,我們非常高興的看到百度搜索大賽共吸引了超過兩千多名優(yōu)秀選手參賽。這一年里,各行各業(yè)都在經(jīng)歷從通用計(jì)算到加速計(jì)算和生成式AI的平臺(tái)轉(zhuǎn)型。也勉勵(lì)在場(chǎng)的各位同學(xué),順應(yīng)技術(shù)發(fā)展趨勢(shì),把握機(jī)會(huì),成為懂得使用AI的人,以掌握未來職業(yè)發(fā)展的主動(dòng)權(quán)。”
百度搜索創(chuàng)新大賽是百度搜索聯(lián)合NVIDIA英偉達(dá)、全國各大高校、社團(tuán)、科研組織共同舉辦的一項(xiàng)全國性AI科技競(jìng)賽。本屆大賽設(shè)立了五大賽道,題目涉及搜索核心業(yè)務(wù)場(chǎng)景,如語義檢索、多模態(tài)、軟硬結(jié)合優(yōu)化等豐富的技術(shù)方向,并且開設(shè)了賽道三產(chǎn)品賽道,號(hào)召參賽者“洞察用戶在搜索場(chǎng)景的需求,并通過構(gòu)建AI應(yīng)用解決”,最終有28支隊(duì)伍站上了領(lǐng)獎(jiǎng)臺(tái)。
賽道一“搜索答案組織”,來自中國科學(xué)院大學(xué)的“None”團(tuán)隊(duì)獲得了一等獎(jiǎng)。該團(tuán)隊(duì)通過精細(xì)調(diào)整Lora微調(diào)LLM方案,精選公開問答數(shù)據(jù)增強(qiáng)訓(xùn)練,利用大模型蒸餾提升學(xué)習(xí)效果,并參照NEFTune進(jìn)行噪聲嵌入增加模型魯棒性,使測(cè)試數(shù)據(jù)結(jié)果更符合用戶需求。每一個(gè)技術(shù)選型均給出了合理動(dòng)機(jī)、扎實(shí)分析和可信結(jié)論。這體現(xiàn)了團(tuán)隊(duì)對(duì)搜索答案組織問題的深度理解和出色的科研能力。
賽道二“基于向量交集的Topk搜索”,“晨曦”團(tuán)隊(duì)獲得了頭獎(jiǎng)。這個(gè)團(tuán)隊(duì)只有一個(gè)人,還是位全職奶爸,不僅在機(jī)評(píng)結(jié)果中遙遙領(lǐng)先,在答辯中整體技術(shù)方案的創(chuàng)新性、通用性與先進(jìn)性上也獲得了評(píng)委們的一致認(rèn)可。
賽道三“設(shè)計(jì)一個(gè)解決搜索用戶需求的AI原生應(yīng)用”,來自南京航空航天大學(xué)的“肝到凌晨”團(tuán)隊(duì)?wèi){借AI簡(jiǎn)歷助手“Linchance JOB”獲得冠軍。只需要回答幾個(gè)問題,就能生成個(gè)性化的簡(jiǎn)歷,還提供優(yōu)化建議,安排AI模擬面試。
賽道四“基于GPU的近似最近鄰檢索算法挑戰(zhàn)”則由杭州電子科技大學(xué)的“HDU01”團(tuán)隊(duì)獲得一等獎(jiǎng)。該團(tuán)隊(duì)在調(diào)研業(yè)內(nèi)的相關(guān)算法并深入分析開源版本的基礎(chǔ)上,做出了有意義的修改,使得最終版本的性能超過了開源版本的兩倍以上。
賽道五“可控圖片生成算法挑戰(zhàn)”,北京理工大學(xué)“幸運(yùn)的深不見底的團(tuán)隊(duì)”奪得一等獎(jiǎng)。他們通過對(duì)數(shù)據(jù)的精心清洗與增強(qiáng)為模型訓(xùn)練提供了穩(wěn)定基礎(chǔ),采取的多模型融合策略體現(xiàn)了較好的理論實(shí)踐結(jié)合能力,最終使得生成圖片的相關(guān)性和質(zhì)量有了顯著提升。
百度是全球最早推出生成式AI的大廠,3月16日發(fā)布文心一言內(nèi)測(cè)版,8月31日正式向全社會(huì)開放。在10月份舉辦的百度世界2023上,百度推出了眾多重構(gòu)后的產(chǎn)品與應(yīng)用,其中重構(gòu)后的百度搜索尤其引人關(guān)注。
被大模型重構(gòu)的搜索,目前已經(jīng)擁有極致滿足、推薦激發(fā)和多輪交互三個(gè)新能力。當(dāng)用戶提出一個(gè)問題時(shí),新搜索不再是提供一堆鏈接,而是通過對(duì)內(nèi)容的理解,生成文字、圖片、動(dòng)態(tài)圖表等多模態(tài)的答案,讓用戶一步獲得滿足,引領(lǐng)了搜索行業(yè)的代際變革。目前,在百度,每天已經(jīng)有超過3億次的搜索需求,被生成式搜索滿足。搜索在首位能給出滿意答案的比例已經(jīng)提升了近1倍。
NVIDIA 開發(fā)與技術(shù)部門亞太區(qū)總經(jīng)理李曦鵬也闡述了自己“新搜索”的理解,“從最早書籍檢索、數(shù)據(jù)檢索,到了數(shù)字化過后內(nèi)容的檢索,到現(xiàn)在如火如荼基于LLM生成式檢索,都在說明一個(gè)好的領(lǐng)域可以不斷地引領(lǐng)創(chuàng)新、不斷地產(chǎn)生創(chuàng)新、同時(shí)不斷地吸收創(chuàng)新。搜索業(yè)務(wù)本身是NLP、CV、語音這些最前沿Deep Learning的合集;诖,大模型有創(chuàng)新,第一個(gè)落地場(chǎng)景就是搜索。對(duì)于大模型在搜索引擎里大放異彩,是非常值得期待的。”
肖陽在致辭中表示,“面對(duì)遠(yuǎn)未到終局的大模型浪潮,搜索的技術(shù)變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進(jìn)化。而這次的進(jìn)化,更需要?jiǎng)?chuàng)新力量的支持。”創(chuàng)新力量指的就是人才,百度搜索創(chuàng)新大賽所構(gòu)建的就是選拔人才的舞臺(tái),就像業(yè)內(nèi)所說,打造“搜索界的奧林匹克”。
憑借百度搜索創(chuàng)新大賽這個(gè)平臺(tái),搜索的技術(shù)變革基因,正在注入年輕的血液。肖陽稱,“在接下來的⼀段時(shí)間內(nèi),百度搜索都會(huì)持續(xù)擁抱年輕⼈的靈感,為自己的技術(shù)基因注⼊新的活力。 ”