9月17日深夜,今年1月引發(fā)全球轟動的開源AI大模型DeepSeek-R1,在經(jīng)過8個多月嚴(yán)格的同行評審之后,登上國際頂尖學(xué)術(shù)期刊《自然》雜志封面,成為全球首個經(jīng)過同行評審的大語言模型。
此前,主流大模型通常采用一套不同于學(xué)術(shù)界的成果發(fā)布方式:開直播,在預(yù)印本網(wǎng)站和官方技術(shù)博客上發(fā)布突破性成果,同時在測評榜上拿下高分,以證明各自的技術(shù)優(yōu)勢。年初,DeepSeek-R1的業(yè)界影響力也是由此而來。
近年來,人工智能,特別是大語言模型,正以驚人的速度和一種近乎“黑箱”的方式發(fā)展。此次,DeepSeek團(tuán)隊在《自然》雜志上發(fā)表論文,無疑打破了行業(yè)慣例。對此,多位專家表示,此舉意味著“野蠻生長”的大模型正在向更為透明、可復(fù)現(xiàn)的方向發(fā)展,同時也意味著人工智能正努力融入更廣泛的科學(xué)社區(qū),為AI與其他領(lǐng)域的融合打通更多壁壘。
影響力倒掛?發(fā)表生態(tài)在改變
這篇由梁文鋒擔(dān)任通訊作者的論文披露了DeepSeek-R1更多訓(xùn)練細(xì)節(jié),包括29.4萬美元的超低訓(xùn)練成本,并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。
實際上,這篇關(guān)于DeepSeek-R1的論文早今年1月就以預(yù)印本形式發(fā)表在arXiv平臺上。此次論文正式發(fā)表前,經(jīng)歷了8名同行評審,并在他們的反饋下作了許多修改、完善和補充,論文的清晰度、可信度和完整度得到進(jìn)一步提升。
自今年1月在全球最大開源AI社區(qū)Hugging Face發(fā)布以來,DeepSeek-R1模型已成為該平臺上下載量最高的復(fù)雜問題解決類模型。截至9月18日,R1模型的預(yù)印本論文也在短短8個多月中,獲得約3600次引用——在大模型領(lǐng)域,這是一個很高的引用數(shù)據(jù)。
“DeepSeek-R1用無限強(qiáng)化學(xué)習(xí)、獎懲制度來提升大模型的推理能力,在業(yè)界起到了引領(lǐng)風(fēng)潮的作用。”在浙江大學(xué)本科生院院長、人工智能研究所所長吳飛教授看來,盡管8個月的同行評審使論文更趨完善,但其最具創(chuàng)新性的方法并沒有實質(zhì)改變。
吳飛注意到,這8個月間,在某些任務(wù)表現(xiàn)上,有些大模型已超越DeepSeek-R1,但《自然》并未選擇發(fā)表那些成果,反而堅持發(fā)表這篇已在預(yù)印本平臺上發(fā)表過的論文,“這是前所未見的”。
過去,AlphaGo、AlphaFold等論文登上《自然》都是首發(fā),而這篇首秀在arXiv上的論文不僅登上頂刊《自然》封面,編輯部還為此配發(fā)社論,這讓吳飛感覺到AI正在改變論文發(fā)表生態(tài)——或許未來全球影響力最高的20篇論文,可能最早發(fā)表于草根平臺。
AI需要加入更大“科學(xué)群聊”
在眾多業(yè)內(nèi)人士看來,這次R1模型登上《自然》,除了肯定其學(xué)術(shù)價值,還標(biāo)志著AI基礎(chǔ)模型正從一個靠技術(shù)博客和“打榜”為主要評價標(biāo)準(zhǔn)的領(lǐng)域,邁向以方法論的科學(xué)性、可復(fù)現(xiàn)性和嚴(yán)謹(jǐn)驗證為核心的成熟科學(xué)。
上海科技大學(xué)信息學(xué)院助理院長屠可偉教授告訴記者,期刊發(fā)表周期至少6-12個月,會議論文則需3-6個月,這樣的發(fā)表速度對AI來說太慢了。不過,在“誰都能往上發(fā)”的預(yù)印本平臺arXiv上,論文質(zhì)量也的確良莠不齊。屠可偉認(rèn)為,R1模型通過同行評審登上《自然》,更大的意義在于,讓AI獲得了更廣泛科學(xué)群體的關(guān)注。
《自然》雜志在同步發(fā)表的社論中表示,當(dāng)前,那些正迅速改變?nèi)祟愔R獲取方式的主流大語言模型中,尚無任何一個經(jīng)過研究期刊的獨立同行評審。嚴(yán)格的同行評審有助于清晰呈現(xiàn)大型語言模型的工作原理,并幫助評估其是否能實現(xiàn)宣稱的功能,有利于遏制人工智能行業(yè)的炒作現(xiàn)象。此次DeepSeek-R1打破行業(yè)慣例,讓大模型朝著提升透明度的方向邁出了可喜一步。
同時,同行評審還能增強(qiáng)研究的可信度,在不同群體中獲得更高認(rèn)可度。此外,評審還會對模型的安全性、防護(hù)機(jī)制作出要求,將推動改善目前頗受關(guān)注的數(shù)據(jù)污染、固有偏見等問題。
屠可偉坦言,人工智能需要在更大范圍與其他學(xué)科領(lǐng)域加速融合,而實踐中面臨的最大挑戰(zhàn)就是學(xué)科隔閡,增進(jìn)科學(xué)家與AI專家之間的交流極為必要。“此次R1模型登上《自然》,有助于讓AI融入更大的‘科學(xué)群聊’。”
本站鄭重聲明:第一黃金網(wǎng)中的操作建議僅代表第三方觀點與本平臺無關(guān),投資有風(fēng)險,入市需謹(jǐn)慎。據(jù)此交易,風(fēng)險自擔(dān)。