您的位置：中國(guó)博士人才網(wǎng) > 資訊動(dòng)態(tài) > 人才工作 > 實(shí)測(cè)近5000篇論文！3位中國(guó)博士生發(fā)現(xiàn)驚喜結(jié)果

關(guān)注微信

更多>>

人才工作

更多>>

人才論點(diǎn)

更多>>

高層動(dòng)態(tài)

更多>>

科研動(dòng)態(tài)

實(shí)測(cè)近5000篇論文！3位中國(guó)博士生發(fā)現(xiàn)驚喜結(jié)果

時(shí)間:2023-11-27來(lái)源:中國(guó)科學(xué)報(bào) 作者:佚名

谷歌DeepMind創(chuàng)始人之一沙恩·萊格（Shane Legg）認(rèn)為，超越人類(lèi)水平的人工智能將在2025年左右出現(xiàn)。

而有3位華人博士生，在讓GPT-4充當(dāng)“審稿人”，審閱3000多篇Nature論文和1700多篇頂會(huì)論文后，驚喜地發(fā)現(xiàn)，在提供論文評(píng)審意見(jiàn)這件事上，AI有望達(dá)到類(lèi)似人類(lèi)審稿人的水平。

這是梁偉欣、張鈺暉和曹瀚成花了5個(gè)月完成的研究。作為美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的博士生，他們切身感受到計(jì)算機(jī)領(lǐng)域論文“井噴式增長(zhǎng)”帶來(lái)的審稿壓力，于是踏出了GPT-4在“審稿”方面嘗試的“第一步”。

10月初，這項(xiàng)研究以論文的形式公布在arXiv平臺(tái)上，目前處于“頂刊在投”階段。論文共同第一作者之一曹瀚成告訴《中國(guó)科學(xué)報(bào)》，他希望未來(lái)有更多同方向的研究，進(jìn)一步解決AI審稿的局限性。

曹瀚成受訪(fǎng)者供圖

論文“井噴式增長(zhǎng)”，審稿壓力“太難頂”

“我們的初心非常簡(jiǎn)單，就是看看大家玩了很久的ChatGPT、大模型在提供論文評(píng)審意見(jiàn)上有沒(méi)有一些用處，是否能夠緩解人工審稿的壓力。”曹瀚成回憶道。

近年來(lái)，隨著科學(xué)的發(fā)展、各國(guó)對(duì)科研投入力度的加大，科研論文的數(shù)量也快速增長(zhǎng)，世界仿佛進(jìn)入了一個(gè)“增量式科學(xué)時(shí)代”。隨之而來(lái)的是與日俱增的審稿壓力——許多論文壓根兒找不到人來(lái)審，還有許多論文無(wú)法及時(shí)獲得有價(jià)值的評(píng)審意見(jiàn)。

而在計(jì)算機(jī)科學(xué)這種最“年輕”、迭代最快的領(lǐng)域中，這一現(xiàn)象更為突出。

各種數(shù)據(jù)都顯示，計(jì)算機(jī)科學(xué)論文的增長(zhǎng)正呈現(xiàn)“井噴式”的態(tài)勢(shì)。如ICLR是深度學(xué)習(xí)的頂尖會(huì)議，在2018年時(shí)投稿量為960篇，而到了2023年，投稿量已經(jīng)漲到了4966篇。而CVPR是計(jì)算機(jī)視覺(jué)方面的頂級(jí)會(huì)議，今年收到9155篇論文投稿，相比于去年有12%的增長(zhǎng)。

不同于生物、物理等需要長(zhǎng)時(shí)間積累才“夠格”當(dāng)審稿人的學(xué)科，計(jì)算機(jī)科學(xué)尤其是人工智能方向云集著年輕的審稿人：十幾年前，博士生審稿已經(jīng)成為常態(tài)；而近幾年，本科生也逐漸加入這一隊(duì)伍。這些“資歷尚淺”的學(xué)生對(duì)新興領(lǐng)域的了解，甚至比老派的學(xué)者教授更為深入，給學(xué)科的發(fā)展注入了新鮮血液。

對(duì)于年輕的博士生梁偉欣、張鈺暉和曹瀚成而言，參與頂級(jí)會(huì)議論文審稿已經(jīng)成為他們的“家常便飯”。據(jù)曹瀚成描述，在許多AI會(huì)議上，只要你投一篇論文，就意味著要簽署“同意書(shū)”，志愿成為審稿人中的一員。一場(chǎng)會(huì)議下來(lái)，除了操心自己的論文，還要審七八篇乃至別人更多的論文，這讓所有參與者感受到壓力不小。

“在我們的經(jīng)歷中，包括身邊的導(dǎo)師、朋友，大家都在抱怨，為什么要審的論文這么多？”曹瀚成告訴《中國(guó)科學(xué)報(bào)》。

另一方面，許多論文的作者早已開(kāi)始對(duì)收到的審稿意見(jiàn)“心有不滿(mǎn)”。明眼人都看得出來(lái)，這是因?yàn)橛行⿲徃逡庖?jiàn)太不走心了。

有學(xué)者在社交平臺(tái)上吐槽：很多審稿意見(jiàn)在否定論文時(shí)，僅僅給出簡(jiǎn)單的一句“我不相信”或“我不認(rèn)為”，卻沒(méi)有提出具體的論據(jù)或參考。

學(xué)者在社交平臺(tái)上吐槽

這位學(xué)者還舉出例子，以反映評(píng)審有多不走心：“這篇論文的優(yōu)勢(shì)是X，Y，Z；另外，它也有一些缺陷，分別是X，Y，Z……”

也有學(xué)者在知乎上吐槽：

學(xué)者在知乎上吐槽

“有時(shí)能明顯感覺(jué)到審稿人沒(méi)有認(rèn)真讀我們的文章，并且，最后論文的收錄與否好像很隨機(jī)。” 曹瀚成說(shuō)。他將審稿質(zhì)量下滑的原因再次歸結(jié)于論文數(shù)量的“井噴式增長(zhǎng)”，致使審稿人應(yīng)接不暇。

一次閑聊中，梁偉欣、張鈺暉和曹瀚成三人不約而同地想到：或許最新的AI技術(shù)，可以幫助打通審稿難問(wèn)題的“任督二脈”。

就這樣，三人開(kāi)始著手驗(yàn)證這個(gè)“很容易被想到”的想法。

梁偉欣圖源梁偉欣個(gè)人網(wǎng)站

“AI在主要審稿意見(jiàn)上與人類(lèi)保持一致”

他們進(jìn)行的第一項(xiàng)大規(guī)模驗(yàn)證是：使用GPT-4對(duì)3096篇Nature期刊論文與1709篇ICLR機(jī)器學(xué)習(xí)會(huì)議論文進(jìn)行“AI審稿”。

這是一項(xiàng)“宏大”的工程，但操作的思路卻很清晰：首先設(shè)計(jì)一個(gè)自動(dòng)化的框架，將一篇篇論文的PDF版本輸入其中，然后為GPT-4構(gòu)建特定的提示，讓它生成對(duì)每篇論文的反饋。

“在對(duì)比GPT-4與人類(lèi)給出的審稿意見(jiàn)后，我們得到了一些有趣的結(jié)論。”曹瀚成說(shuō)。

首先，GPT-4給出的審稿意見(jiàn)與人類(lèi)的意見(jiàn)高度重合；其次，GPT-4可以成功識(shí)別出論文中比較重大的問(wèn)題，并在重大意見(jiàn)上與人類(lèi)審稿人保持一致。以上兩點(diǎn)表明，AI已經(jīng)具有一定的準(zhǔn)確性和潛在的實(shí)用性。

除此之外，GPT-4可以產(chǎn)生“非一般反饋”，也就是說(shuō)，它不再局限于“走馬觀花”地產(chǎn)生通用于大批論文的反饋意見(jiàn)，而是針對(duì)每篇論文有了個(gè)性化的反饋�；蛟S，未來(lái)的AI真的可以像人類(lèi)一樣實(shí)現(xiàn)“個(gè)性化思考”。

研究人員還發(fā)現(xiàn)了AI與人類(lèi)的“互補(bǔ)性”——AI與人類(lèi)給出審稿意見(jiàn)時(shí)的側(cè)重點(diǎn)有所不同，如，在論文的研究意義與新穎性方面，AI發(fā)表評(píng)論的概率是人類(lèi)的7-10倍。這種差異凸顯了未來(lái)AI與人類(lèi)合作的潛在優(yōu)勢(shì)。

就像深度學(xué)習(xí)“三巨頭”之一，圖靈獎(jiǎng)得主、美國(guó)紐約大學(xué)終身教授楊立昆（Yann LeCun）所說(shuō)的那樣：“人工智能不是消滅人類(lèi)創(chuàng)造力的力量，而是增強(qiáng)人類(lèi)創(chuàng)造力的力量。”

學(xué)科交叉，助力5個(gè)月“又快又好”完成研究

除了直接使用技術(shù)化手段將論文“喂給”GPT-4，這些年輕人還進(jìn)行了另外一項(xiàng)非常重要的研究：對(duì)308名學(xué)者進(jìn)行了用戶(hù)調(diào)查，看看這些學(xué)者如何看待AI給出的反饋。

張鈺暉圖源張鈺暉個(gè)人網(wǎng)站

這第二項(xiàng)研究，離不開(kāi)團(tuán)隊(duì)中偏文科、社會(huì)學(xué)領(lǐng)域人員的靈感與努力，而學(xué)科交叉的助力，也是整篇論文能在5個(gè)月之內(nèi)“又快又好”完成的秘訣。

“我們研究的問(wèn)題本身是一個(gè)交叉性非常強(qiáng)的問(wèn)題，團(tuán)隊(duì)中各位作者擁有文理的不同學(xué)科背景，大家各有分工。這第二項(xiàng)研究是用戶(hù)測(cè)試，就是收集使用者的主觀感受，包括AI審稿是否會(huì)對(duì)用戶(hù)產(chǎn)生行為上的影響、情感上的影響，或數(shù)據(jù)隱私等倫理范疇的擔(dān)憂(yōu)。”曹瀚成如是說(shuō)。

曹瀚成表示，用機(jī)器解決問(wèn)題，最終真正的落腳點(diǎn)還是在“人”，與“人”打交道的質(zhì)性研究法是社會(huì)學(xué)家的強(qiáng)項(xiàng)。通過(guò)問(wèn)卷的設(shè)計(jì)和發(fā)放，研究團(tuán)隊(duì)能真正了解，未來(lái)的使用者對(duì)AI審稿有何見(jiàn)解。

調(diào)查發(fā)現(xiàn)，無(wú)論是經(jīng)驗(yàn)豐富的研究人員還是新手，均對(duì)GPT-4生成的審稿意見(jiàn)有相似的滿(mǎn)意度。有41.9%的被調(diào)查者認(rèn)為GPT-4比許多人類(lèi)的審稿意見(jiàn)更有幫助，50.5%的被調(diào)查者表示愿意重復(fù)使用該評(píng)估系統(tǒng)。

有被調(diào)查者認(rèn)為，比起所謂的“領(lǐng)域權(quán)威”和人類(lèi)審稿人，他們更能從AI給出的意見(jiàn)中獲益。對(duì)于一些來(lái)自傳統(tǒng)貧困地區(qū)的研究人員，他們的論文更可能被期刊退稿，得不到同行評(píng)審的資源與機(jī)會(huì)，AI審稿對(duì)他們尤其有幫助。

還有被調(diào)查者評(píng)價(jià)道：“AI強(qiáng)調(diào)了一些人類(lèi)審稿人沒(méi)有指出的局限性，作為作者，我們意識(shí)到了這一點(diǎn)，并對(duì)此有所期待，但最后將其指出來(lái)的不是人類(lèi)，而是AI，所以這很有趣。”“GPT建議我進(jìn)行可視化，還要求解決數(shù)據(jù)隱私問(wèn)題。這兩點(diǎn)都很重要，人類(lèi)審稿人卻忽略了。”

這些被調(diào)查者還發(fā)現(xiàn)了AI審稿存在的局限性。最主要的局限性有二：產(chǎn)生的反饋有時(shí)模糊、不具體，以及無(wú)法提供“可操作”的改進(jìn)建議。目前來(lái)看，人類(lèi)專(zhuān)家的反饋仍然是嚴(yán)格評(píng)審的基石。

“我們的研究并非要用AI取代人類(lèi)審稿人，而是希望對(duì)論文作者能有所幫助，畢竟AI永遠(yuǎn)也不會(huì)取代人類(lèi)的高質(zhì)量審稿意見(jiàn)。”曹瀚成笑著說(shuō)，“距離電影中真正的‘通用型人工智能’，我們還有很長(zhǎng)的路要走。誰(shuí)也無(wú)法預(yù)測(cè)《西部世界》是否會(huì)變成現(xiàn)實(shí)。”

參考資料：

1.https://mp.weixin.qq.com/s/grLKyTZxpFhATJmAXKgcAA

2.https://arxiv.org/abs/2310.01783

3.https://mp.weixin.qq.com/s/edGthcjU43axKMpJbB8Alw

中國(guó)-博士人才網(wǎng)發(fā)布

聲明提示：凡本網(wǎng)注明“來(lái)源：XXX”的文/圖等稿件，本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的，并不意味著本站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，文章內(nèi)容僅供參考。

相關(guān)文章

亚洲无码午夜福利视频|日韩国产高清一区二区|欧美老熟妇XB水多毛多|狠狠色成人一区二区三区|在线观看国产精品露脸网站|在线观看一区二区三区视频|激情性无码视频在线观看动漫|99国产精品久久久久久久成人

英國(guó)《物理世界》雜志戰(zhàn)略合作伙伴，海內(nèi)外高層次人才服務(wù)中心！

人才工作

哲學(xué)類(lèi)：

經(jīng)濟(jì)學(xué)類(lèi)：

文學(xué)類(lèi)：

歷史學(xué)類(lèi)：

管理學(xué)類(lèi)：

藝術(shù)學(xué)類(lèi)：

地區(qū)
招聘

熱點(diǎn)
招聘

關(guān)注微信

人才工作

人才論點(diǎn)

高層動(dòng)態(tài)

科研動(dòng)態(tài)

實(shí)測(cè)近5000篇論文！3位中國(guó)博士生發(fā)現(xiàn)驚喜結(jié)果

重點(diǎn)招聘

亚洲无码午夜福利视频|日韩国产高清一区二区|欧美老熟妇XB水多毛多|狠狠色成人一区二区三区|在线观看国产精品露脸网站|在线观看一区二区三区视频|激情性无码视频在线观看动漫|99国产精品久久久久久久成人

關(guān)注微信

人才工作

人才論點(diǎn)

高層動(dòng)態(tài)

科研動(dòng)態(tài)

實(shí)測(cè)近5000篇論文！3位中國(guó)博士生發(fā)現(xiàn)驚喜結(jié)果

重點(diǎn)招聘

實(shí)測(cè)近5000篇論文！3位中國(guó)博士生發(fā)現(xiàn)驚喜結(jié)果