編輯:澤南、小舟
「複製粘貼論文」事件很快有了處理結果,下一個問題是:NeurIPS 的未發表論文是怎麼洩露出來的?
把一篇 NeurIPS 2020 的論文投稿換個作者名字發到 arXiv 上,這樣直接的造假行為著實讓人摸不著頭腦。
前段時間,一篇標題為《 Label Assignment Distillation for Object Detection 》的論文被舉報抄襲。其中,論文作者之一張某某是北京理工大學一名 2020 級碩士研究生。

涉嫌抄襲的論文,原連結:https://arxiv.org/pdf/2109.07843.pdf
這一事件立即引來了人們的廣泛關注。9 月 30 日,北京理工大學研究生院網站發佈了《關於對我校研究生張某某處分的情況通報》,表示校方已認定張某某「濫用學術成果署名」,屬於「嚴重學術不端」,並決定給予張某某留校察看處分。以下是北京理工大學發佈的通報原文:

「一字不差」的抄襲
此前,這篇 9 月 17 日上傳到 arXiv 上的論文被曠視研究員王劍鋒在知乎發文舉報抄襲,他是被抄襲論文的作者之一。
被抄襲論文為王劍鋒等人在國際深度學習頂級會議 NeurIPS 2020 的投稿。王劍鋒在知乎文章中稱:「我們的投稿,被洩露並被抄襲挪用了。」

王劍鋒等人的投稿。
可以看到,兩篇論文的標題一模一樣。不僅如此,從兩篇論文的對比中,我們可以發現兩篇文章摘要幾乎完全一致、圖片完全一致、表格資料完全一致。

部分論文截圖對比。
王劍鋒表示:「(抄襲論文的)作者們主要修改了部分措辭,並採用了 CVPR 2021 的 latex 模板,這一過程完全是主觀刻意的。我們要強調一點,arxiv 文章中沒有任何一個配圖、表格、公式是新的,完全沒有做額外的實驗。」
但王劍鋒與論文作者取得聯繫之後,對方並沒有承認論文剽竊。9 月 20 日,北京理工大學發佈公告表示已啟動調查。
如今,北京理工大學的通報再度證實了這篇 arXiv 論文的抄襲事實。
至於沒有公開發表的論文是如何被原樣複製出來的,目前我們還無法得知。NeurIPS 一直採用雙盲評審方法,理論上能夠獲得論文 PDF 的人僅限於論文合作者與審稿人。根據 NeurIPS 2020 當時的規定,部分論文作者也被列入了審稿人的行列,人們猜測或許是有某個學生在幫老師審稿時獲得了該論文稿件,進而引發了後來的抄襲事件。

去年的 NeurIPS 創造了歷史最高記錄的 9467 篇論文投稿,在空前的壓力之下,會方採取了「提前拒稿」方式(今年已被取消),並引入了大量新審稿人,造成了一定爭議。不過讓人沒有想到的事,這也為有人買論文創造了「機會」。
打擊論文造假的行動
最近發生的事件再次引發了人們對於花錢買論文行為的思考。迄今為止,國家衛生健康委員會(NHC)和國家自然科學基金委員會(NSFC)已經在 3 月到 9 月間的 42 次調查中制裁了至少 23 名尋求第三方論文代寫,或資料造假的違規行為。
研究人員找論文代寫或購買資料,往往是因為有足夠的論文數才能獲得學位或職稱。過去一年裡,打擊學術造假的行動有了更多進展,各類科學期刊撤回了上百篇疑似來自論文工廠的文章。
今年 3 月,國際頂級科學期刊 Nature 報道稱,自 2020 年 1 月以來已有 370 篇此類文章被撤回,作者全部來自中國的醫院。根據 Nature 統計,這個數字現在至少已經飆升到了 665。
對此,自 2018 年起科技部宣佈了以打擊學術不端行為為目的的全面改革。去年推出的政策還首次明確提及了論文工廠問題。根據政策,嚴重違規的行為必須公之於眾。
今年 3 月和 7 月,國家自然科學基金委員會通報了 13 起學術造假行為。其中 6 項涉及論文工廠。違規者獲得了通報批評、取消基金項目申請資格多至 7 年、六年內不得晉升等處罰。
北理工對張某某處分的情況通報:
https://grd.bit.edu.cn/xwgz/xwtzgg/3944e225b5824d31a7297657760d1b3d.htm
參考內容:
https://www.nature.com/articles/d41586-021-02587-3
機器之心招人啦!
為進一步生產更多的高質量內容,提供更好資料產品及產業服務,機器之心需要更多的小夥伴加入進來,共同努力打造專業的人工智慧資訊服務平臺。
工作城市:北京市朝陽區酒仙橋 / 上海張江人工智慧島
