學術不端又來:2017年國內期刊論文被曝抄襲2008年國外舊論文,這次是「英譯漢」

機器之心編輯部

又雙叒叕來了!

近幾個月以來,學術圈不端行為屢被爆出,先是港科大碩士 ICCV 論文涉嫌抄襲,後有北理工碩士生「一字不差」抄襲頂會投稿。

更離譜的來了!

近日,B 站一位博主發視訊稱復旦大學重點實驗室疑似抄襲美國教授的論文,並列出了一系列抄襲證據。

涉嫌抄襲的論文是 2017 年發表在期刊《計算機應用與軟體》上的《基於正規表示式構建學習的網頁資訊抽取方法》,兩位作者來自復旦大學電腦科學技術學院智慧資訊處理重點實驗室。值得注意的是,這篇論文沒有掛導師名字。

論文地址:http://www.shcas.net/jsjyup/pdf/2017/2/%E5%9F%BA%E4%BA%8E%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E6%9E%84%E5%BB%BA%E5%AD%A6%E4%B9%A0%E7%9A%84%E7%BD%91%E9%A1%B5%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E6%96%B9%E6%B3%95.pdf

上述論文疑似抄襲了2008 年發表的一篇論文《Regular Expression Learning for Information Extraction》,幾位作者來自 IBM Almaden 研究中心,並由密歇根大學安娜堡分校電氣工程與電腦科學系教授 H. V. Jagadish 提供支持。

論文地址 https://aclanthology.org/D08-1003.pdf

根據爆料博主的說法,「從摘要到正文內容,幾乎都是翻譯之後再成文的。」

首先,論文摘要(Abstract)和引言(Introduction)部分存在相似的地方,如下為兩篇論文的部分摘要截圖:

在下圖兩篇論文的引言部分,可以看到,列舉的示例存在高度重合,如郵箱地址、信用卡號碼以及基因和蛋白質名稱等。

其次,在兩篇論文的第二章節《2 The Regex Learning Problem 》和《2 問題描述》,行文的邏輯、涉及的部分定義和公式更能看出抄襲痕跡。如下為部分截圖:

此外,兩篇論文中各自提出的演算法「ReLIE 搜尋演算法」和「正規表示式構建學習演算法」也高度相似:

最後,實驗結果也疑似抄襲,下圖左為英文原文在 SoftwareName、CourseNumber、 URL 和 PhoneNumber 四個任務上的抽取結果,圖右為中文論文在電話號碼、課程程式碼、超連結任務和公司名稱任務上的抽取結果,不難看出部分任務上的變化趨勢有重合的地方:

值得注意的是,涉嫌抄襲的論文是 2017 年發表的,被抄襲的論文是 2008 年發表的。這意味著 2017 年這篇論文已幾乎沒有學術價值,只是給論文量加了一筆。

此次疑似抄襲事件被曝出之後,在知乎引起熱議,有網友隨即質疑復旦大學重點實驗室的學術嚴謹水平。

網友調查發現兩位作者是復旦大學已畢業的碩士生,論文作者中沒有學校導師。並且論文發表時間是在 2017 年,當時作者已經畢業。

但也有網友提到:疑似抄襲的論文提交時間是 2016 年 1 月,當時一作尚未畢業。

一時之間,大家的關注點轉移到了實驗室的科研水平上。有網友為復旦大學電腦科學技術學院智慧資訊處理重點實驗室正名:實驗室的好成果很多,並稱這篇論文已被學院嚴肅處理。

因此,即使有漏網之魚,也不應以偏概全

因此,即使有漏網之魚,也不應以偏概全。

這篇論文再次給學術圈敲響了警鐘。對於研究者來說,實事求是基本的要求;對於讀者而言,保有質疑精神也是推動學術研究良好發展的重要力量。

參考連結:

https://www.zhihu.com/question/493606496

https://www.bilibili.com/video/BV1tR4y1J7iR?share_medium=android&share_plat=android&share_session_id=e3161655-39b9-4856-8f32-21b002db95cb&share_source=COPY&share_tag=s_i×tamp=1634754137&unique_k=6xCoig (https://www.bilibili.com/video/BV1tR4y1J7iR?share_medium=android&share_plat=android&share_session_id=e3161655-39b9-4856-8f32-21b002db95cb&share_source=COPY&share_tag=s_i&timestamp=1634754137&unique_k=6xCoig)

2021 NeurIPS MeetUp China

受疫情影響,NeurIPS 2021依然選擇了線上的形式舉辦。雖然這可以為大家節省一筆註冊、機票、住宿開支,但不能線下參與這場一年一度的學術會議、與學術大咖近距離交流討論還是有些遺憾。

今年,我們將在NeurIPS官方支持下,再次於 12 月份在北京舉辦線下NeurIPS MeetUp China,促進國內人工智慧學術交流。

2021 NeurIPS MeetUp China將設置 Keynote、圓桌論壇、論文分享和 Poster 等環節,邀請頂級專家、論文作者與現場參會觀眾共同交流。

歡迎 AI 社區從業者們積極報名參與,同時我們也歡迎 NeurIPS 2021 論文作者們作為嘉賓參與論文分享與 Poster 展示。感興趣的小夥伴點選「閱讀原文」即可報名。

相關文章