明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
艾瑞巴得,又有神器來拯救文盲了!
天氣太熱只會唸叨一句「熱死了」?發朋友圈翻來覆去才憋出幾個字?
這個檢索神器值得了解一下。
只要在搜尋框裡輸入你想表達的意思,如「熱死了」。
立刻就能有20個表達這一意思的句子任君挑選。
句子類型還能按需選取,名言警句、歇後語、古詩文都不在話下。
並且給出的名言還會註明出處作者,這下再也不用啥話都往迅哥兒身上套了。
怪不得網友直呼:朋友圈文案高級表達查找替換系統。
而且,我們在試玩了幾輪後發現,這個神器在hold住網路俗語「精髓」上的表現有些出人意料。
比如這兩天大家都在說的「精神內耗」。
它給出了一段盧梭的話,完全拿捏住了詞語本來的意思,語言逼格立馬提升好幾度。
甚至還能找出意思相近的古詩文。
來自歐陽修《秋聲賦》中的這句「百憂感其心,萬事勞其形,有動乎中,必遙其情」,說的意思就是焦慮使人精神疲憊。
果真是能通殺古今了。
於是,我們找來了更多網路流行語餵給它,看看還能擦出什麼火花~
聽我說謝謝你,但古詩版
第一個要嘗試的網路名句,是「聽我說,謝謝你」。
神器反向輸出結果中,意思最為貼近的是王維的這句「舉世無相識,終身思舊恩」。
這句詩中明確體現了說話主體人表達感謝之意,稱得上是「聽我說謝謝你」的究極上流版。
還有在句式上非常接近的結果,是溫庭筠筆下的「知我意,感君憐」。
最讓人意想不到的,是神器反向輸出了《將進酒》裡的「與君歌一曲,請君為我傾耳聽」。
乍看之下,這個答案好像是錯的。
但要知道「聽我說謝謝你」能成為梗,就是因為防疫人員尷尬被迫聽歌事件……
這麼看,反向輸出神器還意外扣了題。
不只是這句梗,還有很多網路用語,反向輸出神器的回答都是貌似不著邊際,但又讓人覺得異常契合。
比如輸入「無語子」,給出的詩句有:
滿懷心腹事,盡在不言中。
這不就是大家表達無語時的真實心境嗎?因為不便明說,所以沉默,所以無語。
還有這句「你品,你細品」,輸出的詩句也都帶有了仔細品讀、反覆回味的意思。
那麼,這個好用又好玩的神器,到底是什麼來頭呢?
來自清華的「據意查句」
以上說的這個好登西,是由清華推出的「據意查句」神器——WantQuotes。
誕生自清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP),項目指導教師為孫茂松教授和劉知遠副教授。
能夠快速從全世界這麼多語料中找到你想要的句子,這個神器主要靠的是一個超大的資料集和一個推薦模型。
資料集包含了英語、現代漢語和文言文三大部分。
其中,英語部分有6108個名言警句和126713個上下文文字段;
現代漢語部分,包含有3004句名言和408433個相關上下文;
文言文部分,則有4438段文言典故(包括古詩)和116537段相關上下文。
推薦模型方面,本文提出使用BERT作為句子編碼器來學習名言警句和相關文字表示。
但由於絕大多數名言警句的表達都非常凝練,但是可能其中每個背後的意義又包含很多層,所以在本方法中,研究人員將義原引入到編碼器中。
簡單來說,義原是語言學中最小的語義單位。語言學家認為義原體系在任何語言中都適用,不與特定語言相關。
舉個例子,「男孩」這個詞可以由「人類」、「男性」、「兒童」這個三個義原表示,「女孩」則可以由「人類」、「女性」、「兒童」的組合來表達。
因此在模型中引入義原後,就能很好解決詞義消歧的問題,並且能更準確地捕捉到詞與詞之間的關係。
也就是讓模型把語言學得更加透徹。
而在具體任務對比中可以看到,本文方法的性能均優於其他方法。
同時用消融實驗驗證了訓練方法的有效性(下表最後三行結果)。
在只給出左側文字的條件下,本文方法的結果依舊優於過去方法。
還有反向詞典和AI作詩系統
看到這裡你可能覺得這項工作有點似曾相識。
沒錯,那個之前爆火的「反向詞典」也來自這個實驗室。
所謂「反向」,就是和常規詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。
比如還是這句「聽我說謝謝你,因為有你,溫暖了四季」,用成語應該怎麼說?
反向詞典可以立馬拋出幾十乃至上百個選項出來,並且還會標註推薦程度。
背景顏色越深,代表系統推薦程度越高。
要是碰上啥看不懂的,滑鼠一點,就能查看具體釋義。
而除了拯救現代失語人外,他們還讓AI嘗試過寫古詩,之前也在網路上爆火過。
不得不說,THUNLP真是要把AI+中文玩出花了。
該實驗室由孫茂松教授領銜,教師隊伍中還有劉洋教授和劉知遠副教授。
前不久,THUNLP還獲得了ACL 2022最佳演示論文獎(Best Demo Paper Award)。
該獎項是ACL系列會議對System Demonstration論文授予的最佳論文獎項,每屆會議基於評審人員評估的系統貢獻度、完成度、影響力及會議演示綜合效果的綜合評價評選出一篇獲獎論文。
One More Thing
目前,「反向詞典」在網頁端和微信小程序上都能使用,APP在路上了。
「據意查句」還只能在網頁端使用(需要掃碼關注公眾號登陸一下子)。
另外,團隊表示還是希望大家在使用時多給反饋、多提建議。
比如給好的推薦名句點贊,如果看到有錯誤之處也能直接指正。
對了,研發團隊還表示,作為開源項目隨時歡迎大家加入,參與項目設計&開發、提出需求、反饋問題。
感興趣的話就去官網戳戳公告吧~
「據意查句」官網:
https://wantquotes.net/
「反向詞典」官網:
https://wantwords.net/
參考連結:
https://weibo.com/5198011111/LE58vxn0N?