「聽我說謝謝你」還能用古詩來說?清華搞了個「據意查句」神器,一鍵搜尋你想要的名言警句

明敏 發自 凹非寺
量子位 | 公眾號 QbitAI

艾瑞巴得,又有神器來拯救文盲了!

天氣太熱只會唸叨一句「熱死了」?發朋友圈翻來覆去才憋出幾個字?

這個檢索神器值得了解一下。

只要在搜尋框裡輸入你想表達的意思,如「熱死了」。

立刻就能有20個表達這一意思的句子任君挑選。

表達這一意思的句子任君挑選

句子類型還能按需選取,名言警句、歇後語、古詩文都不在話下。

並且給出的名言還會註明出處作者,這下再也不用啥話都往迅哥兒身上套了。

怪不得網友直呼

怪不得網友直呼:朋友圈文案高級表達查找替換系統

而且,我們在試玩了幾輪後發現,這個神器在hold住網路俗語「精髓」上的表現有些出人意料。

比如這兩天大家都在說的「精神內耗」。

它給出了一段盧梭的話,完全拿捏住了詞語本來的意思,語言逼格立馬提升好幾度。

甚至還能找出意思相近的

甚至還能找出意思相近的古詩文

來自歐陽修《秋聲賦》中的這句「百憂感其心,萬事勞其形,有動乎中,必遙其情」,說的意思就是焦慮使人精神疲憊。

果真是能通殺古今了

果真是能通殺古今了。

於是,我們找來了更多網路流行語餵給它,看看還能擦出什麼火花~

聽我說謝謝你,但古詩版

第一個要嘗試的網路名句,是「聽我說,謝謝你」。

神器反向輸出結果中,意思最為貼近的是王維的這句「舉世無相識,終身思舊恩」。

這句詩中明確體現了說話主體人表達感謝之意,稱得上是「聽我說謝謝你」的究極上流版。

還有在句式上非常接近的結果,是溫庭筠筆下的「知我意,感君憐」。

最讓人意想不到的,是神器反向輸出了《將進酒》裡的「與君歌一曲,請君為我傾耳聽」。

乍看之下,這個答案好像是錯的

乍看之下,這個答案好像是錯的。

但要知道「聽我說謝謝你」能成為梗,就是因為防疫人員尷尬被迫聽歌事件……

這麼看,反向輸出神器還意外扣了題

不只是這句梗,還有很多網路用語,反向輸出神器的回答都是貌似不著邊際,但又讓人覺得異常契合。

比如輸入「無語子」,給出的詩句有:

滿懷心腹事,盡在不言中。

這不就是大家表達無語時的真實心境嗎?因為不便明說,所以沉默,所以無語。

還有這句「你品,你細品」,輸出的詩句也都帶有了仔細品讀、反覆回味的意思。

那麼,這個好用又好玩的神器,到底是什麼來頭呢?

來自清華的「據意查句」

以上說的這個好登西,是由清華推出的「據意查句」神器——WantQuotes

誕生自清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP),項目指導教師為孫茂松教授和劉知遠副教授。

能夠快速從全世界這麼多語料中找到你想要的句子,這個神器主要靠的是一個超大的資料集和一個推薦模型

資料集包含了英語、現代漢語和文言文三大部分。

其中,英語部分有6108個名言警句和126713個上下文文字段;

現代漢語部分,包含有3004句名言和408433個相關上下文;

文言文部分,則有4438段文言典故(包括古詩)和116537段相關上下文。

推薦模型方面,本文提出使用BERT作為句子編碼器來學習名言警句和相關文字表示。

但由於絕大多數名言警句的表達都非常凝練,但是可能其中每個背後的意義又包含很多層,所以在本方法中,研究人員將義原引入到編碼器中。

簡單來說,義原是語言學中最小的語義單位。語言學家認為義原體系在任何語言中都適用,不與特定語言相關。

舉個例子,「男孩」這個詞可以由「人類」、「男性」、「兒童」這個三個義原表示,「女孩」則可以由「人類」、「女性」、「兒童」的組合來表達。

因此在模型中引入義原後,就能很好解決詞義消歧的問題,並且能更準確地捕捉到詞與詞之間的關係。

也就是讓模型把語言學得更加透徹。

而在具體任務對比中可以看到,本文方法的性能均優於其他方法。

同時用消融實驗驗證了訓練方法的有效性(下表最後三行結果)

在只給出左側文字的條件下,本文方法的結果依舊優於過去方法。

還有反向詞典和AI作詩系統

看到這裡你可能覺得這項工作有點似曾相識。

沒錯,那個之前爆火的「反向詞典」也來自這個實驗室。

所謂「反向」,就是和常規詞典不同,不是按詞尋義,而是反過來給詞典一段描述,讓它來幫你找詞。

比如還是這句「聽我說謝謝你,因為有你,溫暖了四季」,用成語應該怎麼說?

反向詞典可以立馬拋出幾十乃至上百個選項出來,並且還會標註推薦程度。

背景顏色越深,代表系統推薦程度越高。

背景顏色越深,代表系統推薦程度越高

要是碰上啥看不懂的,滑鼠一點,就能查看具體釋義。

而除了拯救現代失語人外,他們還讓AI嘗試過寫古詩,之前也在網路上爆火過。

不得不說,THUNLP真是要把AI+中文玩出花了。

該實驗室由孫茂松教授領銜,教師隊伍中還有劉洋教授和劉知遠副教授。

副教授

前不久,THUNLP還獲得了ACL 2022最佳演示論文獎(Best Demo Paper Award)。

該獎項是ACL系列會議對System Demonstration論文授予的最佳論文獎項,每屆會議基於評審人員評估的系統貢獻度、完成度、影響力及會議演示綜合效果的綜合評價評選出一篇獲獎論文。

獲獎論文

One More Thing

目前,「反向詞典」在網頁端和微信小程序上都能使用,APP在路上了。

「據意查句」還只能在網頁端使用(需要掃碼關注公眾號登陸一下子)。

另外,團隊表示還是希望大家在使用時多給反饋、多提建議。

比如給好的推薦名句點贊,如果看到有錯誤之處也能直接指正。

對了,研發團隊還表示,作為開源項目隨時歡迎大家加入,參與項目設計&開發、提出需求、反饋問題。

感興趣的話就去官網戳戳公告吧~

「據意查句」官網:

https://wantquotes.net/

「反向詞典」官網:

https://wantwords.net/

參考連結:

https://weibo.com/5198011111/LE58vxn0N?

相關文章

黃仁勳從烤箱裡取出新鮮出爐的GPU

黃仁勳從烤箱裡取出新鮮出爐的GPU

深黑的皮衣,蒼白的頭髮,熟悉的Jensen Huang又來了,但是少了寬敞的會場和粉絲的尖叫。 因為美國疫情的原因,英偉達和其他科技公司一樣...

臉部辨識遭到美國波士頓政府禁用

臉部辨識遭到美國波士頓政府禁用

郭一璞 發自 凹非寺量子位 報道 | 公眾號 QbitAI 舊金山之後,美國又有一座大城市禁用臉部辨識了。這次,是哈佛、MIT等知名高校的所...