ChatGPT 還在2G衝浪?新模型 youChat 已能夠解說2022世足賽

youChat 能成為搜尋引擎變革的先行者嗎?

ChatGPT 自推出以來就被寄予厚望,一些人認為它會取代搜尋引擎,成為「改變遊戲規則的人」。

真的會有這一天嗎?至少,一部分業內人士已經啟動了頗具挑戰性的落地試驗。

今天,搜尋引擎 You.com 公司 CEO Richard Socher 在Twitter宣佈,「youChat」已經正式上線。

新的試用功能已經發布在 You.com 搜尋引擎的首頁:

「我們非常高興今天推出 youChat v1。這僅僅是個開始。我們將很快發佈具有更多獨特功能的改進版本。」目前,youChat 以測試版的形式發佈。

youChat 具有與 ChatGPT 類似的功能,使用者可以在搜尋引擎的「Chat」選項欄進行對話:

如果你問 youChat:誰是這個世界上最美麗的女人?答案可不是白雪公主。它會告訴你是 Yael Shelbia,而且還會解釋為什麼是她:

面對「誰贏得了這屆世界盃」的提問,資料庫比較滯後的 ChatGPT 答不上來。但 youChat 答對了,還解釋了一番:

關於「梅開二度」,youChat 還能進行一次盤點:

在移動設備上,使用者也可以通過 [http://you.com/chat] 聊天。當前,這個連結也可在桌面上使用,但僅顯示聊天,而沒有任何其他應用程序或連結。

youChat 怎麼用

與一般搜尋引擎不同的是,youChat 了解最近發生的事件,並可以為其答案提供引用。

比如:「誰是Twitter公司的 CEO?」youChat 給的答案是「馬斯克」,同時也會告訴你,近來的Twitter都發生了什麼。

ChatGPT 的資料庫似乎還停留在過去的某一天。對於同樣的問題,ChatGPT 的答案是:

Richard Socher 表示,通過 youChat,他們希望解決搜尋中的兩方面的問題:讓搜尋更直觀、更有幫助、更快,以及讓大型語言模型更可靠。

youChat 會像 AI 助手一樣響應使用者的提示,讀取、寫入和彙總資訊。這顛覆了使用者從搜尋引擎獲取結果的方式:

首先,通過易於理解的句子獲得資訊,而不是連結列表:

其次,理解複雜的概念

其次,理解複雜的概念:

其次,理解複雜的概念
其次,理解複雜的概念

此外,還可以獲取有關聖誕禮物、論文大綱或程式設計之類問題的 idea:

使用者測評:「差點意思」

使用者測評:「差點意思」

在發佈的同時 Richard Soche 還表示:「我們將在 2023 年徹底改變人們對搜尋引擎的看法。」不過,youChat 即使比其他大型語言模型更經常更新和更真實,也仍然會出錯。

發佈之後,一些使用者立刻指出了 youChat 的不足:「這是我的第一個問題。它甚至不知道今年是什麼。」

特斯拉今年的最低股價是多少?

特斯拉今年的最低股價是多少?

比特幣的價格是多少?

比特幣的價格是多少?

Richard Socher 的回覆是:「對於此類查詢,我會使用搜尋引擎的主要應用程序和結果,例如參閱中心底部,這將提供準確的答案。我們很快就會合並這些類型的應用程序。」

看起來,提問的「措辭」很重要:

看起來,提問的「措辭」很重要
看起來,提問的「措辭」很重要

另一位使用者則提問:「曼聯下一場比賽是什麼時候?」youChat 答:「2022 年 1 月 15 日。」

這位使用者真誠地建議:「是時候讓它停止產生幻覺了。」

問答模型爆火之後

ChatGPT 能在 2022 年底成為 AI 界頂流,是因為它掌握廣泛的基本知識,特別是在程式設計方面,甚至有人認為 ChatGPT 將取代搜尋引擎。

據外媒 VentureBeat 報道,在 Forrester 公司分析師 Rowan Curran 看來,生成式 AI 此刻面臨的時機至關重要:「我唯一能夠比較的是 iPhone 的發佈。蘋果公司的 iPhone 不是第一款智慧手機,但它以其觸控式螢幕、易用性和引入的應用程序埋葬了競爭對手,將完整的計算體驗放進了人們的口袋。」

短短几天就湧入了百萬數量級的使用者,的確驗證了 ChatGPT 的受歡迎程度。另一方面,ChatGPT 也在改變公眾對可能性的認知。

作為一個問答語言模型,ChatGPT 首先以出色的回答給人以深刻的印象。比如,它可以和人們就「現代物理學的發展史」高談闊論 20 分鐘:

詢問計算機相關的知識,更是對答如流,例如解釋正規表示式的含義:

在程式設計方面,ChatGPT 還能自動寫程序,找 bug:

關於 ChatGPT 是否會取代現有的搜尋引擎,我們需要分析一下 ChatGPT 的能力和短板。儘管作為一個語言模型,它能夠給出邏輯清晰,又不乏知識性的回答,但不是所有的回答都是完全正確的。

上線幾天之後,Stack Overflow 就宣佈封禁了 ChatGPT,原因是 ChatGPT 生成的答案錯誤率很高,並且錯誤不容易發現。這會給使用 Stack Overflow 查詢程式設計問題的使用者帶來非常大的困擾。

我們知道,搜尋引擎能被廣泛接受和使用,除了它方便快速,更重要的是搜尋到的資訊正確率是很高的,並且一些百科網站也在不斷完善知識的覆蓋面和準確性,這需要大量的人工校對和專業知識。而 ChatGPT 等 AI 語言模型的現狀是生成功能強大,但知識的準確性很難有保證。

知識型模型是近期學術界和業內努力探索的一個方向。人們希望未來的 AI 是掌握大量科學知識的,進而實現通用人工智慧(AGI)。但從目前的工作看,構建知識型模型還差得很遠。例如,前段時間 Meta 的模型 Galactica 上線僅兩天就火速下架,因為該模型生成的知識性內容存在嚴重錯誤。

現在,無論是 OpenAI 強勢推出的 ChatGPT,還是最新出爐的 youChat,都不滿足知識準確無誤這一基本要求。從這個意義上講,大規模語言模型和搜尋引擎還相距甚遠。

或許 youChat 和 ChatGPT 有幾分相似,但它們在回答正確性方面還有很大的提升空間。

參考連結:

https://venturebeat.com/ai/why-this-chatgpt-moment-harks-back-to-the-original-iphone/