「我讓 AI 來處理我 24 小時的音訊資訊——這會是未來嗎?」

整理 | 鄭麗媛

這幾年 AI 發展和進化的速度,幾乎可以用三個字來形容:殺瘋了。

AI 下棋、AI 程式設計、AI 作畫、AI 寫小說、AI 預測蛋白質結構……當 AI 逐漸融入我們的生活,你是否設想過,我們的未來會如何發展?會像許多科幻電影和賽博龐克類小說中說的那樣,讓 AI 管理和安排我們的日常?

正如未來學家尼葛洛龐帝所說,「預測未來的最好方法,就是去創造未來」,最近國外一位小哥 RoberDam 便提前「體驗」了一把他眼中的未來:「我 24 小時都用音訊記錄自己,然後用 AI 來處理這些資訊——這會是未來嗎?」

恰好出現的 Whisper

恰好出現的 Whisper

說來有些好笑,RoberDam 會對這個測試提起興趣的原因之一,是 1TB 記憶體手機的出現:「迄今為止已經有多種型號的智慧手機都具有 1TB 的記憶體,這能幹什麼呢?能全天候地記錄自己的音訊!」

恰好今年 9 月底,OpenAI 又發佈了一個名為 Whisper 的語言 AI 模型,並聲稱它在英語語音識別方面的準確性已接近人類水平——RoberDam 靈光一閃,齊活兒!

「當然,這只是一個預測未來的實驗,就是想看看什麼可能、什麼不可能。」

首先,RoberDam 買了幾個麥克風帶在身上,整天開著,記錄他一天說的話。計劃當一天結束後,他就把這些音訊交由 OpenAI 的 Whisper 處理,轉化為文字檔案,從中提取資訊。

不過,畢竟每天說的話太多,RoberDam 認為還是有必要畫個重點的。因此,他創建了一個初級的「數字助理」程序,將一些重要資訊通過關鍵詞「Robert」和「End Robert」主動讓其捕捉:「每次我說出‘Robert’這個詞時,表明我之後所說的一切都是我對助手的命令,直到我再次說‘End Robert’,意味著命令結束。」

舉兩個例子:

  • 想讓「數字助理」記錄當天的體重,RoberDam 只需大聲說:「Robert WEIGHT 60.1 end Robert。」

  • 想讓「數字助理」記錄當天的睡眠時間,RoberDam 也只需說:「Robert SLEEP 7 hours 14 minutes end Robert。」

等一天結束,Whisper 將當天的音訊處理並轉換為文字後,「數字助理」程序就會負責搜尋命令的文字並提取關鍵詞之間的所有內容。

足以確保 100% 的隱私,還等同於「模擬 API」

說到這裡,可能有些人會覺得,何必如此麻煩搞個「數字助理」,直接用 Google 的「OK GOOGLE」和蘋果的「Siri」不香嗎?

以「OK GOOGLE」為例,RoberDam 總結了三點侷限:

  • 命令受限:不夠了解「OK Google」可以互動式地做什麼,對它的一些命令只會作為 Google 搜尋返回。

  • 不夠隱私:你對「OK Google」說的命令和完整音訊檔案都會一起保存在 Google 中,搜尋歷史記錄就能查到。你不僅能聽到自己的聲音,旁邊人的對話可能也會被錄進去。

  • 同步處理:當你向 Google 發送命令時,通常會有幾秒的延遲,可能用於搜尋也可能在辨別你的命令,而這會分散你的注意力,讓你關注它的反饋,有時候這比你直接手動操作還慢。

基於這三點,RoberDam 自己創建的「數字助理」就很好地解決了這些問題:

  • 命令受限:命令由 RoberDam 自己決定,他知道「數字助理」能處理什麼。

  • 不夠隱私:所有音訊只有 RoberDam 一人擁有,確保 100% 隱私。

  • 同步處理:它是非同步處理的,所以 RoberDam 不用費心盯著它有沒有及時響應,想到了就說出命令,一天結束後它會自己處理。

另外值得一提的是,這個「數字助理」某種程度上來說等同於一個「模擬 API」——一些電子設備原本只能與手機連接,但現在 RoberDam 通過將音訊交由「數字助理」處理,間接實現了多個設備之間的通訊。

目前還存在一些弊端

目前還存在一些弊端

總之,某一天 RoberDam 終於克服了羞恥心,時不時就對著麥克風喊著:「Robert……end Robert」,最終他明確向「數字助理」說的所有資訊都可以集中在日常控制面板中:

不僅如此,RoberDam 表示,為了進一步了解當天的日程,還可以創建「我的日記」以生成當天所做事情的摘要:

不過,RoberDam 也承認,這種 AI 處理方式還存在一些弊端。例如:現階段的「數字助理」並不會提醒他當天必須要做的事情;由於是非同步處理的,只有到晚上才知道那些命令有沒有被成功處理;還有在別人眼裡,他的「自言自語」可能有點奇怪。

除了 RoberDam 主動要求「數字助理」處理的資訊,他日常被麥克風記錄下來的其他音訊也有作用。以下是他目前正在進行的嘗試:

  • 關係溫度計

根據對夫妻關係的研究,通過研究夫妻對話,特別有關夫妻之間積極和消極互動,可以以高達 90% 的準確率預測夫妻是否要離婚:https://www.gottman.com/blog/the-magic-relationship-ratio-according-science/

  • 情緒分析

嘗試按小時進行情緒分析,以便能夠確定白天產生最大壓力、放鬆、快樂和悲傷的情況。

  • 全面回顧

等於一個搜尋引擎,可以完整回顧他對某個話題的確切看法。

對於 RoberDam 以上的研究,許多網友表示新奇和肯定:

  • 「一般來說,我們不希望被別人監視,但我們自己活動的管理記錄可能非常有價值。」

  • 「好主意,以後可以搜尋日誌以供參考,因為它都是文字。」

那麼,你認為這種形式會是 AI 發展的未來嗎?

參考連結:

  • https://roberdam.com/en/wisper.html

  • https://news.ycombinator.com/item?id=33608437

相關文章

「生成式技術」正在顛覆人類創作!

「生成式技術」正在顛覆人類創作!

整理 | 王啟隆 在過去的半年裡,AI 寫小說、繪畫和剪視訊等熱點新聞火爆全球,現在只需要在鍵盤上敲幾個關鍵詞,AI 就能在燒著我們顯示卡的...