「生成式技術」正在顛覆人類創作!

整理 | 王啟隆

在過去的半年裡,AI 寫小說、繪畫和剪視訊等熱點新聞火爆全球,現在只需要在鍵盤上敲幾個關鍵詞,AI 就能在燒著我們顯示卡的同時畫出一幅幅優美的圖畫,一個全新的應用世界向未來的初創公司敞開了大門。

人類現在擁有著一大批高質量、廉價、快速的 AI 模型,用以生成文字、圖像、視訊、軟體程式碼、音樂、聲音和 3D 建模,而這些 AI 模型都不存在版權和抄襲問題。這場契機,可能將引起自加密貨幣問世以來網際網路最大的一次變化。

在過去的兩年裡,矽谷明星早期投資機構 NFX 的創始合夥人 James Currier 已經在這個領域投資了 4 家公司,並計劃在未來的一年內進行更多的投資。本文便是以 James Currier 在 NFX 部落格上發佈的文章為基礎,為所有躍躍欲試的創業者和對 AI 潛力感興趣的開發者,介紹這場人機協作的新變革。

AI 的得獎畫作。你喜歡人工智慧的畫嗎?

「生成式 AI」(Generative AI)或 「AIGC」(AI-Generated Content)這樣的名字已經廣為人知,但事實上,AI 只能構成這項技術的等式的一半。AI 模型僅僅只是這些堆疊的使能基本層,而它的頂層將是數千個甚至數萬個應用程序,是整個成熟的生態。本文將用一個更宏觀的概念——「生成式技術」(Generative Tech),來命名這場變革。

2021 年 1 月 11 日,人工智慧初創公司 Jasper 成立,該公司通過 AI 在部落格文章、社交媒體帖子及網頁等平臺自動生成文字內容。在上市 18 個月後,Jasper 的營收達到近 1 億美元,估值達到 15 億美元。

如今,世界各地陸續誕生了許多「生成式 AI 平臺」,生成式技術行業的發展速度如此之快,以至於它已經得到了實際收入和高估值的驗證。據傳,支持 GPT-3 和其他 AI 模型的 Open AI 也在籌集資金,估值高達數十億美元。另一家大型 AI 模型製造商 Anthropic 亦是籌集了超過 7 億美元。

2022 年 9 月,投資網站 Signal 中加入了「生成式技術」作為新的投資類別,呼籲投資人或天使投資人加入這個新領域,鼓勵勇敢的創始人立即在這個領域創建公司,以趕上技術採用週期的最佳部分。新的浪潮已經到來,所需的僅是無畏的投機者。

「生成式技術」有什麼獨到的創新之處?

「生成式技術」有什麼獨到的創新之處?

圖源:NFX

圖源:NFX

生成式技術是一種全新的網際網路拓撲結構。

時至今日,網際網路的特點還是以前的那一套:也就是先通過資料庫查詢,獲取儲存的舊內容,再從中心傳遞給處於資訊網路邊緣的個體。生成式技術會改變網際網路現有的拓撲結構,因為它會先讓獨特性的內容在資訊網路邊緣生成,再通過個體的行為完成最終實現。

這是一個重大轉變,能為初創公司帶來無限的機會。如果說 Web1 是「只讀」的、Web2 是「讀寫」的、生成式技術是「讀-寫-生成」的,那麼 Web3 就是「讀-寫-生成-自有」的。生成式技術如今在與 Web3 並行發生,並且發展得十分迅速。

圖源:NFX

圖源:NFX

人類活動因生成式技術發生變化。

生成式技術的存在,能讓全球將近二十億的知識分子提升自己的工作效率和質量。一些人可以因此去做自己以前不能做的工作,創造新型就業崗位。雖然必定會有一些工作被降級、威脅、取代——並在未來 36 個月內引起數千萬工作者的恐懼和自我懷疑——但是,最終的結果必定是利大於弊,人類整體的能力、生產力和效率的擴大將遠遠超過損失,最終產生數萬億美元的價值。

對於知識分子和創作者來說,靈感是至關重要的。作家、學生、市場營銷人員、程式設計師、建築師、平面設計師、音樂家、攝像師、銷售員、客服、劇作家……世界上有太多種類的職業工作者渴求靈感,而生成式技術可以提供源源不斷的靈感,這個工具有助於他們的腦中產生「第一個想法」,實現從無到有的突破。

StabilityAI 生成的圖像

StabilityAI 生成的圖像

在今天這個時代,軟體一直被用來完善人類最初的靈感,負責靈感誕生後的生產和實現,將人類腦中的幻想變為現實。生成式技術可以讓靈感的形成過程中也得到機器的幫助,再結合舊時代的軟體,走完剩下的路。

這種從 0 到 1 的改變,是今天的軟體無法實現的。但生成式技術,可以讓人類從任何項目的起點就得到 AI 的幫助。

正是因為我們總會遇到創造性的時刻、遇到靈感的誕生,才讓人覺得人類是如此獨特和神秘,是我們生而為人的驕傲。如果機器人都能有思想了,那還需要我們人類做什麼呢?這自然會引起許多不安。

當然,就像大多數人機界面誕生之初一樣,人類最終會將克服一切困難並習慣它。在未來,AI 會從一件工具變成人類的合作伙伴,這將會是新的常態。

1980 年的時候賈伯斯說過,蘋果的 PC 是人類思維的腳踏車。那麼,生成式技術便是人類思想的一艘火箭,這些 AI 模型的創造者甚至可能將其視為真實的頭腦。

自五十年代以來,人類一直在討論基於軟體的思維的必然性。1997 年,IBM 的深藍(Deep Blue)在國際象棋比賽中擊敗了卡斯帕羅夫(Kasparov)。2016 年,AlphaGo 在圍棋比賽中完勝李世石,實現了一次重大飛躍。從 2022 年開始,生成式技術的問世會對未來的全球數十億工作者產生深遠的影響。

為什麼生成式技術能夠發展至今?

為什麼生成式技術能夠發展至今?

近期,Open AI 提供了專用於「生成式 AI 模型」的開源替代方案,讓生成式技術在近半年內逐漸變得開源開放。2022 年 2 月, Eleuther.ai 發佈 GPT-NeoX-20B,成為 OpenAI 的 GPT-3 生成式文字技術開源替代方案;又過了半年,2022 年 8 月,StabilityAI 推出了 Stable Diffusion,成為 OpenAI DALL-E 2 的生成式圖像/視訊的開源替代方案,不久前,Stable Diffusion 宣佈融資 1 億美元。

生成式技術已經逐漸吸引了多家公司入場,這些公司在價格、質量和便利性多方面展開競爭。作為反饋,在過去的兩個月裡,AI 生成圖像的成本下降了 100 倍。在今天,經受訓練的 Stable Diffusion模型,已經可以微調模仿出宮崎駿知名的吉卜力風格,達到以假亂真的地步。

StabilityAI 已經訓練出宮崎駿動畫風格的成熟模型

如此可見,AI 生成的文字、圖像、程式碼、語音質量正在迅速達到人類的水平,其中有些作品甚至能讓人誤以為 AI 通過了圖靈測試。藝術作品的質量通常很難進行量化的比較或客觀的衡量,但當你看到一件藝術作品的時候,你會在潛意識立即對它做出反應,從而進行質量的判斷。

正如 2021 年史丹佛大學人工智慧指數所指出的那樣,對於一些受限的應用,人工智慧已經發展到「足夠高的標準,人類很難區分人工智慧合成和非人工智慧合成的作品」。我們正朝著「萬物皆可生成」的方向前進。

這是一場技術界的寒武紀大爆發。網際網路的生態因生成式技術的誕生開始改變,資訊產業浪潮將再次到來。生成式技術還處於早期階段,但它已經從曾經科幻作品中的幻想逐漸演變為現實。生成式技術與自動駕駛汽車不同,因為生成式技術不用面臨監管問題,更不需要擔心交通事故和性命安全。生成式技術與虛擬現實不同,因為虛擬現實技術還需要找到有意義的應用方式,也不用普及硬體設備,生成式技術如今已經有著相當成熟的應用方式了——那就是創造靈感。

事實上,都不需要考慮成本和質量,幾乎任何一種生成式技術內容都足夠讓一家公司發展起來:Podcast.ai 就是一家完全通過「生成式技術」運營的播客,2022 年 10 月 12 日,在 Podcast.ai 推出的第一集播客節目裡,AI 模擬了已故的賈伯斯,讓美國知名播客主持人 Joe Rogan 和這位「AI 賈伯斯」進行了一場長達 20 分鐘的對話。

生成式技術如今所處的位置仍只是一個斜坡,還需要不懈地攀爬讓它實現技術界的變革。在 AI 技術經歷了 14 年的停滯之後,我們的大多數軟體和人機界面可能會在未來 5 年內開始得到顯著增強,併為創業者提供無盡的機會。

生成式技術產品都有哪些特點?

生成式技術產品都有哪些特點?

生成式技術產品一共分為兩層:

底層自然就是它的 AI 模型。AI 模型能夠吸收使用者獨有的想法,生成新穎的結果,例如 OpenAI 的 DALL-E 或 GPT-3,都是典型的 AI 模型。AI 模型的價格還在逐漸下降,早期還是高不可攀的 1 億美元,現在下降到了千萬級別,而開源的 AI 模型也如同雨後春筍般冒出,想必在未來也是觸手可及。

頂層就是它的應用程序。應用程序是一切的結果,它能產生持久的業務,為公司創造價值。初創公司如果想要獲得競爭優勢,那麼不僅需要獨特的創意,還需要合格的包裝與應用程序,二者缺一不可。

圖源:NFX

圖源:NFX

生成式技術降低了很多領域的技術壁壘。一個人哪怕不是建築師,也能知道什麼樣的房屋是適合自己的,並使用這項技術生成房屋改造圖紙;一個人哪怕不是插畫師,也懂得欣賞什麼樣的畫是美的,並使用這項技術生成 AI 畫作……在這一基礎上,生成式技術公司可以被總結出三種核心特徵:

1、從 0 到 1 ——從 0 到 10 !

前文提到,生成式技術可以解決人類糾結了幾個世紀的靈感缺乏問題,AI 能幫助無數的創作類職業獲取靈感,實現從 0 到 1 的突破;但是,從 0 到 1 還只是 AI 能做的第一件事,在提供靈感之後,你會發現連剩下的工作都能由 AI 完成,AI 將能提供從 0 到 10 的解決方案——換句話說,只要擁有對應的 AI 模型,產品將可以滿足使用者的全部需求。

既然 AI 可以生成靈感,那為什麼不乾脆讓 AI 把剩下的工作也一起完成呢?

事實上,目前早就已經出現了這樣的生成式技術項目,那就是 SALT。SALT 是世界上第一部 AI 創建的電影,完全由 AI 編寫和配音,AI 以 70 年代的科幻電影為藍本,使用生成式技術工具的組合來快速生成最終的視訊(Stable Diffusion、MidJourney、DALL-E)、編寫腳本(GPT-3)和生成角色聲音(Murf、Synthesia)。

2、用創造取代策展

2、用創造取代策展。

所謂策展(curation),即策劃、篩選並展示的意思。在千禧年之後的這二十年以來,人類一直通過策展來追求個性化;各類電子商務供應商、視訊網站和音樂網站,每天日復一日從他們的中央資料庫中為你提供你最有可能喜歡的精選產品,也就是所謂的「個性化推薦」和「大資料推送」。

策展是一種非常有限的個性化方法,它基於調用現有的資料,試圖將人們的偏好融入到現有的產品中,而不是在創造最適合使用者的新產品。

如今,生成式技術改變了這點,它正在以一種我們從未體驗過的方式進行個性化。生成式技術用創造取代了策展,不需要複雜的資料庫調用,而是由資料庫進行訓練,並生成全新的事物。

這些都是講空話嗎?事實上,目前生成式技術確切地影響了一些領域的發展,其中就包括音樂領域。現在已經出現了不少平臺——Boomy、Amper、Aiva、Ecrett、SoundDraw——這些平臺能讓從未製作過音樂的人也可以在幾秒鐘內創作出原創歌曲,其中的 Boomy 平臺還為創作者提供了分享和變現這些作品的工具,讓歌曲能直接在 Spotify、TikTok、YouTube 和全球 40 多個其他平臺上發佈。

AI 正在逐漸改變我們的生活。在過去,我們可能會在自駕遊的時候選擇一個熱門的歌單播放,或者是盲從「個性化推薦」和「大資料推送」聽音樂;但在不遙遠的未來,在生成式技術的世界中,我們將能根據自己所在的場合、當前的情緒、血壓、心率,隨時隨地生成和聆聽自己真正需要的歌曲。

3、無害而低摩擦的界面

3、無害而低摩擦的界面。

生成式技術工具最大的特點就是它的易用性,如此繁重的工作,全由 AI 模型完成,在創造過程中最大程度消除了摩擦。像 DALL-E 和 Stable Diffusion 這類主流 AI 模型,只需要簡單的文字提示,就可以在 30 秒內生成令人膛目結舌的藝術品。

在未來,生成式技術還將會日常化,甚至自動化。試想未來的某一天,兩個人走入虛擬社區中的一間房子裡,生成式技術能根據這兩個使用者的個性不斷地生成全新的東西——這些東西可以是藝術品、遊戲、音樂和共同話題,而如果這兩個使用者打算交易買賣,那生成式技術還能自動產生 NFT,供他們進行挑選……

這將是人機協作的又一次革命,AI 從工具變成了人類的夥伴,在啟發人靈感的同時,帶來無限的驚喜。

生成式技術公司是做什麼的?

生成式技術公司是做什麼的?

既然一切都交給 AI 了,那生成式技術公司需要做什麼呢?這是個很容易陷進的誤區,因為使用生成式技術的每一個偉大創意,最終其實還是來自於操控 AI 模型的人。思考一下這麼一種可能,如果將一個或多個基礎層的 AI 模型結合起來,會怎麼樣?

圖源:NFX

圖源:NFX

創新這件事挺難的,每年都有成千上萬的文章教導創業者要如何創新、如何找到自己的優勢、如何把握好機會……但是,用 AI 創新卻相當簡單。因為創業者可以直接去尋找一個已有的、仍未大規模使用 AI 的領域,直接領先還在手工業時代的同行們(這句話有點誇張了——不過,對於未來的 AI 來說,人類可能真的還處於手工業時代)。

搶佔先機可以創建優勢,但這種優勢會隨著大公司的入場、更泛用的 AI 模型問世以及商業競爭等原因迅速消散。這時候就進入主題了,生成式技術公司需要在這種時候發揮什麼作用呢?

  • 思考如何讓每個新使用者都能為其他每個使用者增加價值。

AI 模型那是誰都能用的,只需要敲敲關鍵詞,你我都能用 AI 生成精美的圖畫。因此,生成式技術公司除了技術本身,最應該弄好的就是社區,社區能創造價值,創造更多的網路效應。

  • 思考如何讓生成式技術融入企業或個人的生活中。

目前為止,生成式技術還都只是「圖一樂」的階段,還沒有多少人真的拿它進行創作,讓它幫助自己的生活更美好。生成式技術公司這就得起到一個引導的作用,讓使用者從長遠來看不想離開 AI 模型的幫助。

  • 結合舊時代的發明。

AI 模型並不會真的取代現有的全部軟體,我們每天還是離不開瀏覽器和應用程序的——所以,為什麼不乾脆把這些東西和新時代的 AI 模型結合起來呢?人不可能靠一個 AI 模型「一招鮮,吃遍天」,大眾也不可能瞬間接受新時代的變化,因此最好的方法就是把 AI 模型融入到我們日常使用的這些軟體中,起到潛移默化的作用。

創業者該如何抓住這次機會?

創業者該如何抓住這次機會?

技術和市場宛如一道河流。這條河的有些部分運行得更快,有些部分運行得更慢,河中還有一些渦流,能讓人在被捲入的同時不斷倒退。這條河上出現的潮流,則是由技術、細分市場、語言、分銷渠道、團隊和信仰共同創造的。

作為創業者想立足於這場浪潮,就必須立即行動——不是在未來半年或未來 3 年,而是在這個月甚至這周。因為這條河實在是流動得太快了,讓人不得不暫停自己正在做的事情,專注于思考它的問題。

在過去的兩年裡,矽谷明星早期投資機構 NFX 的創始合夥人 James Currier,已經在這個領域投資了 4 家公司,並計劃在未來的一年內進行更多的投資。接下來以 Currier 投資的四家公司為案例,看看他是怎麼應用生成式技術的:

  • 遊戲公司 Latitude。

2021 年初,NFX 投資了遊戲公司 Latitude,這家初創公司致力於開發由人工智慧生成的《AI Dungeon》(AI 地下城)遊戲,並在項目開始時宣佈已經籌集到了 330 萬美元的種子基金。

生成式技術將帶來全新的遊戲體驗,與我們以前常玩的經典文字冒險遊戲不同,以前的遊戲角色的對話完全由遊戲設計師安排,並且玩家只能在幾個選項裡選擇——而《AI Dungeon》裡的角色,是可以回應玩家的任何命令的。

生成式技術不僅能在以前的老遊戲中為 NPC 添加對話,補足遊戲作品的劇情缺憾進行同人創作,還能催生像《AI Dungeon》這樣全新類型的遊戲。憑藉其新發布的 Voyage 遊戲平臺,Latitude 公司得以在 AI 遊戲領域處於領先地位。這家初創公司已經在生成式技術的核心領域工作了 3 年,並計劃與研究生成式寫作技術的 AI21 實驗室合作,進一步將自然語言處理技術集成到他們的平台中。

AI Dungeon 的遊戲界面,在下方的框中輸入文字就能和遊戲角色對話

  • 法律索賠搜尋服務 Darrow。

每一天,世界各地數以百萬計的人都在無意識地遭受違法行為的傷害——導致癌症的空氣汙染、危及敏感資訊的隱私洩露、偶爾吃到不符合食品安全的零食或飯菜、因汽車零部件缺陷導致的車輛事故、甚至是引發不可逆轉損害的缺陷藥物……曾經,想在海量資料中發現這些違規行為幾乎是不可能的,更不用說圍繞它們建立案例了,然而,AI 的誕生徹底改變了這個時代的資料搜尋難度。

Darrow 會掃描來自網路各個角落的公開可用的真實資料,這其中有從社群網路和新聞媒體搞到的官方訊息,也有訴訟來源和財務資訊等等。然後,Darrow 的 AI 可以在這些資訊上下文中連接所有相關資料點,以檢測違法行為。最後,Darrow 將檢測到的違法行為形成強有力的案例,解決上文所說的隱患問題。

  • 自動程式設計生成網站和頁面的平臺 The.com。

The.com 這個名字一聽就是非常稀有的域名,而這個網站也和名字一樣另闢蹊徑,它不是搞 AI 藝術創作的,而是用網站來生成網站的。簡而言之,The.com 是一個生成式平臺,可以通過簡單的資料庫調用和輕量級的提示來編碼和開發成百上千的網站。但是,開發網站這種事誰都能做,The.com 真正的大殺器是能集成其他網站,往你自己的網站添加上千個頁面,擴大網站的流量。

The.com 的目標是實現網站建設的現代化,同時確保網路創建者的工作獲得讚譽。該公司如今憑藉 NFX 的 440 萬美元種子資金脫穎而出,創建了所謂的「低程式碼網站構建平臺」,旨在拋棄已成為行業標準的基於模板的方法。簡單的模組化和開源自然是我們都喜聞樂見的東西,The.com 使用者甚至可以在網站建設過程中相互協作並直接聊天,實現流量的共通。

  • 地產科技網站 Tailorbird。

世界上的每一家地產都是獨一無二的,於是多戶型改造這份工作,在管理利益相關者、預算、組織和實施之間往往會浪費很多時間;自從 2020 年開始,AI 和物聯網熱潮席捲全球,基礎設施飛速發展,美國也開始興起了一個全新的行業,使得美國地產格局發生了很大變化,這個行業就是地產科技(proptech)

所謂地產科技,就是指那些利用創新運營和科技在各類空間資產類別的買賣、租賃、營銷、運營管理和金融方面創造效率和價值的公司。Tailorbird 就通過使用深度學習為那些希望進行裝修的業主構建新的平面圖。

這些平面圖是從網路上拍攝的照片和平面圖生成的,AI 會蒐集這些資料,與遠端 3D 測量相結合,以產生許多新的裝修計劃。這些 AI 快速生成的計劃,能為設計師和業主提供很好的靈感和想法,並減少了與房屋改造相關的時間和成本。

看,生成式技術並不是只能用 AI 畫畫和寫點小作文,這個領域仍處於襁褓期,擁有著無限的發展空間。創業者往往苦惱於如何讓產品擁有獨特性,在市場闖出一片天,但在如今這個時代,只需要將生成式技術加入到現有的產品中,就已經能使其與眾不同。

這篇文章對我有什麼用?

這篇文章對我有什麼用?

回顧世界歷史,重大技術變革總是緩慢展開的:直到 2003 年,世界上的許多人仍然對網際網路持懷疑態度,所以建立矽谷的第一批先驅者得以規避了激烈的商業競爭;從 1997 年到 2005 年,SaaS(軟體即服務)耗費將近 10 年的時光才得到了業界的共識;蘋果公司在發佈 iOS 平臺 18 個月後才向外部開發者開放……Web3,距今已經推出 10 年了。

但生成式技術不一樣。幾乎每一個看到 AI 創作新聞的人都會意識到一點:等技術成熟時,它可以直接改變現有的創作產業。無數的風投、初創公司、創業者、商業公司都發現了這個事實,那就是隻要不斷「餵養」AI 模型,生成式技術可能在明天就可以改變世界。

總而言之,對於創業者來說,現在時間緊迫。如果想在高速發展的生成式技術領域分一杯羹,那就必須立即行動;創業者現在就需要決定自己的目標客戶是誰、分銷渠道在哪、要用 AI 創造什麼想法……如今,還有很多領域未被捲入 AI 時代的浪潮,選擇還有很多。

偉大的生成式技術行業創始人都長什麼樣子?

他們看起來像你。生成式技術顛覆了人類創作史,在 AI 的時代,只要有想法就能創業。

參考文章:https://www.nfx.com/post/generative-tech

相關文章