對話Midjourney創始人:圖片只是第一步,AI將徹底改變學習、創意和組織

「11人改變世界」背後的 CEO

「11人改變世界」背後的 CEO。

作者 | Founder Park

Midjourney 是一家神奇的公司,11 人改變世界,創造偉大的產品。

註定會成為 Pre AGI 初年的佳話。

「我從不曾想過要一家公司,我想要有一個家。」

智源大會上,我們對話了Midjourney 創始人 David Holz

MidJourney 是當下最炙手可熱的圖片生成引擎,在 OpenAI 的 DALL·E 2 和開源模型 Stable Diffusion 等激烈競爭下,目前仍保持著多種風格生成效果的絕對領先。

以下是對談全文,經 Founder Park 編輯。

張鵬

歡迎 David,我想這是你第一次與中國的粉絲交流,你可以藉此機會向他們問好。

David Holz

哈嘍大家好,Midjourney 可能還沒有正式進入中國,但是如果你們已經用上了 Midjourney 的話,我希望大家都可以擁有好的體驗。

01

創業驅動力

解放人類的想象力

張鵬

在過去的 20 年裡,我認識了很多國內外的創業者。我發現他們有一些共同點,他們都有強烈的驅動力,驅使他們「無中生有」地探索創造。

我想知道,在你創立 MidJourney 的時候,你的驅動力是什麼?在那個時刻,你渴望的東西是什麼?

David Holz

我從來沒有想過要創辦一家公司。我只是想要一個「家」(home)。

我希望在未來 10 年或 20 年,可以在 Midjourney 這裡創造那些我所真正關心的和真正想為這個世界帶來的東西。

我經常思考各種各樣的問題。也許我不能解決每個問題,但是我可以做出一些嘗試,從而讓大家都能更有能力地解決問題。

因此,我嘗試去思考如何解決,如何創造東西。我認為,這可以歸結為三點。首先,我們必須反思自己:我們想要什麼?問題究竟是什麼?

然後我們要想象:我們前進的方向在哪裡?有什麼可能性?

最後,我們必須相互協調,與他人合作,共同實現我們所想象的事情。

我認為,在人工智慧方面,有很大的機會將這三部分結合起來,並創造出重要的基礎設施,使我們更擅長於解決這個問題。在某種程度上,人工智慧應該能夠幫助我們反思自己、更好地想象未來的方向、幫助我們更好地找到彼此併合作。

我們可以一起完成這些事情,並將它們融合到某種單一的框架中。我認為這將改變我們創造事物和解決問題的方式。這就是我想做的 big thing。

我認為有時候(我們先做的)圖片生成可能會讓人感到困惑,但在許多方面,圖片生成是一個已被認可的概念。Midjourney 已經成為了一個超級想象力的集合,數百萬人共同探索著這個空間的可能性。

在未來幾年裡,會有機會進行更多的視覺和藝術探索,這可能會超過所有先前歷史的探索總和。

這並不能解決我們面臨的所有問題,但我認為這是一次測試,一次實驗。如果我們能完成這次視覺領域的探索,那麼我們也可以在其他事情上做到,其他所有需要我們一起探索和思考事情,我認為都可以通過類似的方式來解決。

因此,當我考慮如何開始著手解決這個問題時,我們有很多想法,建了很多原型,但是 AI 領域突然出現了突破性的進展,尤其是視覺方面,我們意識到這是一個絕無僅有的機會,能創造出一些別人從未嘗試過的東西。這讓我們想去為之嘗試。

我們認為,也許過不了多久,這一切都將匯聚到一起,形成非常特別的東西。現在還只是個開始。

張鵬

所以,圖片(生成)只是第一步,你的最終目標是解放人類的想象力。這是吸引你創立 Midjourney 的目標嗎?

David Holz

我真的很喜歡具有想象力的東西。我也希望這個世界能有更多的創意。

每天都能看到瘋狂的想法,這太有趣了。

02

連續創業經驗

如何更好地創業

張鵬

許多人第一次認識你時並不是通過 Midjourney,而是通過 Leap Motion(David 的上一家創業公司)。

我強烈感覺到,對你來說這兩個項目可能存在一些關聯,無論是驅動力或心態方面,我不知道我理解得是否正確。但我想問的是,你在 Leap Motion 的經驗是否有助於你創辦 Midjourney?

David Holz

從很多方面來看,我從 Leap Motion 中學到了很多,比如如何組建大型研究團隊、如何解決以前沒有人解決過的問題、如何深入思考人們該如何與技術互動。

不僅僅是考慮速度、成本和規模,而是考慮我們該如何協作、如何共同前進。這非常重要,它是 Leap Motion 的核心思想之一。

二者有一些相似的地方,就像 Leap Motion 一樣,它迅速成長,吸引了每個人的想象力,我認為 Midjourney 也類似。

但我認為二者也有一些真正不同的地方,在 Leap Motion 中,我們花了大量時間構建早期的生態系統。

在矽谷,當時有這樣一種信仰,即你應該先構建一個生態系統,就像 iPhone 一樣。但我認為我們共同學到的是,也許你首先要構建一個真正受人們喜歡的好產品。然後,當你完成這個產品時,你可以開始著手構建生態系統。

對於很多企業家來說,在早期構建生態系統可能會分散他們的注意力,我也是如此。因此,Midjourney 所做的一個很重要的不同的事情,就是專注於構建真正每個人都可以使用的東西。

我以前經常用「我能不能親手完成」來判斷自己的能力。我的父親是個外科醫生,他就可以做到。我們擁有靈巧的雙手。

但現在我更多在思考,卡車司機會喜歡用 Midjourney 嗎?有很多卡車司機在玩 Midjourney,對我來說這太酷了,這意味著我們做的更好了。

03

重新理解知識

歷史知識成為創造的力量

張鵬

這很有趣。我們通常說空口無憑,給我看你的程式碼(Idea is cheap, show me the code)。但現在,想法似乎才是唯一重要的東西。

只要你能通過一系列優秀的 Prompt 表達你的想法,AI 就可以幫助你實現。所以,學習和創造的定義是否正在改變?你怎麼看?

David Holz

我覺得一個有趣的事情是,當你給人們更多的時間去創造時,他們也會對學習本身更感興趣。

例如,美國有一種很流行的藝術風格叫做裝飾藝術。我從來沒有關心過這種藝術是什麼,直到有一天,我通過指令就可以製作出這類藝術風格的作品時,我突然對它產生了很大的興趣,想更多了解它的歷史。

我覺得這是很有趣的一點,當歷史成為你可以立即用起來並讓你更簡單地去創造的東西時,我們反而會對歷史更感興趣。

如果使用者互動界面變得足夠好,讓使用者覺得 AI 成為了我們思維的延伸。AI 就彷彿是我們身體和思想的一部分,AI 又在一定程度上與歷史緊密相連,而我們也將與歷史緊密聯繫在一起。這太有意思了。

當我們問使用者他們最想要什麼時,通常排在第一第二的回覆是他們想要學習材料,他們不僅是想要學習如何使用工具,還想要了解藝術、歷史、相機鏡頭、光彩,想要了解和掌握所有可用於創造的知識和概念。

以前,知識只是過往的歷史,但現在,知識成為了創造的力量。

知識在當下就能立即發揮出更大的作用,人們都渴望獲得更多的知識。這可太酷了。

04

面對恐慌

開放地思考自己的能力

張鵬

在中國,你們的使用者來自於許多不同的背景,他們可能具有不同水平的藝術創作能力。像我這樣的使用者還在努力製作更好的圖片,但我聽說許多畫家和設計師正在擔心他們會被AI取代。

為了確保每個人都能通過AI得到助力,而不是感到困惑或被邊緣化,Midjourney 可以做些什麼呢?

David Holz

對於還沒有開始他們藝術之旅的人來說,Midjourney 為他們提供了獨特的機會。

你會開始思考:我喜歡什麼?我的審美觀是怎樣的?我覺得什麼是美麗的?

專業藝術家可能需要幾十年才能做到,而現在每個人都可以做到。我們發現,人們深入反思,這幾乎像是藝術治療,讓人思考他們的生活、面對的挑戰、可能發生的好事或壞事,這非常有意義。

我認為大多數使用它的人都有這些個人體驗,它並不是競爭性或商業性的。我們發現,大多數人使用它,只是自娛自樂。他們甚至不會分享他們生成的圖片。

在專業領域,它變成了增強你創造力的放大器,現在你可以製作漫畫、電影或視訊遊戲。

如果你是一個普通人,第一次在你的生活中思考美,那麼藝術家現在可能在思考,如何創造整個世界和宇宙的故事。以前他們從未能夠做到。

因此,它拓展了每個人的創造力邊界。

普通人有更多的能力,專業人士也有更多的能力。有時很難意識到這點,因為現在使用者界面都很簡單。但是它們可以變得更加複雜、強大,並具有許多功能,那些功能稍後會出現。

05

AIGC的魅力

就是藝術的魅力

張鵬

也許 AI 不僅僅只是用來處理一張圖片,它可以幫助人們處理更復雜的工作。因為在過去,當我們談到創造力時,裡面包含了許多因素,是否有創造的慾望?要創造什麼樣的想法?還需要具備行動的能力,執行它使其成為現實。

但有時,如果可以解放創作慾望、偉大的想法和複雜的事物,AI 可以幫助你。這可能就是 AI 可以為人們提供的力量,而不僅僅是圖像。對吧?

David Holz

這是一個非常個人化的過程,需要反思,起初我們並不知道。

一開始,我看著這些(人們生成的)圖片,卻不明白他們要做什麼。

有人生成了一張狗在天堂的圖片。

我問他為什麼要做一張狗在天堂的圖片?他說那是因為他的狗剛剛去世了。

我感到很難過。他說這(圖片)讓他感覺好些了。

人們使用它的目的幾乎就像藝術療法一樣。他們思考著事情,反思著他們的生活,試圖弄清楚自己是誰。我認為這是非常個人化的,非常重要的,這是一些人類歷史上,大多數人都沒有機會做的。只有非常少數的人有機會這樣做。

我認為這非常美,能夠讓每個人都能夠做到這一點。

張鵬

是的,Midjourney 不僅僅是我們的業務或者工作流裡的一個工具,它已經成為了我們生活中的一個新元素。

06

11人傳奇

未來五年會出現更多

張鵬

Midjourney 之所以如此美妙,是因為它將神奇的技術傳遞給了 1000 萬人。而我知道你的團隊只有 20 個人,幾個月之前只有 11 個人。你們沒有銷售團隊,沒有市場團隊,其中還有一些是在校生。

我很好奇,這是 AI 時代的創業公司組織形式的新範例嗎?

David Holz

我想未來會的。

我們的確是(採取這類組織形式)比較早的。我們也有一些優勢,比如我有很多建立團隊的經驗,我的聲譽也不錯,能獲得很多算力,並且我們很早之前就開始做了。

一些普通的創業公司可能不具備這些。

但我覺得在幾年後,隨著人們學會如何建設研究團隊,隨著算力的壓力越來越小,隨著人們越來越懂得如何打造好的 AI 產品,我想我們將會看到很多這樣的公司。我們可能是第一家這樣做的公司,但也許在 5 年後這會是非常常見的形態。

07

通用vs垂直

AGI時代MJ會成為什麼?

張鵬

你擔心 Midjourney 今天做的事情,有一天會被發展的 AGI 能力所覆蓋嗎?會發生什麼?

像 Midjourney 這樣的垂直產品的未來是什麼?

David Holz

我不知道。這是個大謎團。

其中一種方式是,我們可能會與其他實驗室合作,我們製作眼睛,他們製作耳朵,我們製作不同的部分,然後將它們組合起來。這種情況可能會發生。

我們創造想象力,他們製作語言部分,然後我們將它們組合在一起。所以我們將一起研究這個問題。

還有一種可能性,就是有這些幾乎擅長所有事情的 AGI,但是也有這些部分是專業化的。世界上仍然有很多專業人士。

我也認為有可能有很多人機界面方面的問題,不僅僅是關於製作美麗的圖片,而是關於幫助一個人探索他們是誰,以及他們想要什麼。

這不是一個 AGI 的問題,而是更多地關於如何與人互動。

最好的使用者界面,如果僅僅是語言,那麼 AGI 可能會問我們問題。但實際上使用者界面不僅僅是語言,它將向你展示許多圖片,並試圖以不同的方式了解人,這將是一種全新的藝術,全新的理解人的理論,AI 會試圖幫助他們弄清楚他們想要什麼。

我們還沒有想到這些。AGI 可以做任何事情,但我也認為,像未來這樣的大多數情況下,可能仍然有很多專業化。

08

社區的力量

一起探索 AI Copilot

張鵬

你認為 Midjourney 永遠會是垂直產品,還是可以成為一些通用產品?

你已經說過你的使命是解決人類的意識想象力問題,不僅僅是關於圖片。

David Holz

有一些很有趣的東西,我們正在做社區,如何讓一群人一起探索一個很大的空間。

我們正在嘗試創造這樣的事情,在未來的一兩年裡,Midjourney 可能會成為世界上幾乎所有視覺探索的地方,因此我認為有非常有趣的東西。

即使我們從未做過其他事情,如果我們只是世界上所有視覺探索的地方,我認為這是一項業務,但我認為我們無論做什麼,視覺探索都將適用於其他領域。

試圖創造這些數百萬人的超級思維團隊來共同解決問題非常有趣。我不認為任何一個 AGI 能夠取代數百萬人,但我認為可能會有 AI 參與,可能會有數百萬人和數百萬個 AI 一起工作,但我認為將有許多代理和許多參與方,我認為每個人的觀點都有所不同,這有助於理解問題。

張鵬

許多我們稱之為 AI 從業者的人,他們非常擔心他們的產品被新的技術所替代。

你是否有同樣的擔心,擔心 Midjourney 今天所做的事情有一天會被發展中的 AGI 能力所替代?

Midjourney 這樣的垂類產品的未來可能是怎樣的?

David Holz

找到有價值的東西或值得解決的問題,保持專注,同時保持開放的心態是解決這個問題的一方面。

另一方面,創造出來的 AGI 技術或者產品,他們仍然會和我們共同生存在同一個社會里,我們可以用 AI 去不斷地創造新的東西,我們可以去定義在這個社會里 AI 要如何和我們協作去創造。

這就是我們正在做的事情,讓大家一起去探索和共創。

現在用視覺方式,在某些方面,它非常原始,但在其他方面,它可能是測試的最佳方式,因為你可以看到一切。

你可以真正看到它。而如果我們用詩歌來做這件事,我認為它會同樣有趣,但有點難以理解。或者如果我們用引擎或任何其他科學來做這件事,你無法成為科學家,我們找不到 100 萬個科學家,但是有 100 萬人製作圖片很容易找到。

因此,這裡更多要考慮 AI + 人類整個社會的心智應該是什麼樣子的問題。現在大多數情況是人類使用 AI 去創造,但我認為在未來,AI 是可以和人共同去思考與創造的,那將會非常的有趣。也許到了某個時候,我們甚至都無法察覺到,一個想法到底是來自於人類,還是來自於 AI 了。

09

好勝心太強

是人性的弱點

張鵬

當然,近來對於 AI 安全和各個層面的競爭存在著很多關注和擔憂。與此同時,繼續擴大和改進當前大模型仍然存在挑戰。你是如何看待 AI 領域的未來發展?

你會如何平衡不同的觀點,甚至是不同政府的利益?

David Holz

首先,我覺得人性的一個弱點可能就是好勝心太強。

實際情況是這世上有很多機遇和挑戰,甚至可以說有多少問題和挑戰就會有多少機遇。我們面對著這麼多機會,有時甚至都不需要我們去競爭獲得。

所以,對我來說,我不會去考慮和誰競爭的問題,這世界上有很多事情需要去做,我只會盡可能地去創造我認為美好和讓人驚歎的東西。

當我在中國的時候,我發現每個人總是很團結地在協作,從某種角度去看,這種方式和人工智慧的原理有些類似。

因為它也是一種很社區化的東西,它從我們這裡學習,然後它會把從我們這裡學到的能力再反饋給我們。這是一種非常社區化和強調協作的方式。

我認為競爭有時並不是件好事,有時甚至說「想成為某個方向上最優秀的人」,也在某種程度上違背了技術本身的本質。

此外,我們也可以從東方文化中學習很多東西。我所在的地方,人們會擔心技術和 AI 是否足夠讓人感到信任。但另一方面,大家又希望這個世界能夠更加智慧一些,這樣就可以幫助我們去創造和解決更多的問題。

我發現在中國的時候,大家會因為你做的創造性的極客事情而認為你很酷,並且因為也想像你一樣變得很酷。

現在大家都知道 AI 的能力有多強大了,我們就可以去共同努力,為每個人提供基礎設施能力,去建設我們的生活環境。

10

10年後

一個神奇的未來

張鵬

最後一個問題,如果我們展望未來10年的數字世界,你認為今天人類世界中哪些事情不可避免地會發生變化?

David Holz

我認為十年後一個人的創造力可能比當下一群人的都更強大,所以當他們匯聚在一起時,將能做出我們現在無法去想象的事情。

這些力量將創造一個美好的世界。

大家對未來美好的想象將在某種程度上將每個人緊密地聯繫在一起,讓我們不再害怕未來,而是對未來的到來感到更加興奮。

一個神奇的未來肯定會在前面等待著我們,(我希望)它充滿了美好,所以我們帶著這樣的想法才是最終實現那個美好世界的最佳方式。當然也有一些事情是我不能完全理解和想到的,但(對於10年後的未來)我認為應該就是這樣的感覺。

張鵬

我贊同你的想法。

未來確實還有很多美好的事情在等著我們讓它們發生,同時,我們在往前走時,也要去考慮如何去阻止那些不好的事情發生。今天和你的聊天很有收穫,非常感謝你的分享!

如果你關注大模型領域,歡迎掃碼加入我們的大模型交流群,來一起探討大模型時代的共識和認知,跟上大模型時代的這股浪潮。

相關文章