我們什麼時候才能 Rua 上,一隻「粘人」的機器寵物?

貓主子之外,陪伴機器人可能是你的下一個家人。

作者 | Founder Park

寵物之外,陪伴機器人的市場在哪裡?大眾對於索尼 AIBO 機器人的追捧可以給出很明確的答案。

但是為什麼選擇在當下入局機器人賽道,哈崎機器人的創始人&CEO 諶振宇是這麼回答的,「2019 年,AI 技術在快速地發展,很多行業都已經大量地利用 AI 技術解決機器識別物體的問題。」在 AI 的幫助下,機器人能夠正確地理解世界,和人類有更多主動的互動,是他創業的契機。

在他看來,好的陪伴機器人應該是以合適的售價解決使用者的需求,而且更主動地承擔陪伴的服務。主動提供服務而不是被動等待喚醒,諶振宇認為這也是哈崎機器人相比其他公司的競爭優勢。

而從網際網路創業轉向硬科技創業,諶振宇覺得兩者還是有很多相通的,很多網際網路的思維在硬科技領域也是適用的,「技術是手段,而不是目標」,「小步快跑」的思路同樣也是可以用在硬科技的技術研發上的。

哈崎機器人目前能滿足哪些需求,陪伴機器人的核心本質到底是什麼?以及陪伴機器人行業的未來發展等,關於這些問題,諶振宇在這次採訪中也進行了詳細的解讀。

  1. 情感陪伴的核心是對服務對象的理解,包括了解使用者的情況、當下的情緒,以此為依據完成符合使用者預期的服務。

  2. 機器人是作為一個面向使用者的產品,首先它要解決使用者的需求,其次是以合適的售價讓使用者可以接受。

  3. MIT 的四足機器人技術開源給出了一個簡化模型的完整實現,但是後面的學習曲線仍然異常的陡峭。

  4. 網際網路思維是站在使用者的角度,使用對應的技術或商業模式去滿足使用者的需求;技術是手段,而不是目標。從 PC 到移動網際網路、再到機器人,這種思維是可以一直沿用的。

01

情感機器人不是寵物

的替代,而是補充

Founder Park:養貓、狗是現有的主流情感陪伴方式,為什麼會覺得機器人還有機會?

諶振宇:我們認為情感陪伴其實就是滿足使用者的需求,真正的核心就是陪伴。而按照使用者的需求提供服務,應該是有多種方式可以完成的,機器人在這裡面可以做很多事情。能夠提供情感陪伴的前提是要理解環境與人的情緒。貓、狗作為寵物與其他動物最大的區別是它能懂得人的情緒,在這基礎上它能夠做出讓人類覺得滿意的互動,可以幫助釋放壓力。機器人要實現這樣的服務,首先它要能理解環境,要理解周邊發生的事情,要理解人的情緒。

其實機器在我們的社會里存在了很久,在生產線上到處都有機器的影子,如果機器要走到我們的日常生活中,重要的一個突破點是要讓機器理解這個社會,這就是我們在 2019 年時候看到的機會。AI 技術在快速地發展,很多行業都已經大量地利用 AI 技術解決機器識別物體的問題。在這個情況下,我們認為機器人是有機會去理解這個世界的;在理解世界的情況下,讓機器人做出符合人預期的行為。我認為這是機器人能夠進入到家庭裡的一個重要契機。

Founder Park:情感陪伴的本質是什麼?

諶振宇:我認為情感陪伴是一種服務,情感陪伴的核心是對服務對象的理解,包括了解使用者的情況、當下的情緒,以此為依據完成符合使用者預期的服務。大家認為貓和狗能提供情感陪伴,很多例子是在傷心的時候狗能夠安慰人,但其他動物就做不到,說明狗對人類的情緒是有一定的甄別能力的,我認為現在的 AI 技術是可以做到的,其實也不需要特別準確,寵物也不完全知道人的情緒是怎麼樣的,但大概是能讓人滿意的。更好的陪伴需要更多的理解,才能夠提供完全符合預期的服務;隨著環境識別能力的不斷提高,機器人能夠提供的服務就會越來越精準。

Founder Park:情感陪伴機器人會實現寵物的數字化替代嗎?

諶振宇:這個不是我們的出發點。人需要個性化的服務,我們希望機器人能滿足每個人的個性化需求。有些人需要的是寵物,而有些人需要的是管家。可以認為這是一個有趣的機器人管家,像寵物有可愛的一面能夠讓人放鬆,又能像管家能幫助人做很多事情,諸多功能集成到一個機器人身上,為使用者提供個性化的服務。

Founder Park:除了 AI,情感陪伴機器人還需要哪些技術條件?

諶振宇:機器人的視聽能力隨著 AI 的成熟不斷完善;機器人的決策依靠軟體鏈的能力,過去已經具備了。這些能力都具備之後,要考慮的就是價格問題,需要什麼樣的元件才有可能實現使用者能夠承擔得起的產品。

我們當時對這個行業做了一些很深的調研,一臺機器人擁有眼睛、耳朵、大腦,其實很像一臺手機,再加上運動能力,則依靠關節和運動肢體完成。關節不需要核心的元器件,硬體成本不高;一個手機的 BOM(物料清單)成本加上運動部分的成本,機器人的成本應該也不會太高,如果把這個產品做好了,同時價格也是可以接受的,是有機會進入每一個家庭的。

市場上有需求,技術路線有明確的解決方案,成本也有機會做到很低,這是我們堅決要踏入這個行業的重要原因。

Founder Park:一臺好的機器人應該如何定義?

諶振宇:機器人是作為一個產品面向使用者的,我覺得首先它要解決使用者的需求,其次是以合適的售價解決使用者的需求。

從使用者需求的角度,我覺得未來的勞動力缺失不只是出現在生產線或者工業線上,家庭中也會有勞動力缺失的問題。年輕人在一線城市承受了很大的壓力,如何讓大家放鬆,如何解決生活中的一些壓力、瑣碎的事情,機器人應該朝這個方向去努力,那麼我們要想辦法在使用者能夠接受的價格範圍內去完成這樣的產品,朝著這樣的方向去分析需求和解決問題。

02

哈崎機器人

目前能實現哪些需求?

Founder Park:為什麼選擇做情感陪伴機器人?

諶振宇:可能也有情結的原因,我深深地受到一些科幻片的影響,比如《星球大戰》裡 R2-D2、C-3PO、BB-8 這樣的機器人給我的印象是非常深的。機器人不只幫助人類解決問題,同時它也能幫助人類解壓,比如 C-3PO 就是一個很好玩的人型機器人,它做的基本上是幫助人類釋放壓力的工作。

2019 年做項目調研的時候,我們看到技術已經成熟,機器人可以做好一些人類不喜歡做的、或者不太想去做的瑣碎的事情。如果機器人進入到我們的生活中,它會帶來很多的服務,人類就可以更好地投入到創造性的工作中。那個時候就決定我們要做一個機器人,把機器人送入千家萬戶,讓每個家庭都擁有一個能夠真正做服務的機器人。

Founder Park:目前哈崎機器人可以做哪些互動動作?

諶振宇:舉幾個例子。比如它會每天迎接你回家,你可以想象家裡有人在期待著你,可能會用不同的方式迎接你。其次是可以陪著你一起運動,可能是陪你跑步,幫背水,跳繩時幫你計數;累了的時候給予鼓勵等,增加運動的持續性和趣味性。離開家的時候,可以通過機器人更好地了解家裡的情況。

互動通過幾種方式:

第一個是指令,指令分為語音指令和手勢指令,它現在能聽懂幾十種指令,並且未來可通過 OTA 升級不斷增加;它能識別手勢的命令,可以通過手勢進行溝通,比如讓它過來、走開、趴下等等

第二個是反饋表達,現在的機器人具有 16 個自由度,有可動的頭、可搖晃的尾巴、豐富的表情、隨情緒變化的燈光、可線上學習的多種動作組合等等。

第三個是情緒大腦,機器人在收到指令時,會依據內部決策和自身情緒作出響應,也許會熱情的積極互動,也許也會拒絕你;它和使用者的關係可以理解為養成模式的,更多的接觸和互動,能夠增加它對使用者的熟悉度和好感度。

機器人對指令、環境、人物的識別是優於寵物的,這是 AI 賦予機器人的能力;我們也會逐步地開發更多的功能,比如在播放音樂的時候它會跳舞,機器人是能夠聽懂音律的,動作的優美與否是根據產品設計決定的。

Founder Park:哈崎四足機器人的性能、續航、安全性怎麼樣?

諶振宇:目前我們有兩代機器人產品,一代運動速度是 1.5 米每秒,能夠實現陪人散步的需求;新的二代機器人有更小的體積和重量,但速度可以達到每小時十多公里,可以陪人一起外出跑步。

還可以做一些高難度的動作,比如空翻,但我們不會把這樣的能力向使用者釋放,因為機器人自重 9 公斤,做這樣的動作還是有一定的危險性的,並且在日常生活中沒有需要的場景;機器人可以在硬裝的路面上運行,摔倒了之後也是可以自己站起來的。

哈崎機器人一代 | 來源:官方宣傳片

哈崎機器人一代 | 來源:官方宣傳片

四足機器人充滿電可以運行兩個小時以上;在家沒電了它會自動充電,達到一定電量後會進行主動行為,可能去它喜歡的地方,或找喜歡的人玩。

在戶外,機器人是具備一定的識別環境安全性的能力的。比如它能準確識別出公園的路面是安全的,會讓自己在安全的環境下去運行。目前機器人是無法在水裡運行的,這可能是我們需要去解決的問題;但它能夠運行的地方,一定確保自己和周邊是安全的。

Founder Park:很多四足機器人走路都很吵,降噪這方面是怎麼處理的?

諶振宇:噪音來源於兩個方面,一個是電機的運行聲音,我們的電機噪音很低;第二個是機器人踏步的方式,這方面我們有很大的突破,比如我們機器人的踏步頻率比一般產品低 50%,踏步頻率決定了產生噪音的多少,我們在家庭環境內,慢速情況下采用三腳步態,踏步頻率更低,運動噪音就小了很多。

Founder Park:情感陪護機器人會考慮做成人形機器人嗎?

諶振宇:我們最早考慮過做人形的,但研究之後覺得現在不是合適的時間點。如果是人形機器人,除了進入家庭的安全性和功能性考慮之外,使用者一定會希望其對話溝通能力非常強,以目前的技術是有難度且無法滿足使用者的需求,滿意度會隨之降低。我們認為在早期,以寵物形態,用可愛一點的 ID 去實現的機器人,使用者的預期會對標寵物而不是人,這個時候產品的表現力會更好地帶來驚喜。

Founder Park:哈崎機器人的競爭優勢是什麼?

諶振宇:我們強調主動性,是一個主動提供服務的產品,而不是被動地等待被喚醒的狀態;在情感陪伴的這個需求上,主動性是一個非常必要的條件。

要實現主動性,需要收集更多的環境資訊,去實現更強的環境計算能力,這是我們區別於其他產品的部分。比如語音,一般產品可能只收集到語音的內容,我們會收集語音的情緒,語意的理解,並且結合周邊環境等去分析人物的狀態。只有對這個世界的認知越來越多,服務才會越好。比如家裡有人過生日,點蠟燭時,它會主動唱生日快樂歌,而不是等到人發出指令才做出這個行為;強調的是讓機器人主動服務,這也是我們努力的方向。

Founder Park:還有哪些場景是哈崎未來想實現的嗎?

諶振宇:在家裡,機器人作為管家把人不願意做的瑣事都打理好;比如整理家裡的環境,可能是自己動手,也可能是操作其他的智慧家電達到家務的目的。現在很多地方都能看到,機器人的運動控制能力是有保障的,關鍵點在於它能否準確地識別環境,機器人自主判斷這個地方是不是髒了、需不需要清理;未來機器人真正需要具備的能力是對環境計算的能力,隨著機器人認知、識別能力的增強,這些事情變得越來越可期了。

我們現在要做的是在不斷提高機器人感知能力,讓它能夠提供更多的服務。因為現在的情況是很多事情都還做不到,由於機器人的感知能力受到很多限制,包括算力的限制,有一些能力是還不具備的,比如家裡有煤氣洩漏,如果它能感知到是可以處理很多事情的。

03

網際網路思維同樣

適用於硬科技行業

Founder Park:情感陪伴機器人的發展歷程是怎麼樣的?

諶振宇:1999 年日本索尼推出了 AIBO 機器人,當時並不能算真正的機器人,只是小狗形態的自動化機器,沒有太多的算力,但那個時候日本使用者對這款產品很有好感;AIBO 在 2006 退出市場,2017 年索尼重新推出了搭載人工智慧的 AIBO,獲得了日本使用者的好評。索尼停止服務期間,使用者之間自發地組織了配件的維護,比如當 AIBO 已經完全不能運行了,配件可以拆下來給其他使用者使用;2018 年甚至有 200 個使用者把 AIBO 集中到一起在寺廟中做了超度,可以看出機器人是完全可以和人建立感情的。

情感陪伴機器人進入家庭仍處於一個發展中的階段,但我認為 2020 年是一個很好的時間點,運動控制相對成熟了,一些相關的技術在快速地發展,使得機器人和人互動成為了可能,也讓我們有信心去完成更好的產品,我相信智慧機器人會比自動駕駛更快地進入家庭中。

AIBO 機器人 | 來源:網際網路

AIBO 機器人 | 來源:網際網路

Founder Park:創業到現在兩年的時間,在產品和技術上有什麼樣的迭代?

諶振宇:今年會發布我們第一款便攜產品,這個產品是完全自主的,能夠識別聲音、手勢指令,提供陪伴功能和一部分家庭管理的功能。比如在點蠟燭的時候主動唱生日快樂歌,就像一個努力融入家庭生活的一個新成員。

機器人提供服務所用的技術都是我們自主研發的,過去一年我們主要在攻克如何把機器人小型化,重量控制在 10 公斤以內,使機器人進入家庭成為可能。硬體上的技術突破有很多,比如身手要足夠小,關節要能提供大的扭矩同時重量要輕。軟體上的技術突破有更多,比如快速實現對人、環境、聲音的識別。機器人的訊雜比是非常低的,本身噪音很大,在這樣的環境下如何識別指令;同時又需要極大的算力,如何把算力的需求降低等都是技術難點。

機器人有了自我決策之後,表達和動作設計都很重要,我們設計了一整套語言系統,包括表達情緒的聲音、動態的表情、肢體的語言,還有燈光配合情緒的變化,人能夠比較立體地知道機器人處於什麼樣的狀態下;如果人無法判斷機器人的狀態,雙方就不能夠很好地互動。

總體來說,軟硬體方面都是需要不斷地迭代的,人機互動是主要的迭代方向。

Founder Park:2018 年 MIT 開源了四足機器人相關的一些技術,很多公司會基於這個框架進行修改,哈崎如何看待開源這件事?

諶振宇:MIT 的開源項目是為了實現 Mini Cheetah(MIT 的四足機器人)的快速運動,而不是為了實現機器人進入家庭的完整功能。開源對我們來說,最大的意義在於說明這條路是可行的,會給我們很大的信心;開源能夠幫大家節省很多時間,但在做一個完整的消費級產品時是遠遠不夠的。比如 MIT 開源的四足運動控制模型簡化是為了讓其機器人能夠跑的更快一些,而每個公司面臨的使用者需求不同,面臨的問題和實現的難度是完全不同的,模型和演算法也可能是千差萬別。MIT 的開源給出了一個簡化模型的完整實現,但是後面的學習曲線仍然異常的陡峭。

我們的實現是基於運動學和動力學的自研演算法。機器人的表現基本都是自研的,比如我們有根據視覺做的一個軌跡的規劃,讓動作更加協調;在決策、識別上是利用 AI 技術做的自研內容;在框架上,比如整體的決策、做動作的平臺,也是完全自研的部分。

Founder Park:智慧陪伴機器人迭代到一定程度後,會像自動駕駛一樣出現分級嗎?

諶振宇:最早的機器人就是一個被控制的機器,在控制下能夠運動;現在很多機器人是遙控的。

第二個階段是部分智慧機器人,在特定的環境下能夠自主運行。

第三個階段是組合控制的智慧機器人,在得到一定的指令後能夠執行任務,比如掃地機器人。

第四個階段是有條件的智慧機器人,能夠理解人的情緒、識別環境,根據反饋做出決策、調整行為,在人機互動過程中不斷地完善機制。這也是哈崎機器人所處的階段。

第五個階段是高度智慧機器人,能夠自主成長,主動地適應各種環境。

Founder Park:情感陪伴機器人的發展思路和特斯拉很像,怎麼去看待軟體和硬體之間的關係?

諶振宇:傳統的汽車都是模組化的,每個模組實現單一的功能,模組之間是不互通的。特斯拉的改變在於所有的決策都要通過控制中心來完成,保證控制中心和各個部分是可控的,通過這樣的方式就有了非常大的可升級空間;把所有的資料都上傳,通過強化學習去決定在不同的情況下需要做出什麼樣的反饋。在這方面我們和特斯拉有同樣的技術路線,可以說是軟體決定硬體。

我們的機器人有一個控制中心,它擁有機器人行為的決定權;當然現在很多時候機器人的行為還是用傳統的控制演算法在實現,但它看到的資訊會上傳給控制中心,根據它的歷史記錄、情境、當前狀態去決定它應該採取的行動。讓每一個部件標準化,由控制中心去決定每個部件應該採取的行為,這也是我們的思路之一。

Founder Park:從網際網路切換到硬科技,有哪些經驗是可以沿用的?

諶振宇:我理解的網際網路思維是站在使用者的角度,使用對應的技術或商業模式去滿足使用者的需求;技術是手段,而不是目標。從 PC 到移動網際網路、再到機器人,這種思維是可以一直沿用的。現在做的硬科技,其實也是根據使用者的需求去尋找技術解決方案,這也是我們最後選擇機器人實體去做服務的原因。

硬體會有區別於網際網路時代的部分,比如硬體的週期性,需要有設計、生產、聯調、組裝等過程;而不像網際網路一個月就可以上線,再不停地更新、迭代。

Founder Park:網際網路的流量思維和「小步快跑、快速迭代」的概念適用於硬科技嗎?

諶振宇:砸錢買流量是有底層邏輯的,首先這個服務要滿足使用者的需求,其次投入產出比 ROI 是不是大於 1 的;滿足這兩個前提再去砸錢,才可能帶來正向的結果,這對於網際網路和硬科技都適用。

我們內部的軟硬體迭代是非常快的,硬體上可能和其他公司會有不同,我們會先根據需要實現的目標而選用成本很高的技術,先把目標達成再想辦法提高效率、降低成本,這也是我們能在兩年半時間內實現機器人自主與人互動的原因。我覺得我們是在小步快跑的狀態,不會限定只能用某種技術、晶片或必須要完成某一功能;如果一開始就設限,出現問題後很難去判斷是思維、軟體出錯了,還是硬體限制了技術的發展。

歡迎在小宇宙收聽本次採訪的音訊版本

歡迎在小宇宙收聽本次採訪的音訊版本

*以上嘉賓觀點不代表 Founder Park 立場,也不構成任何投資建議。

*頭圖來源:視覺中國

相關文章

英偉達的元宇宙夢想,不止 Omniverse

英偉達的元宇宙夢想,不止 Omniverse

英偉達已經成為元宇宙的基礎服務商。 作者 | Founder Park 要談元宇宙,英偉達是避不開的。 不管是更真實呈現虛擬世界所需要的光追...