工業AI也將迎來「ChatGPT時刻」

作者:吳昕

基於單模態 GPT-3 的 ChatGPT 「地震」餘波未平,多模態 GPT-4「海嘯」又頃刻席捲朋友圈。

「這提醒我們,對人工智慧的預測是非常困難的。」OpenAI CEO Sam Altman 曾在 DALL-E 2 發佈後講過這樣一句話。事實證明他是對的。基於符號主義的專家系統的衰落,讓人們一度認為人工智慧已走到盡頭,2012 年的深度學習又點燃了希望,如今它已統領 AI 領域。隨著系統規模越來越大,訓練時間和資金成本也在不斷膨脹。就在大家擔心向模型添加參數正達到邊際效益遞減時,GPT-3、GPT-4 相繼昭告世人,更大規模、更加複雜的深度學習系統確實可以釋放更為驚人的能力,而 ChatGPT 的誕生,更是讓人看到了「顛覆性」的應用成果(假訊息甚至稱GPT4參數量100萬億)。

ChatGPT 的出現或許表明,在過去幾年被逐漸認為到達產業化瓶頸的 AI 行業仍是一片最具創新性的沃土,蘊含著巨大的機會。而隨著新生產力初顯雛形,以工業製造為代表的行業或許將迎來更深入的 AI 變革,迎來屬於產業的 「ChatGPT 時刻」,在這一過程中與技術趨勢契合的科技企業也有望率先出圈。

一、通用性的勝利

迄今為止,主導 AI 領域的模型仍然是面向特定任務的。AI 企業開發的模型在特定範圍內有不錯的表現,但工程師們發現其泛化能力不足以支持部署到更廣泛場景。用業內人士的話說,已經訓練了很多模型,但仍然需要茫茫多的模型。

這一瓶頸在高度碎片化工業製造領域幾乎被 N 倍放大。因為工業製造中細分領域眾多,各領域在生產流程、工藝、生產線配置、原材料及產品類型上均具有較大差異性。鋰電池生產可分為十幾道工序,工藝點數以千計,一條產線至少有 2500 個關鍵的質量控制點;液晶面板生產涉及上百道工序,生產過程中可能出現的面板缺陷種類多達 120 種;手機有幾百種零件,涉及幾百個供應商,每個零件可能有幾十種缺陷要做檢測。

現有的深度學習模型泛化程度低,即使在同一行業,模型的可複用比例也比較低。比如,如果要服務一家全球領先的手機品牌的整個智慧產線,可能需要打造幾十萬個演算法模型(不包括後續軟硬體的迭代升級)。

現在,這個棘手的問題成了 ChatGPT 背後所代表的基礎模型(大模型)的典型場景。

在 2022 年,一篇來自Google、史丹佛大學、北卡羅來納大學教堂山分校以及 DeepMind 等機構的研究論文 [1],介紹了大模型的「Emergent Ability(突現能力)」,即有些現象不存在於較小的模型中但存在於較大的模型中,他們認為模型的這種能力是突現的。雖然這種能力目前主要體現在語言模型上,但它也激發了在視覺模型、多模態模型上未來的研究。

根據史丹佛大學以人為本人工智慧中心(HAI)基礎模型研究中心(CRFM)的說法,「它(大模型)代表著構建 AI 系統的一種新的成功正規化,在大量資料上訓練一個模型,並使其適應多種應用」[2]。

這種通用能力正是工業製造所需要的。工業製造面對的場景五花八門,如何通過穩定的技術體系,在高度碎片化的需求中打造通用的技術能力,成為任何一家試圖在此大展身手的科技企業的最大挑戰。

思謀科技創始人賈佳亞在公司成立之初曾提到 AI 2.0 概念,其與在當下廣泛採用 AI 1.0 的 AI 公司有所區別的一個核心要點,就是對通用性的強調。「我們想做新一代的 AI 體系架構,把以前別人在單個場景做的事情,用統一的架構去解決它,在不同場景裡做到通用」,賈佳亞說,「從底層構建更智慧的演算法,用標準化的手段解決分散的工業場景,克服可複製性和標準性等關鍵性問題。」

思謀科技最受歡迎的產品 SMore ViMo 工業平臺,就是通用性設計思維的典型例子,它是針對工業場景打造的首個跨行業中樞平臺,具有多場景通用性。不僅滿足新能源、半導體、汽車、消費電子等多個行業領域超過 1000 種細分應用場景需求,還靈活支持多種高難度工業視覺方案設計需求,比如產線的物料追蹤、缺陷定位、工件計數、外觀瑕疵檢測等等。

SMore ViMo 智慧工業平臺的系統架構。

這條路的重要特點是比較好地平衡了敏捷、個性化與低邊際成本。藉助 SMore ViMo 平臺,思謀科技已經可以同時支撐工業中不同行業的上百個項目,未來還有望再擴大十倍,同時支撐上千個項目,為 AI 的行業應用帶來效率上的突破。

在率先於大規模工業場景使用 Transformer 技術,極大提高智慧製造效率之後,思謀也再次第一時間擁抱大模型。思謀團隊是最早對大模型在工業領域的 Emergent Ability 開展研究和產業化的團隊,其工業大模型利用少量缺陷樣本進行 in-context learning,從而使基礎模型快速適應特定工業場景,並完成特定任務。

在一些業內人士看來,ChatGPT 及其背後更加具有通用性的技術的成功,將推動 AI 應用進入一個新的階段。在以工業製造為代表的各行各業中,過去紮根產業,擁抱這一趨勢,完成資料與技術落地閉環的企業擁有更多優勢,在未來應用大爆發的過程中亦會更受到青睞。

二、加速 AI 普惠

在工業製造領域,不同「語言」之間也有著深刻隔閡。有業內人士表示,工業製造產業積累了很多資料,但製造業的工程師(比如機械工程師、材料工程師)還是很少去寫程序來把這些資料利用起來,而 AI 開發者也面臨理解產業問題的挑戰,這在很大程度上約束了技術的落地。

思謀科技的演算法工程師表示,ChatGPT 背後的技術,如 RLHF (Reinforcement Learning from Human Feedback,基於人類反饋的強化學習),讓他們看到可以在現有的工作上更進一步。

RLHF 是強化學習的一個擴展,它將人類的反饋納入訓練大模型的過程,為機器提供了一種自然的、人性化的互動學習過程,就像人類從另一個專業人士身上學習專業知識的方式一樣。通過在 AI 和人類之間架起一座橋樑,RLHF 讓 AI 快速掌握了人類經驗。

他們表示,工業 AI 未來可以孕育出一個主動學習 AIaaS(AI As a Service,人工智慧即服務)平臺,通過演算法工程師和標註專家的配合,利用 RLHF 技術訓練大模型,用人類知識讓 AI 理解工業問題,並滿足特定工業任務的要求,讓不會程式設計的工業專家也能訓練 AI 模型。

目前,思謀科技已經在探索 RLHF 和工業結合的應用場景。

此外,ChatGPT 這種簡單的互動模式與工業製造中落地 AI 的策略亦十分相似。工業領域場景複雜,好的產品一定是簡單易用的,比如通過簡明的互動,一鍵化部署方案,減少交付過程中的培訓成本與學習負擔。

許多程式設計師表示,ChatGPT 相當於重新構建了一座宏偉的巴別塔,與計算機的交流,不再是程式設計師的專利,它已經可以理解部分需求,並生產簡單的程式碼方案。但現在,我們可以預見在不久的將來,製造領域的從業者也可以在 AI 平臺上實現自行程式設計,根據產線需求開發模型。這樣也能幫助解決製造業 AI 人才短缺的問題。

「只有當計算機系統可以突破工業落地中的幾大難題,實現自動演算法組合和部署,人類僅需參與少量定製化演算法設計時,AI 的跨領域規模產業化才具備實現的可能。」賈佳亞曾表示。

事實上,思謀科技很早開始便構想打造一個可實現技術快速迭代的開發平臺,只需把圖片上傳,即可自動標註缺陷,一鍵測試得到產品級的模型或 SDK,減少項目中大量投入的演算法成本。

隨著項目的迭代,思謀科技逐漸把更加成熟的行業方案和實用經驗整合到產品中,繼而推出了完整的產品類型,讓客戶無需在思謀科技員工的幫助下即可自行體驗與使用,從而形成了產品最早的商業化應用。

隨著技術的進步,無論是面向消費者,還是面向工業製造這樣的產業,我們已經看到了更普惠技術應用,正在帶來巨大的機遇。

三、ChatGPT 只是一個起點

十年以來,AI 技術的商業化受到了諸多質疑。這一次,ChatGTP 背後所代表的技術突破,預示著一場革命的到來,AI 有可能真的成為普世的生產力基礎設施。

「GPT (generative pre-trained transformer)也完全可以是 general – purpose technology (通用技術)的縮寫」,《經濟學人》的一篇文章中寫到,「一種翻天覆地的創新,可以像蒸汽機、電力和計算機那樣提升各行各業的生產率」[3]。

始於 20 世紀 80 年代的個人電腦革命,到 90 年代末開始真正提升生產力,因為這些機器變得更便宜、更強大,還能連接到網際網路。深度學習的轉折發生在 2012 年,彼時 AlexNet 神經網路在 ImageNet 比賽中獲得冠軍,至此大量研究開始鋪開,激發人們將其應用於各個領域。十多年的時間,深度學習技術正在跨越大規模賦能產業的門檻。

回顧工業製造智慧化的發展歷程,技術能力和演算法無法滿足實際應用需求、解決方案複製性較差難以落地、新技術公司與製造業企業溝通成本高等挑戰一直存在。而目前基礎模型(大模型)表現出多領域多工的通用化能力,正在打破這些行業「壁壘」,並用低成本、普惠的方式,「席捲」容錯率極低、成本敏感的產業應用。

用 AI 解決產業問題蘊含著機會,ChatGPT 是一個起點,隨著一些紮根產業的技術公司的持續深耕,越來越多的行業正在迎來 AI 應用的 「ChatGPT 時刻」。

[1] Wei, Jason, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama et al. “Emergent abilities of large language models.” arXiv preprint arXiv:2206.07682 (2022).

[2] https://crfm.stanford.edu/

[3] https://www.businessreview.global/zh-CN/latest/63e5d63ef5aab0516567873c

相關文章

ChatGPT 的「神功」,是如何煉成的?

ChatGPT 的「神功」,是如何煉成的?

最強對話式 AI,站在巨人的肩膀上。 AIGC 在這幾個月成了一個大熱的話題。 頗有些風水輪流轉的感覺,如同年初大火特火的 web3 一樣,...

當創業者開始用 ChatGPT 裁員

當創業者開始用 ChatGPT 裁員

他說,從沒想到科幻片的場景有一天會發生在自己身上。 作者 | 黎詩韻編輯| 衛詩婕 幾個月來,對話機器人 ChatGPT 展現出的能力令世界...