科技浪潮洶涌澎湃,人工智能(AI)的每一次躍遷都牽動著全球的神經(jīng)。當(dāng)大模型在虛擬世界中展現(xiàn)出驚人的智慧時,一個更具革命性的命題浮出水面——具身智能。如果說AI是人類大腦的延伸,那么具身智能機(jī)器人便是人類軀體的延展,它預(yù)示著一個物理世界與數(shù)字世界深度融合的嶄新時代。一個脫胎于特斯拉的華人團(tuán)隊(duì),正以中國速度和中國智慧,書寫著人形機(jī)器人領(lǐng)域的"擎天新篇章",它便是——矩陣超智。
在近日舉辦的2025 WAIC矩陣超智展臺上,通體雪白、手指靈巧、設(shè)計(jì)前衛(wèi)的機(jī)器人吸引了眾多參展觀眾的駐足拍攝與合影轉(zhuǎn)發(fā)。
具身智能:遇到物理世界的挑戰(zhàn)
矩陣超智的創(chuàng)始人張海星對人形機(jī)器人的工程化挑戰(zhàn)、核心技術(shù)瓶頸以及產(chǎn)業(yè)化路徑有著深刻洞察。當(dāng)前人形機(jī)器人領(lǐng)域面臨三大核心難點(diǎn):
● 實(shí)時性問題:
機(jī)器人需要對環(huán)境變化做出快速響應(yīng)。在復(fù)雜環(huán)境中,如快速行走、躲避障礙物或與人類實(shí)時交互時,大模型的計(jì)算和推理過程可能會產(chǎn)生較大延遲。其根本原因在于大模型的復(fù)雜性和巨大的計(jì)算需求。
● 魯棒性難題:
現(xiàn)實(shí)世界充滿眾多不確定性。光線、溫度、地形、障礙物分布等環(huán)境因素時刻變化,這些都可能導(dǎo)致機(jī)器人的運(yùn)動控制出現(xiàn)偏差,進(jìn)而影響其運(yùn)動規(guī)劃和控制的準(zhǔn)確性。
●模型可解釋性缺失:
隨著AI算法和模型日益復(fù)雜,它們往往呈現(xiàn)出"黑箱"特性,使得理解其決策過程和輸出結(jié)果的依據(jù)變得困難,這給機(jī)器人的可靠性和安全性帶來了挑戰(zhàn)。
面對這些挑戰(zhàn),矩陣超智提出了他們的"破局之法"——"大小腦-本體協(xié)同"的分層控制系統(tǒng)設(shè)計(jì)。大小腦分層控制讓效率與精準(zhǔn)度雙雙提升。張海星解釋道:"無論是北大、清華,還是麻省理工、斯坦福、伯克利這樣的科研院所,還是Physical Intelligence (PI) 和英偉達(dá)的GR00T這樣的商業(yè)化公司,都采用了分層控制的架構(gòu)。"在張海星看來,這些看似不同的路徑最終都是"殊途同歸"。
矩陣超智將機(jī)器人的控制系統(tǒng)分為:系統(tǒng)1和系統(tǒng)2。張海星表示:"矩陣大腦(Matrix Brain,系統(tǒng)2):主要負(fù)責(zé)低頻次的感知、決策和規(guī)劃,運(yùn)行頻率在0Hz-20Hz。它像人類的'慢思考',采集所有的視覺環(huán)境、機(jī)器人自身的關(guān)節(jié)信息、姿態(tài)信息以及慣性信息。通過VLM(視覺語言模型)和擴(kuò)散模型(如Transformer、Diffusion Transformer),將這些信息序列化生成動作的'Token'指令。強(qiáng)化學(xué)習(xí)運(yùn)動控制平臺(系統(tǒng)1):運(yùn)行頻率在100Hz-1000Hz。它像人類的'小腦',以高頻輸出末端關(guān)節(jié)基于力控、位置控制的目標(biāo)動作'Token'。"
這種大小腦分層控制的架構(gòu),讓高頻次運(yùn)動控制與低頻次智能決策完美結(jié)合,有效解決了實(shí)時性問題。張海星透露,他們的終極目標(biāo)是在年底或明年上半年打通VLM與VLA(視覺語言動作模型)的端到端模型,實(shí)現(xiàn)前端視覺語音輸入命令的感知,后端直接是機(jī)器人的動作執(zhí)行,使機(jī)器人更像人類一樣自然作業(yè)。
開放平臺:打造機(jī)器人界的"iOS生態(tài)"
矩陣超智的另一大戰(zhàn)略是構(gòu)建一個基于全自研的開放開發(fā)者平臺。張海星用了一個精妙的比喻來區(qū)分他們與英偉達(dá)的不同定位:"英偉達(dá)更像是提供基礎(chǔ)設(shè)施的賣鏟人,提供芯片、仿真環(huán)境、云端算力。而矩陣超智的開發(fā)平臺,更像一個蘋果的iOS系統(tǒng)。我們的機(jī)器人本體就是iPhone,普適性強(qiáng)、可靠的硬件。"
并為開發(fā)者提供了一個"交鑰匙工程",開發(fā)者拿到矩陣超智的機(jī)器人本體和開發(fā)者接口,就能輕易調(diào)用機(jī)器人下半身的行走能力、上半身五指操作能力,以及多處視覺、激光雷達(dá)、觸覺傳感器和慣性導(dǎo)航傳感器等底層能力,快速適配各種應(yīng)用場景。這種“硬件+軟件+平臺”的全棧式解決方案,能吸引全球開發(fā)者圍繞矩陣超智的機(jī)器人本體和軟件系統(tǒng),采集數(shù)據(jù)、部署應(yīng)用,共同構(gòu)建人形機(jī)器人生態(tài)。
工程師的浪漫:審美與安全的深度融合
作為特斯拉中國設(shè)計(jì)中心的前負(fù)責(zé)人,張海星對機(jī)器人的外觀設(shè)計(jì)有著獨(dú)到的見解。他指出,矩陣超智的第一代人形機(jī)器人——Matrix-1,采用了全身包裹式架構(gòu),這不僅賦予了機(jī)器人獨(dú)特超前的外觀,更重要的是“符合人機(jī)交互安全”。與一些電機(jī)裸露在外的友商不同,Matrix-1的設(shè)計(jì)能有效避免對機(jī)體本身和環(huán)境交互產(chǎn)生影響。
張海星表示:“我們的工程團(tuán)隊(duì)的審美和調(diào)性幾乎超越了特斯拉的品味。我們希望能代表中國團(tuán)隊(duì),拿出具有中國原創(chuàng)和中國審美的作品。Matrix-1對標(biāo)美國Figure 02機(jī)器人,擁有全尺寸仿人型身高。這僅僅是開始,未來隨著機(jī)器人機(jī)體的不斷迭代演進(jìn),我們將帶來更多令人驚喜的作品。”
產(chǎn)業(yè)深度思考:及未來展望
張海星表示:"矩陣超智的使命是:打造通用人形機(jī)器人來提升整個社會的生產(chǎn)力和整個人類的潛能。"
"我們的目標(biāo)并非只是制造玩具或教育機(jī)器人,而是開發(fā)一款能夠替代人類能進(jìn)行商業(yè)服務(wù)、物流搬運(yùn)、生產(chǎn)制造,乃至消防、等危險作業(yè)等重復(fù)性勞動的生產(chǎn)力工具。"
然而,這條道路并非坦途。張海星坦言,當(dāng)前最大的挑戰(zhàn)是人才的爭奪。他深有體會:"現(xiàn)在的人工智能時代,與其說是中美兩邊AI人才團(tuán)隊(duì)的博弈,不如更客觀地來說是中美兩邊華人的博弈。"頂尖的AI人才,尤其是具備自動駕駛、機(jī)器人背景的年輕華人工程師是全球爭奪的稀缺資源。
其次是產(chǎn)業(yè)鏈的成熟度。雖然我國擁有強(qiáng)大的產(chǎn)業(yè)基礎(chǔ),但在人形機(jī)器人核心零部件方面,與瑞士、日本等在工藝、制造、質(zhì)量和成本方面仍存在差距。這需要大量的產(chǎn)業(yè)投資和反復(fù)的打磨,才能在未來實(shí)現(xiàn)趕超。
最后是成本與需求之間的矛盾。目前人形機(jī)器人仍處于產(chǎn)學(xué)研究到工程落地的進(jìn)程中,成本居高不下,而消費(fèi)者對價格又高度敏感。"如果你沒有一個可負(fù)擔(dān)得起的成本,你的量實(shí)際上也是個悖論,產(chǎn)量很難上來。"張海星強(qiáng)調(diào),如何在行業(yè)沒有形成規(guī)模效應(yīng)的前提下實(shí)現(xiàn)降本,是所有創(chuàng)業(yè)公司必須解決的問題。
對于"國外一開源我們就自主"的論調(diào),張海星并不完全認(rèn)同。他認(rèn)為,開源是站在人類現(xiàn)有知識基礎(chǔ)之上達(dá)成的目標(biāo),中國也有大量頂尖科研機(jī)構(gòu)和企業(yè)在積極參與開源。更重要的是,中國在硬件國產(chǎn)化能力上具備全球領(lǐng)先的產(chǎn)業(yè)基礎(chǔ),這是我國機(jī)器人實(shí)現(xiàn)彎道超車的核心優(yōu)勢。"機(jī)器人不只是軟件,是軟硬件結(jié)合的系統(tǒng)。"他堅(jiān)信,在具身智能這個賽道,中國有機(jī)會實(shí)現(xiàn)彎道超車。
AI加速:開啟千家萬戶的機(jī)器人時代
具身智能很快會走進(jìn)千家萬戶,張海星對此充滿了信心。他認(rèn)為,OpenAI和DeepSeek等大模型的加速發(fā)展,將極大地推動軟件、硬件和機(jī)器人落地的迭代速度。"與100年前的汽車工業(yè)不一樣,那時是人類知識極度匱乏且信息孤島的時代,而由于AI的加速,我們的認(rèn)知差幾乎是平的,世界是平的。"這意味著,接下來比拼的將是團(tuán)隊(duì)的執(zhí)行力,能否更快速地將最新技術(shù)在場景和用戶中落地,以及硬件能否以合理成本和價格被消費(fèi)者接受。通過不斷加速工程化和迭代過程,人形機(jī)器人進(jìn)入千家萬戶將成為可能。
正如馬斯克所言,如果一臺人形機(jī)器人的零售價是3萬美元,如果能像iPhone一樣每年保持1億臺的穩(wěn)定出貨量,那一家公司的年收入將達(dá)到3萬億美元。這無疑是一個極其龐大的市場,一個能夠深度改變社會生產(chǎn)力和人類生活方式的萬億級賽道。
"我堅(jiān)信,包括我在內(nèi),我們這一代人的生活、養(yǎng)老一定是機(jī)器人來幫我們?nèi)プ黾覄?wù),來幫老人翻身,把我們從床上抱到輪椅上,推著我們輪椅去散步,這是一個確定性的場景。"張海星的話語擲地有聲,這不僅僅是對未來的憧憬,更是對當(dāng)下所肩負(fù)使命的堅(jiān)定信念。
結(jié)語
矩陣超智作為一個創(chuàng)業(yè)公司,只是中國科技力量在具身智能領(lǐng)域崛起的一個縮影。面對前所未有的挑戰(zhàn),他們以特斯拉的工程化底蘊(yùn)為基石,以分層控制的創(chuàng)新架構(gòu)為引擎,以開放共贏的生態(tài)理念為航向,正一步步將人形機(jī)器人從科幻變?yōu)楝F(xiàn)實(shí)。在這個萬億級的賽道上,中國的具身智能正以前所未有的速度和決心,定義著未來生產(chǎn)力的新高度。
(智能網(wǎng)原創(chuàng),轉(zhuǎn)載請注明出處)