東京Humanoids Summit觀察:當實體AI成為有手腳的電動車
日本大阪大學教授石黑浩教授(類人機器人研究先驅)在Humanoids Summit主題演講結尾說了一句話「日本在機器人研究上投入了數十年,但還沒有殺手級應用」。日本在工業機器人領域的先驅地位毋庸置疑,川崎、發那科、安川的機械手臂至今仍是全球工廠的骨幹;然而近年數據顯示,日本製造業的機器人密度已從全球第一跌至第五,數十年的研究積累,未能取得新世代自主機器人的領先優勢。回到最基本:機器人最終要回答的問題,是能否提升「生產力」,而不是形態是否像人。2026年5月底在東京舉辦的Humanoids Summit,是這個發源自矽谷的論壇首次進軍亞洲,匯聚各領域第一線業者與決策者上台,來自50個國家的與會者同場。包括汽車廠與製造業龍頭的機器人策略負責人、基礎模型研發團隊、機器人新創執行長、法務風險分析師與投資決策者,討論的是商業化路徑,不是研究論文。會場有人把機器人稱為「有手腳的汽車」,背後有一條比多數人意識到的更具體的產業邏輯。會議名稱雖叫「人形機器人高峰會」,但兩天下來討論的範圍遠不止於此。四足機器人已在高速公路涵洞裡偵測裂縫、在晶圓廠用熱像儀發現幫浦過熱、在大型賽事現場執行化學生物威脅偵測,這些是已驗收的商業合約,不是展示影片。某家靈巧手廠商出貨超過1,000套,物流場域單筆訂單超過700萬美元。以Real2Sim2Real資料飛輪為核心的新創,在2026年第1季拿到超過1億美元訂單,說明訓練基礎建設本身已成為有真實收入的生意。人形機器人只是具身智慧的一種形態;這個產業的全貌,是一個還在快速分化的生態系。筆者在現場持續帶著2個問題:眼前這個展示,能否在非受控條件下重現?以及,這個產業何時才能真正放量?某家靈巧手廠商的發表者在台上說:「These are real」,連業者都感受到必須主動澄清的壓力。靈巧操作是目前公認的最後一道硬體障礙,兩天下來技術深度最高的展示是某家車廠的16自由度手內操作,但仍是高度受控的條件。移動與感知已逐漸工程化;卡住的是操作——抓取不同材質、形狀、重量的物件,在需要精細力道控制的場域,仍是高失敗率的環節。長時序任務的可靠性是另一道結構性門檻。任務步驟愈多,錯誤率加速累積,真實場域的容錯空間遠低於實驗室。各家都在針對特定場域補強;現場展示的永遠是最有把握的任務;實際部署能可靠執行的範圍,遠比展示看起來的窄。真正限制部署的,不完全是技術問題。產業調查顯示,71%的企業主管認為目前最大障礙是「business case 說不通」。成本是直接原因:高階機器人採購成本落在15萬~50萬美元之間,估計需要降到2萬~5萬美元,才能打開大規模採購。認證架構同樣空白,目前沒有任何一套標準完整涵蓋具備語言理解與自主決策能力的機器人系統;商業場域發生事故時,製造商、操作者、AI 模型開發者之間的責任歸屬仍無清楚的法律架構,這是大規模採購無法跳過的前提。部署因此有其優先順序。第一波進入的是結構化環境(製造業產線、物流倉儲、基礎設施巡檢),第二波才是半結構化環境(工地、醫院物流、商業設施維運),家庭與照護場域是現場討論最熱烈的,也是目前幾乎沒有人能可靠做到的。機器人不是從最有趣的地方開始部署,而是從投資報酬率最清楚的地方開始。一個有參考價值的前例:某大型服務機器人當年進入2,000家企業,3年後85%放棄,失敗原因有83%不是技術問題,而是與組織流程和人員文化的整合失敗。分工地圖則是另一層問題。市場分析列出機器人關鍵硬體的全球產能分布:永久磁鐵中國佔 90%、致動器 55%、諧波減速機 45%、電力電子 30%。這些零組件與電動車供應鏈高度重疊,過去十年中國電動車的快速擴張,同時建立一套可直接轉用於機器人量產的製造能力。這是整場討論的隱性背景,多位講者都觸及這個現實,沒有人把它定性為威脅,但數據攤開來,結論不言而喻。現場一張來自歐洲的投影片標示:「China is dancing ahead — From dance floor to the shop floor」。「有手腳的汽車」這個比喻,對資訊電子業的含意相當直接。人形機器人半導體市場估計將從2026年約2,100萬美元成長到2050年的1,770億美元(若涵蓋工業機器人與AMR,整體還要大上數倍);每台高階人形機器人的晶片物料清單約1,400美元——光是70個以上的關節,每個都需要獨立的MCU做馬達控制,這還不包含推論與感知層的需求。功能安全MCU、馬達驅動IC、感測器訊號處理晶片,與車用電子規格需求高度重疊,服務汽車供應鏈多年的能力在機器人場域有相當程度可以對應。但晶片這一層的分工地圖與機械零組件截然不同:感測器、推論晶片、安全 MCU,日本、美國、歐洲、南韓業者都有明確位置。再往上是軟體模型層,基礎模型的研發重心在矽谷與北京,開源生態讓各層的競爭邊界持續模糊。同一個「機器人產業」,機械硬體、晶片、軟體三層各有自己的競爭格局,不能用同一張圖理解。兩天下來,筆者對這個時間點最清楚的感受是:2026年更像是機器人基礎建設的元年——賣鏟子的先有生意。訓練資料服務、資料收集基礎建設、各地資料工廠,真正有確定性收入的環節在供應鏈的更上游,不只是整機廠商。資料飛輪能否轉起來,可能比組裝良率更早決定誰在這場競賽裡站穩。但石黑浩那句話提醒的問題還在:殺手級應用是什麼、在哪個場域、誰先找到。電動車的答案不是在實驗室裡想出來的,是在場域裡跑出來的。供應鏈可以先跑,這個答案卻沒辦法用鏟子挖出來;從2013年以來幾輪AI技術更替的經驗看,在真實場域中貼近客戶、理解生態系需要什麼的,往往是上升曲線之後的贏家。