一千台自主機器人須跨越哪道鴻溝?
過去十五年,幾項產業典範先後從0到1跨越商用門檻。手機從2007年iPhone重新定義形態,5年後(2012)出貨進入交叉點;ADAS從2014年深度學習推動視覺辨識成熟、Tesla Autopilot量產起算,到2022~2024年中國市場進入L2+標配狀態,跨越約十年;大型語言模型從2020年GPT-3到2023年ChatGPT,逐漸改變生產力的樣貌;自駕計程車則經過七年突破一千輛的關鍵門檻,開始逐步規模化—領先業者已擴張到約3,000輛,每週行駛里程仍在倍數成長。每段路徑的起點不同(形態創新、感測突破、能力湧現、車隊密度),但跨越鴻溝的共同模式相當清楚:從來不是單一公司獨立完成,而是技術突破、形態定義、平台開放、規模製造、法規介入、終端通路,各個關卡由不同類型的業者接力跑完。跨越之後的影響也大致分3種型態:產品取代(手機重新定義使用情境,feature phone供應商消失,換代最快最徹底)、產業重組(ADAS成為汽車標配,整個供應鏈、競爭力與價值重新分配,產業形態本身不消失)、生產力樣貌重塑(大型語言模型不取代人,但改寫人做事的方式與組織流程,速度最慢但影響最深)。機器人似乎也站在關鍵的時間點。2024~2025這兩年,多家公司把通用機器人系統推上現場,VLA架構從學術論文走進產品,工廠試點開始小規模部署。如果把問題更具體化:今天還沒有一家公司能讓1,000台機器人在開放場域中達到完全自主的長時間運作。目前最具規模的部署,要不依賴預先規劃的場景(倉儲AMR),要不依賴可觀比例的遠端操作員介入(配送機器人)。「能做出一台」與「能讓一千台真正自主運作」,是兩道性質不同的門檻。實驗室裡示範1台機器人泡好1杯咖啡很驚豔;要把同樣的能力放大到醫院物流、餐飲後場、產線組裝這類場域、千台規模、每天10小時連續運轉,又是完全不同層級的問題。以倉儲AMR為例,某大型電商物流中心同時運行超過4,000台自主移動機器人,條件是預先鋪設的格狀地板、固定路徑、不允許外物進入。這4,000台跑的是預先規劃好的路徑,不是在開放場域中即時感知、規劃、決策。把倉儲為機器人改造,是先把場景的不確定性拿掉,讓機器人在規劃過的環境內運轉——這在工程上有效,但離真正的自主能力還有差距。接下來幾年,機器人能不能真正擁有「自主性」、像前述三項典範那樣跨越chasm(鴻溝),技術上的關鍵在兩塊長期被低估的能力:「長時序規劃」與「泛化」。第一塊是長時序規劃(long-horizonplanning)。煎蛋翻面、塗果醬、把箱子搬上輸送帶,任何「看起來很簡單」的任務拆開都是十幾步連續決策。每一步當下做對不代表整體能完成;累積誤差(compoundingerror)、子目標衝突、感測雜訊在某一步觸發誤判,整段規劃可能就此失效。舉例來說,即使每一步有9成準確率,連續10步整體成功率仍會掉到3成左右。機器人面對的是物理環境,每一步的誤差不只是文字錯誤,可能是手臂卡住、物件掉落、推倒旁邊的杯子。目前VLA模型在短任務上已展現基本能力,但30秒以上的連續任務、跨子目標的重新規劃、失敗後的自我恢復,仍是研究熱區。沒有這層能力,機器人無法獨立完成廚房一道菜、清潔一間病房、組裝一塊主機板。第二塊是泛化能力。換個光源、換個物件、換個房間布局,機器人的成功率能否維持?這個問題的根源不在模型本身,而在訓練資料的覆蓋度。VLA模型的能力直接受限於資料的場域多樣性、視角多樣性、物件多樣性、失敗模式多樣性,任何一個維度覆蓋不足,部署到現場就會持續露出缺陷。模擬器可以補一部分,但接觸密集場景與感測雜訊的真實分布只能部分逼近,這在前一篇Sim-to-Real已詳述。真正的解方是讓部署現場本身成為持續的訓練資料來源:千台機器人在工廠、餐飲、物流連續運作,每一次失敗、每一個未見場景回流中央模型,經篩選、標註、再訓練,再以OTA更新回邊緣裝置;規模本身成為模型進化的燃料。這個自我強化的迴路就是業界所稱的fleet learning。自駕車產業從2016年起花了將近十年才把它建起來,工程上真正的重點不在模型,而在資料管道、篩選與標註、版本管理、現場運維與維修回應網路,每一塊都是獨立工程系統,缺一塊整個迴路就跑不起來。其他幾項在前幾篇已展開:靈巧操作的觸覺與力回饋、Sim-to-Real落差、VLA安全設計(執行前棄權、執行中監控、語義層的物件風險)。這些在工廠試點階段都在被解,但要走到1,000台、10,000台規模時,都會與長時序規劃、泛化、fleetlearning糾纏在一起,任何一項補不齊,整個迴路就跑不滿。技術之外,還有2道非技術障礙會擋住採購端決策。一是認證體系與持續學習的衝突:現行的工業與自主機器人認證(ISO10218、UL3300、2027年生效的歐盟機械法規)建立在「行為可預測、可凍結、可審計」的前提,fleet learning的核心卻是「模型在部署後持續更新」,OTA之後是否要重新認證目前沒有明確答案。二是保險與責任歸屬:當機器人停掉產線或撞到推床,責任主體是製造商、部署方、模型供應商、還是現場整合商?自駕車產業討論了十幾年才大致收斂於「L4/L5由製造商承擔」,服務型機器人介面更分散,責任分層只會更複雜。沒有保險背書,採購方就無法承擔對應的風險。場景選擇也是一道初期障礙。哪一種垂直情境適合一個剛起步的機器人系統開始真正自主運作?這個問題沒有最佳解,但前述無人計程車業者的軌跡給了清楚的策略:先把問題的開放性壓到夠小,劃出明確圍欄,在受控邊界內累積運轉時數、收集真實場域資料、把例外情境逐一解掉,回頭看清楚這個任務的核心運作邏輯,然後才把邊界往外推。該業者從特定城市的受限路段起步,逐年向外擴大運行範圍,每一次擴張都是在前一個邊界內把長尾收斂得足以承接下一輪。機器人對應的問題是:哪些垂直場域同時有足夠的需求密度、任務重複性與容錯空間,能讓fleet learning迴路真的跑起來?答案多半在工廠某條產線、特定倉儲格局、特定餐飲後場、醫院藥局,而不是「家庭服務機器人」這種看似最大、實際開放性也最大的終局場景。業界對機器人規模部署的時間表,多半指向2028~2030年才會出現以萬台為單位的案例。能否成立,取決於接力賽每一棒能否在這幾年同步接好。技術上要把長時序規劃與fleet learning推到產業可用的水位;商業上要把形態定義、開放平台、規模製造、終端通路這幾棒補齊;制度上要拿出認證體系與責任歸屬的答案。3項都同步到位,這個時間表才會兌現。對台灣供應鏈來說,真正的押注點不是哪個整機廠商會贏,而是哪一棒會在自己擅長的位置接好。