
近日,竖立不到半年的物理AI数据奇迹平台觅蜂科技布告完成新一轮数亿元天神+轮计策融资:由国方创投领投,孚腾本钱、上海电科基金、元启转换等跟投,老鼓舞均普智能、鼎晖VGC接续逾额追加投资。
觅蜂科技将自己定位为“民众一站式物理AI数据奇迹平台”,要作念的不仅仅帮东谈主“采点数据”,而是把网罗—解决—请托串成一条可复制的工业级链路。
在业内看来,这不是一笔平庸的早期融资。
本轮投资方皆集了国资与产业本钱两大阵营——背靠上海海外集团、上海国投两大国资平台,联动上海数据集团、国度机器东谈主检测与评定中心(总部)等官方生态资源。一家竖立不及半年的公司,凭什么让国资和产业本钱同期下注?谜底藏在具身智能行业一个看似败兴却至关进击的命题里:数据清寒。
“数据稀薄”里的万亿风口
要是把具身智能比作一座金矿,那么面前最紧俏的生意不是挖矿,而是卖铲子——这把“铲子”,即是高质地物理AI数据。
大语言模子不错靠互联网上的海量文本“自学成才”,但机器东谈主不能。让机器东谈主“用手捡起干木耳”这个对东谈主来说十拿九稳的手脚,它需要沟通物体材质辨识、空间姿态匹配、力反映感知等多个妙技。 这些数据无法从互联网上平直下载,必须在真什物理寰宇中通过东谈主与物体的交互来网罗。
左证关整个据,大语言模子GPT-5的考验语料折合约100亿小时东谈主类语言时长,而全行业集合的高质地具身数据仅约50万小时,差距以万倍计。 据测算,2026年行业高质地有用数据缺口超500万小时。完成一个高质地模子的考验,至少需要千万小时量级的数据。
业内内行这么打譬如:大语言模子就像一个博览群书的学者,不错在藏书楼里找到险些整个需要的常识;而具身智能模子则像一个从未出过门的婴儿,必须有东谈主手把手教它怎么抓执、怎么行走、怎么与东谈主互动。
面前最大的问题是,这个“婴儿”需要的教养视频,市面上险些莫得。
从“手职责坊”到“数据工场”
传统数据网罗花式号称“手职责坊”——依赖专科东谈主员通过遥操作开拓辛勤操控真实机器东谈主,一天仅能网罗数十小时数据,成本辛劳且成果低下。
国内真机数据的市集价钱当今在每小时500-1000元之间, 这关于动辄需要百万小时数据考验的模子而言,日韩精品无码人成视频手机是一笔天文数字。
觅蜂科技选拔了一条不同的路。它推出的MEgo系列无内容网罗硬件,让平庸东谈主戴上面戴开拓和腕部夹爪就能完成高质地数据网罗,罢了“随行即采、走到哪采到哪”。 这种“无内容”决议的中枢逻辑是:不需要腾贵的机器东谈主内容参与,东谈主类平直演示操作,网罗到的数据进程处理后可用于考验不同型号的机器东谈主。
这十分于把数据网罗从“专科影相棚”形成了“全民顺手拍”。觅蜂科技CEO姚卯青炫耀,无内容数据的网罗成果芜俚是真机的两三倍,价钱最终将料理至真机数据的三分之一到二分之一。 要是真机数据卖到每小时1000元,无内容数据昔时可能踏真的300-400元。
但价钱下落并不虞味着利润空间收窄。刚巧相悖,范围化坐蓐带来的边缘成本递减,可能让“薄利多销”成为更可接续的买卖模式。觅蜂科技标的2026年罢了千万小时级数据产能,2030年冲刺百亿小时数据体量。
赛谈拥堵,但“程序之战”才刚开动
觅蜂科技不是独一看到“数据铲子”契机的玩家。
鹿明机器东谈主推出的FastUMI Pro无内容网罗系统,已将数据网罗成果提高至传统决议的3倍,91精品久久久久久久久蜜臀同期将成本降至约1/5。其数据超市已诡秘工业坐蓐安设、家庭生涯、餐饮、物流仓储、医疗照拂等10大主流垄断场景,40余个任务类型,有成果高达95%以上。与此同期,鹿明已开拓多个程序化数据网罗基地,并在2026年启动百万小时数据网罗标的。
光轮智能则凭借自研物理仿真引擎,在合成数据边界成立壁垒,诡秘从物理真实仿真、范围化数据坐蓐到模子才气评测的圆善链路,2025年全年营收罢了10倍增长,2026 年Q1单季瞻望收入朝上25年全年总额。
互联网巨头也开动成为入局者。京东在2026年3月布告开拓具身智能数据网罗中心,标的发动数十万东谈主参与网罗,一年内积贮500万小时东谈主类真实场景视频数据,两年内险峻1000万小时。
但在行业内行看来,当今的竞争焦点未必不在网罗成果,而在数据程序。面前行业最大的痛点不是数据太少,而是数据不兼容。不同厂商使用不同的网罗开拓、数据边幅和标注范例,导致数据无法在不同机器东谈主和模子之间运动。一家厂商破耗多量成本网罗的数据,对另一家厂商可能毫无价值。
这就像在智高东谈主机出现之前,每个手机品牌都有我方的充电接口和数据边幅。谁能制定行业协调的“USB程序”,谁就能掌执整个这个词行业的话语权。觅蜂科技结合工信部赛迪酌量院、国度数据标委会等机构发起“蜂巢数据共创行径”,亦然对准了这一制高点。
千亿市集的冷念念考
据沙利文预测,到2030年中国物理AI仿真及数据平台市集范围将达到1,806亿元,其中智能汽车和具身智能机器东谈主分袂占比36%和34%。英伟达CEO黄仁勋以致断言,物理AI有望重塑民众价值约50万亿好意思元的制造和物流产业。
这些数字令东谈主伟姿飒爽,但一个基本问题尚未获取解答:数据是否越多越好?
大语言模子的“GPT时辰”成立在相对了了的Scaling Law(范围定律)之上——数据越多,模子越强。但在机器东谈主边界,这条定律并不那么了了。UC Berkeley教育Ken Goldberg在ICRA 2026大会上指出,仅靠数据远远不够,传统工程蓄意、模块化系统和综合调试依然系统落地的要道,真实坐蓐环境中部署产生的数据尤为进击。
换句话说,机器东谈主需要的不仅是“海量数据”,更是“高质地闭环数据”。此外,具身智能数据奇迹商还面临一个考验:能否在机器东谈主大范围部署之前成立起不可替代的基础程序地位——包括数据程序、质地体系和交往平台。不然,当机器东谈主内容厂商自建数据才气练习后,第三方数据奇迹商的议价空间将被大幅压缩。
觅蜂科技的融经验程(从种子轮到天神+轮仅用时四个月), 以及国资与产业本钱的结合加持,标明本钱市集对这一逻辑的认同。但本钱的存眷与产业的本质之间,时常存在时滞。2026年被称为“具身智能数据范围化元年”, 但这一年究竟是泡沫的偏激,如故产业化的起先,只怕要比及第一批机器东谈主信得过在工场里踏实运行24小时×7天之后,才能给出谜底。
采写:南都·湾财社记者 胡雯雯
