朋湖网获悉,近日,具身智能公司「RoboScience」(北京机科未来科技有限公司)宣布完成数千万种子轮融资,由零一创投独家投资。本轮融资拟用于产品研发和团队搭建。

RoboScience成立于2024年,由前苹果技术主管田野与新加坡国立大学助理教授邵林共同创立,携手产业专家、顶尖高校科研人才打造全球领先的具身智能大小脑模型及产品。

在创始团队层面,公司创始人兼CEO田野,曾以专业第一从中科大物理系毕业,后赴斯坦福人工智能实验室深造,师从吴恩达。田野曾是苹果总部最年轻的主任工程师之一。在苹果的7年时间中,他作为技术主管,带领团队打造了苹果的机器学习平台,支撑了相机、Siri、Apple Intelligence等AI应用和CoreML、ARKit、Vision Framework、NLP framework等AI生态框架,推出多项世界领先的端侧训练和推理技术,服务了数亿用户和数十亿设备,具有把AI技术落地到软硬件产品的丰富经验。

另一创始人兼首席科学家邵林,目前于新加坡国立大学担任助理教授,深耕具身智能领域。此前,邵林博士毕业于斯坦福大学,师从Jeannette Bohg和Leonidas J. Guibas教授。2023年,邵林合作发表的论文提出SAM-RL方法,有效解决了对世界进行高效建模的问题,入围了国际机器人顶会RSS的最佳系统论文奖。2024年,邵林带领团队提出了 D(R,O) Grasp方法,通过创新性地建立机器手与物体在抓取姿态下的交互模型,成功实现了对机器手与物体几何形状的高度泛化能力,并极大提升了抓取速度,重塑了跨智能体灵巧手抓取,获得CoRL MAPoDeL Workshop最佳机器人论文。

据了解,2024年上半年,田野与邵林完成了思路验证,推出了Manipulation Foundation Model。该统一操作大模型成为了视觉语言大模型与物理世界的桥梁,完成了三个维度的泛化:指导任意的机器人,操作任意物体,完成任意任务。

在技术路线上,RoboScience从成立之初就坚定地选择做快慢脑分层模型,这与海外明星公司Figure的探索方向不谋而合。另一明星公司Physical Intelligence最新发布的模型也从端到端VLA模型转为了分层模型。田野直言,“尽管中间有很多别的技术方向都在出来,但我们一直坚持的就是快慢脑,也就是执行与规划分层、两者各自通用。最近各公司的新进展,一方面我们有了压力和动力,另一方面也让我们不断坚持的这个方向有了更多认同的声音。”

RoboScience对于自研模型的自信,还来源于他们在数据层面的不断突破。不同于大语言模型可以从网络上抓取数据,数据来源问题一直是具身智能发展的阻碍。RoboScience已建立规模化获取并使用仿真数据、视频数据和真实数据的系统,覆盖了日常生活中可见的各种类型及各种维度的物体和任务,提升了数据质量,降低了数据成本。