人形机器人正逐渐从科幻电影中的幻想走向现实,成为我们生活中不可或缺的一部分。从最初的摔倒后快速站立,到如今能够走进家居、零售等多种应用场景,人形机器人的每一次迭代升级都凝聚着技术的不断突破与创新的智慧。在这背后,数据与算法成为了推动人形机器人不断“进化”的关键驱动力。
数据,作为训练大模型的基础,对于人形机器人的发展至关重要。然而,与语言大模型不同,人形机器人在互联网上难以找到海量的现成数据进行学习。因为对于机器人而言,真机数据的采集是一项复杂而艰巨的任务。一个简单的“倒牛奶”动作,就需要采集近百条高质量数据,以确保机器人能够精准地模拟和执行这一动作。这种对数据的极致追求,正是人形机器人得以不断进步的基石。
为了解决这个问题,多家科研机构和企业正在积极投身于人形机器人数据的采集与开源工作。以上海智元新创技术有限公司为例,该公司研究院执行院长姚卯青表示,他们有意地设计了多种大类的场景,包括家居、零售服务以及工业场景等,以采集多种多样的数据来训练机器人的大模型。这种场景化的数据采集方式,不仅提高了数据的丰富性和多样性,还为机器人的实际应用提供了有力的支持。
值得注意的是,去年12月底,上海智元新创技术有限公司向全球开放了100万条机器人轨迹的公开数据集。这一举措无疑为整个具身智能领域的发展注入了新的活力。通过这一数据集的发布,不仅可以推动学术界在具身智能领域的研究进展,还可以促进工业应用上的一些创新实践。这无疑为人形机器人的未来发展奠定了坚实的基础。
然而,仅有数据是不够的,算法才是将数据转化为机器人智能的关键。近年来,随着人工智能技术的不断发展,越来越多的算法被应用于人形机器人的研发中。以上海人工智能实验室和上海交通大学等机构共同发布的一项算法技术为例,该算法能够使人形机器人从各种状态下实现快速、稳定地站立。这一技术的突破,不仅解决了机器人起身站立的控制难题,还为机器人的广泛应用提供了有力的技术支持。
据上海人工智能实验室青年科学家庞江淼介绍,他们应该是全球第一个完成在可泛化地形、任意地形能够站起来的算法。之前的这些工作基本是在固定的地形、固定的姿态下进行的,而他们的算法则是通过从交互中学习的技术,使机器人能够在不同的场景、地形和姿势下直接站起来。这种算法的灵活性和泛化能力,无疑为人形机器人的广泛应用提供了更广阔的空间。
除了算法的创新外,人形机器人的研发还需要借助一套全新的数据采集遥操作设备。这种设备包含上肢外骨骼和下肢脚踏板等组件,操作员的动作能够在机器人身上精准复现。上海人工智能实验室联培博士生贲清炜表示,这种设备能够使得单个的操作者同时对一整台人形机器人的上身和下身进行操控,从而提高了数据采集的效率。在未来,这种设备有望应用于一些对人类来说很危险的场景,如火场、有毒气的场地等,使操作员可以在很远的地方操控人形机器人进行救援或探测工作。
在人形机器人的研发过程中,企业的参与也至关重要。目前,已经有多家人形机器人企业投入了大量的资源进行数据采集和算法研发工作。以一家位于上海的人形机器人企业为例,该企业在占地2000多平方米的数据采集中心内,部署了100台人形机器人进行各种各样的训练。这些机器人通过不断的学习和实践,逐渐掌握了各种技能和能力。同时,该企业还已经对超过100万条的训练数据进行了开源,为整个行业的发展提供了有力的支持。
综上所述,人形机器人的“进化”之路离不开数据、算法与技术的深度融合。随着技术的不断进步和创新,人形机器人将逐渐具备更强的智能和自主性,能够在更多的领域和场景中发挥重要作用。未来,人形机器人将成为我们生活中不可或缺的一部分,为我们的生活和工作带来更多的便利和惊喜。