受访者供图
口述 许学成 整理 于佳
人形机器人走路“咚、咚、咚”的声音,隔着一堵墙都能听到
我一直记得那天,2024年6月的一个晚上,隔壁实验室传来欢呼声,我跑过去一看:人形机器人“领航者2号”站起来了。它在晃悠,走路“咚、咚、咚”的声音,隔着一堵墙都能听到。
那一刻,我心跳加速,感觉一切没有白忙活。
“领航者2号”的整机组装大概在3月份就完成了,我们一直在等它醒来。像女娲造人,泥巴早就捏好了,等它起立、行走,独当一面。
相对于其他人形机器人,“领航者2号”的核心优势在于它的灵巧操作,这也是我们浙江人形机器人创新中心的优势。目前,我在创新中心担任技术总监。
我叫许学成,1997年出生,杭州人。父母给我起名“学成”,盼我学有所成,我也算不负期待。
博士毕业那天,好多亲戚朋友跟着父母一起赶到学校跟我合影
我的小学,就读于杭州四季青小学,童年生活相当平凡。和大多数家庭一样,我有一个非常上进的母亲和惯于沉默的父亲,他们文化程度不高,母亲学财务,父亲做工程,母亲一直想办法激励你成才,父亲则一直告诉你不要慌张。
小升初时,我考上了杭外(杭州外国语学校)。在杭州人心中,考入杭外,约等于一只脚踏进浙大。
其实,刚到杭外时,我的成绩卡在中下游,每次大考结束,看到我名字前面的名字排成长队,压力就很大。我还记得周末骑车去补习的路上,会路过一个小吃店,我通常点一碗面,加一碟盐蘸牛肉,那是生活中少数的能让人完全放松下来的十几分钟。
升入高中,我的成绩从中游追到了上游,被保送到浙江大学竺可桢学院,这里几乎汇聚了浙大最顶尖的本科生。
在我从小到大的生活半径里,考上浙大的人不多,考入竺可桢学院的可以说是“凤毛麟角”。博士毕业那天,好多亲戚朋友跟着父母一起赶到学校,我穿着学位袍轮流和大家合影,前前后后拍了一个多小时,大家都觉得身边能有人读出一个博士,这很不容易。
自己写的代码变成过关斩将的“选手”,让人挺兴奋的
我和机器人的缘分,就是从进入浙江大学读书开始的。
2016年,选专业前,学校组织我们去各个学院参观。我原本很想学建筑,但一到控制学院,看到实验室有两台仿人形的乒乓球机器人,立即被吸引了。当时,我本身就有点“极客”(注:源于“geek”的音译,形容对计算机、网络技术或特定领域有狂热兴趣并投入大量时间钻研的人),看到这两台机器人,不仅能和人对打,还打得非常流畅,还能接打旋转球,那一瞬间,我决定就学智控(控制科学与工程学)。
我们这一代大学生很幸运,在专业选择上,更多人有底气去选择自己想做的事。
我们学院的学风非常好。直到现在走出大学,我还是能不断感觉到自己一直在承上启下中借力和助力。
我第一次去参加机器人主题的活动,是大三时和师兄一起代表浙大出战,去澳大利亚参加Robo Master人工智能挑战赛,这项比赛被誉为“机器人界的奥林匹克”,当时国内也有其他高校参加,我们去比谁自主研发的人工智能机器人最厉害,谁能在最短时间内击败官方“boss”。那次比赛,“哈工深”(哈尔滨工业大学深圳校区)得了冠军。
那是我第一次感受到,把实验室里写的代码变成过关斩将的“选手”,让人挺兴奋的。
这次比赛也让我感受到做科技要只争朝夕,如果错过了节点,没有在最短时间用最有效的路径抵达,就会失去决定性意义。
机器狗顺利完成任务,把那些隐藏的箱子全找到了
2019年,在大理举办的实时计算与机器人国际会议上,我的论文入选了,主题是讨论空地协同,简单说就是地面放一辆小车,天上飞一架无人机,它们俩不依赖事先构建的高精地图导航,就能相互定位,清楚知道对方在空间里的具体位置,就像我们平时用共享位置。
这是我第一次去参加与机器人相关的学术会议,在会场里遇见了“大佬”,至今在工作上仍有交流。当时,看着他们分享的研究成果,就觉得“哇,原来还能这么做”,觉得他们很厉害,做的工作有前瞻性,真的能给这个行业带来新的见解、新的方向,而不是跟着别人的脚步走。
2022年,我参加了一个机器狗自主搜救的项目,实验核心就是研发一套智能系统,让机器狗能在没人引导的情况下,把指定区域都搜遍,并精准找到救援对象。
整个项目的节奏非常紧张。前几个月,天天都在写代码,搭建自主导航、区域覆盖、目标识别的基础框架。等到了和硬件磨合的阶段,既要反复调试机器狗的运动稳定性,又得根据搜救场景给它做改装。
临近专家组验收的那一个月,我拉上几个同门学弟,几乎每天都带着机器狗去室外做实测,临时搭了个棚子,把电脑、调试设备全搬过去,几乎天天都是后半夜才收工,直到系统终于调试到稳定状态。
现场演示的地点选在校园,几千平方米的室外区域里,还有几栋楼,环境挺复杂的。那天,我们在区域里事先放了几个箱子,上面贴了反光标识带,这是模拟搜救场景里,受困者穿的反光马甲。十多分钟后,机器狗顺利完成任务,不仅把整片区域的地图精准建了出来,还把那些隐藏的箱子全找到了,顺利通过了专家组的考察。
后来,一些高校和研究机构都陆续在这套系统上做相关研究。
当我有了想去爱的人,再去写代码,就会不一样了
做科研,是很辛苦的。我曾为了一个技术问题连续几周陷入困境,吃饭、睡觉都会想着这个问题。每天拼命学习前沿知识,却始终找不到突破口。
正因于此,我觉得有必要跳出自己的信息茧房。读研时,我报名参加了浙大研究生艺术团,没想到,在这里认识了我的女朋友。
她是学经济学的,弹钢琴很厉害,我其实已经记不得她当时演奏了什么曲子,只是觉得非常感动。她看我想学演奏,送了我一本琴谱,还教我基本的演奏方法。我教她骑自行车,她两三天就学会了。
虽然,直到现在我还是无法演奏一首完整的曲子,但是我遇见了她。
我们都非常忙,见不到面的时候很多。但不管多忙,每天都会打电话。我并不是一个喜欢说话的人,可不论开心或是沮丧,任何事情,我都会想说给她听。有时,她来看我,但恰巧这一天我实验进展不顺利,我可能会瞬间沉默,她也能全部理解,自然而然地,陪我一起。好像我们的心早已长在一起,不需要多余的解释。
在读本科时,我还参加了浙大支教团,暑假里和同学一起去黔东南支教。当时,我们支教的小学刚修缮完,浴室里只有一根水管,宿舍也是刚建完的,清一色的上下铺,连墙漆都没刷。
这所学校的小孩大多住在附近的村子里,我和支教的同学一起走路去村里家访,一起熬夜备课,忙完了就去操场上放松,有时,直接躺在草地上。晚上没什么灯光,星星非常亮,还能清清楚楚看到银河。
当时,我只是想去体验一下,但没想到我会一直记得这些明亮的夜晚。当实验效果达标、文章发表,当我心里感受到阶段性的光明,我会想起那样自在地仰望星空的时刻。重叠的山已经不能阻隔任何知识的获取,这些都可以通过技术实现。
当我有了想去爱的人,当我去看了更真实的远方,我再去写代码,所思所想会更丰富,我希望能更干脆地解决问题,也希望自己能做有温度的科技。
而我,想做开创性的,能改变生活的应用产品
临近博士毕业,我一面完成论文,一面紧锣密鼓地找工作。
我在一个项目中,与中国空间技术研究院有过相关工作交集,感受到很严谨的科研氛围,这让我意识到,航天领域的技术追求稳定。后来,我又接触了自动驾驶技术,大家都在很细分的领域冲击更高的性能。而我,更想做开创性的、能改变生活的应用产品。
我的博士毕业论文聚焦于通过数据感知技术,实现机器人在各类场景中的定位稳定性,即在一个一个场景里面不丢失机器人的位置。
就在我和同学进行市场调研,想着能不能把机器人作为养老的一种手段时,熊蓉老师找到了我,问我想不想一起做大事业——做人形机器人。熊蓉老师是一位很优秀的女科学家,我们浙大机器人实验室有目共睹的几个关键项目,熊蓉老师都在主抓。
2023年8月,我跟随熊蓉团队来到宁波甬水桥科创中心,成为中心骨干之一。同年12月,浙江人形机器人创新中心有限公司正式成立。
我们的第一款产品“领航者1号”,更像是一个“概念验证”的起点。研发真正的考验往往在走出实验室之后,所以,就有了后来的“领航者2号”。
第一次带着我们“做”的机器人去亮相
它是一个全尺寸人形机器人,身高1米65,体重60kg,像你身边的一位朋友。它每条手臂重6.5公斤,设计上兼顾了拟人性和功能性,3公斤的力能精准完成打螺丝等精细操作,5公斤的力则可应对基础搬运任务;如果要追求10公斤负载,手臂就会变得臃肿,失去拟人的形态。“领航者2号”的运控能力和非全尺寸机器人一样棒。
2024年8月,世界机器人大会开幕。我们团队带着“领航者2号”去参展,这也是我们第一次带着我们“做”的机器人去亮相。
一到展会现场,立即遇到一个棘手的问题,展会地面比较滑,“领航者2号”在上面走不稳。我们琢磨各种办法解决。机器人脚底是块橡胶,一开始想把它打磨一下增加摩擦力,结果没用;后来又想着倒点可乐——可乐里的糖干了之后地面会黏糊糊的,说不定能增加摩擦,试了好几次,还是不行。后来临时买了块地毯铺在行走的区域,减少了些展示时间。即便这样,来参观博览会的观众对它还是特别热情,都愿意过来碰一碰、看一看,和我们探讨一下技术。后面,我们快速解决了这类问题,“领航者2号”已经能自如地在光滑的瓷砖地,不平坦的草地等复杂路面上行走。
也有很多客户会直接找到我,比如,三峡博物馆想用一台人形机器人去做导览;还有一款生产跑鞋的厂家,希望能用人形机器人来做不同类型跑鞋的用户体验。
机器人突然毫无征兆地掉电瘫软,我们像医生一样给它“全身体检”
在没有做这个行业之前,看一些机器人主题的电影,我也会热血澎湃。等真的开始做机器人,我很少关注这些现实之外的机器人了。我要做“由内而外最像人的人形机器人”。
人形机器人,分为“大脑”“小脑”“本体”三个部分。我的研发工作更侧重于大脑的研发,就是让机器人能接收指令、理解需求。在研发过程中,会遇到各类不可预测的问题。
一次,我们做的机器人突然毫无征兆地掉电瘫软,我们真的像医生一样,给它“全身体检”,几天几夜在实验室解剖,拆零件,一点点拆解分析找问题,逐一排查,最后发现是一根线束的触点设计不合理,走路时的震动导致触点时通时断。
这让我想到马斯克,他的传记写到一个场景,当特斯拉Model3产能爬坡时,他会直接跑到工厂去,甚至直接睡在工厂,和工人一起打磨整条流水线。想到这里,我觉得自己做得还不够,有些细节还应该继续深入下去。在实验室里,一个技术10次能成功3次或5次就算有突破;但做产品,必须追求极致的稳定。
当前,人形机器人已经进入了一个特别被关注的阶段,相比于市场的躁动,我们团队则在沉下心来打磨技术,琢磨怎么把人形机器人真正落地到工业场景中,或者找到一个非常细分的赛道。最近,我又进入焦灼的实验阶段,因为我们接到了上百台的量产订单,客户提出明确的精细工作要求。
让人形机器人去跳舞,或者去体育赛事前暖场,会不会大材小用?
2025年,被业界认为是人形机器人的量产元年。这年除夕夜,人形机器人登上春晚舞台。有人和我讨论,让人形机器人去跳舞,或者去体育赛事前暖场、出席一些活动的开幕式,会不会大材小用?
我觉得这样挺好,人形机器人频繁亮相,让人们对它先有好奇心,才有助于了解。因为,一个新事物不可能在大众还很新奇的状态下,就已经走入千家万户,它需要这样一个过程。
有时,我回家见亲戚,五六十岁的长辈问得比较实际,他们问我机器人能不能养老,如果买一台人形机器人做家务、烧饭,要多少钱?家里要不要装充电桩?普通人家是不是用得起?需不需要自己动手组装?
我希望,未来,一个家庭会像现在拥有一台私家车一样,拥有一台属于自己家庭的人形机器人。如果想选一个机器人,就像现在想买车一样,先去机器人“4S”店里体验。
到那个时刻,真正让人惊艳的,是大模型给机器人带来的脑力革命。以前的机器人是执行命令的工具,未来的人形机器人,它能主动理解。比如,用户说“帮我拿杯水”,它不仅要知道水在哪,还要考虑怎么避开障碍物,怎么握杯子才不会洒,甚至能根据用户的语气判断用户是不是很口渴。
我们的团队,每一个人都是千挑万选、为了共同目标才聚到一起
我们浙江人形机器人创新中心现在有200多个工程师,大多是95后,核心团队60%以上都是浙大校友。团队非常稳定,几乎没人离职。
能聚起这样一支队伍,源于我们创新的调性一致。面试时,我们一般前半段聊专业问题,考察技术能力;后半段聊性格,还有做事的细致程度。有一个问题,我几乎会问每个人,就是对自己的职业规划。我更倾向于录用志同道合的人,就是对人形机器人有足够的热情,愿意长期在这个领域深耕,真正想为这个行业贡献力量的人。
来面试的大多是男生。其中,有一个男生,不是科班出身,不断通过自学,才在交互设计行业得到认可。他之前在一家大厂做交互设计,得到过行业的表彰,只是一直没能落地实现,因为高层不想在用户体验上再投入资源,觉得目前已经很好了。他为没法真正做出自己想做的东西而遗憾,发现我们在设计人形机器人,就特别期待加入。
我面试他时,越聊越投缘,当场就一拍即合。
我们这个团队,每一个人都是这样千挑万选、因为共同的目标才聚到一起的。
有一次,我们聊起看的一个视频,大概是说一个孩子,因为自己的机器人被摔坏了,伤心到嚎啕大哭,要郑重地和他的机器人告别。虽然是孩子稚嫩的爱,但还是让人心里一顿,思考机器人这个产品在人心里的分量。它是工具,也会成为“同盟”。我们这个团队,可以说是第一代做人形机器人的人,我们在思考什么,我们做的人形机器人就是什么样子。
对我而言,做人形机器人更像是一场关于理解的探索——理解机械的规律,理解技术的边界,更理解人类对美好生活的向往。
我从一个只专注写代码的一线工程师,到如今成为带领团队的管理者之一,我也有了不少变化,白头发冒了出来,体检前后也会忍不住紧张。但好在,只要有时间静下心来学习行业前沿论文,那种心无旁骛的“心流”时刻会提醒我,对技术的热爱从未改变。