
编者按:脑机接口、人工智能、高端装备、新材料与绿色能源、生物医药……杭州如何因地制宜发展新质生产力,创新性科技企业最有“发言权”。本栏目通过报道一组在发展中实现技术突破和成长跨越的企业创新密码,展露杭州的“新质”成色。稿件素材来自杭州市科技局与本报组织编写的《向“新”而行——新质生产力的杭州实践观察》一书。
商报记者 黄诗睿
随着生成式AI技术的不断突破,人工智能迎来了以通用大模型为基础支撑的新阶段,并从局部探索加速走向千行百业,成为推动新质生产力发展的重要引擎。
在杭州,一大批人工智能企业在各自的应用领域,利用人工智能技术推动行业变革、提高生产效率。例如,宇树科技用足式机器人、人形机器人等作为载体,承接通用人工智能;凌迪科技以生成式人工智能为服装产业提供从设计到生产全流程的3D数字化解决方案;一知智能基于多模态人机交互推出语音机器人和数字人等产品……
宇树科技:探索机器人的创新边界
今年5月,杭州宇树科技有限公司(简称“宇树科技”)发布了新款人形机器人Unitree G1(简称“G1”),售价9.9万元起。据了解,G1身高约127厘米,体重约35公斤,小跑速度可大于2m/s。在灵活性方面,G1有23~43个关节电机,可进行高难度动作,如“鲤鱼打挺”、自主折叠、舞棍等。
“在人形机器人市场,我们目前是全球出货最多的公司。”宇树科技市场负责人王其鑫介绍,去年下半年,公司推出的第一款通用人形机器人Unitree H1(简称“H1”)就已实现小批量量产和发货,今年一季度国内外预定量增势明显。“虽然G1与H1在体型、性能上有较大差异,但我们将H1研发生产过程中的各类软硬件攻关经验应用到了G1的开发中。”
在宇树科技创始人王兴兴看来,人形机器人是新质生产力的重要体现形式之一。“新质生产力要求以新技术提升生产力。人形机器人的存在可以解决很多问题,把普通老百姓从复杂的劳动生产或危险的劳动环境中解放出来。随着人工智能技术的突破,人形机器人的实用性有望大幅增强,改变很多传统行业乃至整个社会结构,就像现在大家关注的GPT大模型一样。”
凌迪科技Style3D:为数字时尚产业打造“发动机”
在AI大模型的赋能下,人形机器人在环境理解、智能交互、行动控制等方面正在显著突破,加速其通用化和智能化进程。这样以AI驱动的转变同样发生在服装行业——浙江凌迪数字科技有限公司(简称“凌迪科技Style3D”)聚焦服装科技领域,从最制约服装行业效率的研发设计环节切入,利用“AI+3D”仿真技术打造的数字样衣,推动服装商品全生命周期、全链条各环节的一体化紧密协同。
凌迪科技Style3D首席运营官陈鑫平表示,公司以“AI+3D”为底层技术打造的工业仿真软件,能够打通从设计、打样到上架的全流程环节,让“数字样衣”和“数字模特”率先亮相市场,助力服装企业提高经营效率。“大部分企业通过使用我们的软件,能获得30%以上的研发效率提升。”
“AI和3D可以算得上是一组强相关的概念,凌迪科技Style3D发力的数字化本质上是链接虚拟世界和真实世界的过程,也是将原材料、生产和成衣等生产要素代码化的过程。”据陈鑫平介绍,服装上新是一个“人、货、场”融合的过程,公司的AI技术可以很好地解决“人、货、场”的匹配问题,从服装打样的基础文件开始就采用高仿真技术渲染出图,有效减少了实物打样,提高了上新效率。
一知智能:让AI语音更接近真人能力
如果说AI技术是一个“大脑”,那么找到载体让“大脑”释放效能便是技术转化的第一步。对于杭州一知智能科技有限公司(简称“一知智能”)来说,这个载体便是电话场景下的人机对话。事实上,不仅仅局限于电话,一知智能的人机交互技术已搭载于短信、企业微信、直播平台等多个载体。
“人机语音交互的难点在于如何让机器人更接近真人。如果用户一听就能感觉到是机器人打的电话,那么通常情况下会立马挂断。”一知智能CEO陈哲乾表示,要想基于电话场景帮助企业提高人机交互效率,需要解决多种问题,比如语音的精准识别、语义的准确理解、发音的拟人化等。
为了解决这些问题,一知智能持续研发语音、文本、图像等多模态内容理解和内容生成算法,在ASR(语音识别)、NLP(自然语言处理)、TTS(语音合成)等核心AI技术上取得了较大突破。“目前,公司80%的客户来自泛消费行业,已服务1000多家品牌,覆盖美妆、宠物、母婴、食品、鞋服等多个零售行业。”陈哲乾表示,一知智能的人机语音交互方案能够有效解决品牌精准触达与服务会员的效率问题,也为品牌带来了更多收益。