“数字人”热闹一时,但是,数字人技术的未来究竟是什么,仍然需要一个答案。
“我们将三维数字人的生成成本降到了原来的千万分之一,我们希望每个自然人都可以以极低的成本拥有自己的‘数字人’。”广州紫为云科技有限公司创始人、CEO顾友良这样认为。
从创业开始,顾友良就一直在探索三维数字人技术的落地路径。在这个过程中,他和他的团队经历了什么,又是如何定义未来的“数字人”?这一期的《路演记》,我们就要走进紫为云,走进一个“三维数字人”的世界。
“我们的核心技术是只需要一张形象照,10秒钟左右就可以将二维的照片,生成一个超高清高面数三维数字人,而且相似度可以达到90%至95%左右。”顾友良介绍说。
在他看来,以往影视级别的三维动画制作动辄就是百万元级别的制作成本,虽然效果很好,但是按照这样高昂的费用水平,会让数字人技术难以落地,难以被普通人所接受。所以,紫为云的思路是,既要将品质提升,又要把成本控制得非常低廉。
“我创业时的目标是在真人和虚拟人之间实现真实性很强的虚实交互能力。那时候就想,能否有这样一种技术,仅仅依靠二维的人脸识别技术,就通过生成和推理技术,实现三维化。”
2024年1月,紫为云团队推出了三维数字人的第一代产品。
“我们还曾经把几代产品都放在一起作对比,差距很明显,但是我们看到了自己技术的进步,这一点还是让我们团队感到非常欣慰的。”
随着技术的优化,紫为云实现了算力上的轻量化,仅仅需要普通的显卡,就可以完成数字人的制作。而生成成本的降低,也让紫为云有底气提出,所有的会员都可以免费生成数字人。而对于一个普通用户而言,仅仅需要一部手机,就可以制作自己的“数字人”。
拥有数字人后可以用来做什么?
对此,顾友良认为,在人人都可以拥有自己的数字人的时候,会产生非常多的应用场景。
“譬如说,一开始用户可以通过手机投屏,构建一个虚拟的空间,可以是沙漠,也可以是海边,然后和亲友们的数字人在这样一个空间里进行互动。如果将虚拟世界和传感设备相结合,更是可以模拟出真实世界的体验,达到一种虚实融合的效果。再加上VR、MR眼镜,那就提供了一种沉浸式的第一视角的效果。”
顾友良说,随着人工智能生成技术的发展,自己的想象可以转成文字,生成图片,再生成一个三维的数字世界,融合了人、物、场,形成空间智能的概念。那么,数字人就可以进入到这样一种梦幻般的世界里。
“我们现在已经实现了的一种功能,是让数字人唱歌、跳舞、做各种动作,只要30秒钟左右就可以生成MV。将来,音乐爱好者们都可以通过数字人技术去创作自己的MV,甚至在虚拟世界中开自己的演唱会。”
更为重要的是,虚拟世界中的各种互动场景,会沉淀大量的数据。顾友良认为,这样的数据积累甚至可以帮助当下人形机器人的训练。
“我们可以通过创建虚拟的空间,生成机器人的数字人,让它在虚拟世界中与各种人进行互动,从而学习动作、交流方式、语言等,然后把获取的数据再映射回现实场景的机器人,可以大大提高训练效率。”
对于未来数字人技术的商业化落地,顾友良认为主要是从技术、产品、服务三方面开展。
“我们可以将自己核心的技术,开放给客户,帮助他们解决自己的场景需求,也可以将算法与硬件设备结合,去提供譬如技能培训这样的服务,也可以将数字人产品转化为服务,譬如内容创作、数字人智能体等。所以,数字人技术会有很多的可能性。”
文、海报、视频|记者 李钢