SIGGRAPH 2023 国际峰会表彰!新昌源自主研发的3D数字人驱效果突出

小夏 科技 更新 2024-01-31

如果你关注算法生成的头像,你可能会担心这些问题:创建我自己的头像需要什么?

我们给出的答案是:用手机拍一个**就够了!重建手机拍摄的高保真3D虚拟数字图像一直是一项具有挑战性的任务,主要是因为难以准确控制表情,尤其是一些夸张的表情和一些微表情。 这是因为现有的算法往往依赖于有限的线性表情系数来参数化表情,而这种线性表情很难对丰富的面部表情细节进行建模。

事实上,来自清华大学和新昌源科技的研究人员已经提出了一种新的方法,潜伏**atar,它利用深度网络和神经辐射场技术学习到的潜在特征,有针对性地解决了上述两个难点。 研究结果发表在图形学顶级会议 SIGGRAPH 2023 上。 便捷的捕捉设备,高保真化身,栩栩如生的表情控制,一切皆可潜伏**atar完成!

接下来,让我们来看看它是如何做到的。

*家。 表达可控的神经辐射场。

潜在**atar的核心思想是摒弃现有的基于线性表达式库的表达式建模方法,转而利用深度网络的隐藏空间来实现表达式的建模。 为此,潜在**atar首先构造一个表情隐空间,以及一个将面部区域图像映射到面部隐空间的编码器。 然后,从表达式潜在变量生成由三平面神经辐射场表示的神经辐射场,如下图所示。 三平面和神经辐射场的引入,使得网络学习到的隐蔽空间具有三维感知能力,通过简单的重构损失,隐蔽空间可以捕捉到目标任务的高频面部纹理细节,从而很好地处理夸张的表情和微表情。 与之前的方案相比,由于表情潜在变量是端到端地从输入单目中学习的,因此潜伏**atar摆脱了人脸模板的跟踪和表情问题,从而实现了更丰富、更准确的表情建模。

交叉标识驱动。

由于上述构造的人头数字头像是由学习到的表情隐变量控制的,因此当使用另一个驾驶员驾驶时,需要先将他的人脸图像映射到该数字头像的相应表情隐变量上。

为此,Latent**ATAR引入了一个由共享编码器和两个独立解码器组成的Y形网络架构。 共享编码器接收一个头像和一个新的驾驶员面部图像作为输入,学习共享表情的潜在变量。 映射多层感知器在两个潜在变量空间之间架起了一座桥梁。

通过这种方式,潜在**atar 实现了另一个人来驱动构建的数字化身。 所以我们在文章开头看到了结果。 它不仅可以实现高保真的图像渲染,还可以保证驾驶员的表情能够准确传递,一些夸张的表情、微妙的表情和情绪也能准确传达。

实验结果。 作者还将 Latent**ATAR 与之前其他单眼头部数字头像重建算法进行了比较,包括 NerFace、IM**ATAR、DeepVideoPortraits (DVP) 和旨在消除三平面表达改善的基线 Coeff+Tri-Plane。 从定性结果来看,潜伏**atar合成的化身具有最高的真实感,表情一致性和夸张表情的建模能力最好,也具有更强的鲁棒性。 此外,定量结果也证明了Latent**ATAR在数值评估中能够取得最佳效果。

最近的单目**重建方法都使用3DMM人脸模板作为头像表情控制的驱动信号,在跟踪和拟合3DMM人脸模板时通常会引入误差,导致表情不准确。 因此,在后期制作中对人头的数字化身进行动画制作时,难免会出现表情模糊或不一致的情况。 潜在**ATAR也从**中重建头部数字头像,但不需要3DMM,而是直接从训练数据中学习隐式表达式潜在变量。 因此,合成的虚拟图像在各种夸张的表情下都能栩栩如生,大大改善了目前数字人驱动的僵硬、不真实、不生动的表情问题。

新昌源科技有限公司总部位于杭州,与北京清华大学产学研基地、深圳清华大学虚拟研究院虚拟数字人中心三地联动,专注于数字人相关技术研究和人才培养。 未来将覆盖更多场景和需求,携手众多行业伙伴,推动“AIGC+数字人”多场景落地,逐步普及消费级数字人,为各行各业提供强大而全面的技术支持。

引用。 yuelang xu, hongwen zhang, lizhen wang, xiaochen zhao, huang han, qi guojun, and yebin liu. latent**atar: learning latent expression code for expressive neural head **atar. in acm siggraph 2023 conference proceedings, 2023

项目主页:柳叶斌com/h**atar

相似文章

    2024年,不会有新的顶流

    按流量选择,按流量放弃。原标题 年,全网无顶流 定焦 定焦一 作者 金宇凡 编辑 魏佳。年已经过去,你还记得哪些网红风靡网络的新网红?是业余网红的代表 靠着一首 挖 挖 挖 这首歌,一位吸引了百万粉丝的美女幼儿园老师,黄老师 今年夏天,再次走红的 中老年拔尖 人才大显身手,笑容飘入城中 月爆炸后不到...

    中北大学最新研究成果发表于国际顶级期刊《腐蚀科学》

    近日,中北大学山西省金属凝固控制与精密成形重点实验室 太原科技大学白培康教授团队在国际顶级期刊 Corrosion Science fabricated by laser powder bed fusion 上发表了最新研究成果 Clarify the role of NB alloy on pas...

    Donatella国际顶级护肤品牌

    对于那些追求美丽的人来说,Donatella是一个不容错过的护肤品牌。这个世界级的护肤品牌,致力于将健康肌肤的美丽融入到产品的每一个细节中,从瑞士进口牛奶,以专业的角度和不断探索的精神,为消费者提供全方位的护肤解决方案。Donatella 盒子包含各种流行产品,包括面霜 精华乳液等。每一款产品都经过...

    东莞某医院的研究成果被国际顶级期刊《自然》分刊收录。

    在共建校园三周年之际,广东医科大学附属东莞市第一医院第二临床医学院 东莞市东南中心医院 教授 广东医科大学东莞呼吸医学研究所所长赖天文的重要研究成果在国际顶级学术期刊上发表。赖天文教授 右一 与研究小组成员合影。赖天文教授团队在Nature Communications上发表了一篇题为 Epithe...

    2023“鼎谷杯”全国设计大赛落下帷幕

    月日 日,以 用设计画未来 为主题的 鼎鼓杯 全国设计大赛暨总部考察团在广东中山成功举办。多位名人导师 行业资深人士 专业讲师及各大设计精英齐聚本次设计峰会,汇聚原创设计力量,探索整个案例设计的趋势与发展,为更美的家居设计增添动力和可能性。随着消费升级和大众个性和审美的逐渐觉醒,设计的力量成为链接生...