Meta 发布了 audio2photoreal 技术框架,可以基于对话语音合成逼真的虚拟角色动作

小夏 科技 更新 2024-01-31

Meta 的新人工智能研究 Audio2Photoreal 技术框架能够根据对话语音生成逼真的面部、身体和手势。 研究人员开发了Audio2PhotoReal框架来创建真实世界的化身,这些化身可以根据人们说话的内容和方式做出自然的手势和表情。

audio2photoreal研究的主要贡献是将矢量量化和扩散算法相结合,以生成动态和更具表现力的动作。 矢量量化是一种将大量数据压缩成少量代表性数据的技术,当用于audio2photoreal时,它可以有效地从大量手势中选择代表性样本。

扩散技术的作用是提供高频细节,提高手势质量。 扩散技术常用于图像的生成和改进,特别是在需要还原细节或增加视觉真实感的场景中,当应用于虚拟角色手势生成的过程时,扩散技术可以使手势更加自然流畅,使其更接近真实的人体动作。

在这项研究中,研究人员还创建了一个多视角的双人对话数据集,其中包括从不同角度拍摄的对话场景,使audio2photoreal能够更好地创建化身。

此外,与传统网格模型相比,audio2photoreal生成高度逼真的虚拟角色,并准确捕捉对话手势的细节,如模拟手指指向、手腕旋转或耸肩等,更加自然逼真。 研究团队现时将相关程序**及数据集公之于众,以促进相关研究领域的发展。

相似文章

    Meta 推出触觉反馈软件解决方案 Haptics Studio 和 Haptics SDK

    最近,Meta 宣布了两款软件解决方案,即 Haptics Studio 和 Haptics SDK,允许开发人员将高级触觉反馈元素添加到他们的 Quest 产品线中。Haptics Studio 和 SDK 利用 Unity 和 Unreal RTD 引擎创建 AR VR MR 内容 Meta 的...

    Everest Group 发布《2023 低代码报告》,7 家厂商被评为领导者

    近日,国际知名咨询研究机构珠峰集团发布 珠峰集团低代码应用开发平台峰值矩阵评估 调查报告。通过技术创新 产品影响力 市场布局等因素对家厂商进行了评价。其中,Appian 西门子低代码 Microsoft PowerApps Oracleapex Outsystems Salesforce和Servi...

    JEDEC 发布了 CAMM2 规范,取代 SO DIMM 成为下一代笔记本电脑内存标准

    月 日,JEDEC 发布了 JESD 压缩附加存储模块 CAMM 通用规范,这是取代现有 SO DIMM 规范的下一代笔记本电脑内存规范。Jedec CAMM项目主席Tom Schnell表示 CAMM 标准旨在支持和驱动下一代笔记本电脑内存,它为设计人员提供了广泛的模块化选项。随着技术的发展,内存...

    《小丑2》发布剧照 Lady Gaga深情凝视菲尼克斯

    电影网讯 小丑 续集 小丑 公布新剧照。在剧照中,阿卡姆疯人院的精神病医生哈莉 奎因 Harley Quinn 后来成为哈雷 哈雷 Harley Harley 正深情地凝视着小丑。剧照中,饰演哈莉 奎因的Lady Gaga,妆容发型纯正,神态自然,吸睛。这部电影是一部 电影。按照制片方的计划,小丑 ...

    iQOO Neo9系列官宣发布,起售价2299元,Redmi K70的焊门再次被带走

    优质作者名单 标准版起步价与上一代相比保持不变,配置也相同,后两种配置降低了元。Pro版与上一代的起步配置相比发生了变化,唯一没有变化的是 配置,相比上一代首创销售价格上涨了元。性能端的升级点主要是 骁龙代 LPDDRX UFS Q游戏芯片 同时将VC均热板升级为 双层毛细管动力泵 设计,同时增加面...