Meta 的新人工智能研究 Audio2Photoreal 技术框架能够根据对话语音生成逼真的面部、身体和手势。 研究人员开发了Audio2PhotoReal框架来创建真实世界的化身,这些化身可以根据人们说话的内容和方式做出自然的手势和表情。
audio2photoreal研究的主要贡献是将矢量量化和扩散算法相结合,以生成动态和更具表现力的动作。 矢量量化是一种将大量数据压缩成少量代表性数据的技术,当用于audio2photoreal时,它可以有效地从大量手势中选择代表性样本。
扩散技术的作用是提供高频细节,提高手势质量。 扩散技术常用于图像的生成和改进,特别是在需要还原细节或增加视觉真实感的场景中,当应用于虚拟角色手势生成的过程时,扩散技术可以使手势更加自然流畅,使其更接近真实的人体动作。
在这项研究中,研究人员还创建了一个多视角的双人对话数据集,其中包括从不同角度拍摄的对话场景,使audio2photoreal能够更好地创建化身。
此外,与传统网格模型相比,audio2photoreal生成高度逼真的虚拟角色,并准确捕捉对话手势的细节,如模拟手指指向、手腕旋转或耸肩等,更加自然逼真。 研究团队现时将相关程序**及数据集公之于众,以促进相关研究领域的发展。
相似文章
最近,Meta 宣布了两款软件解决方案,即 Haptics Studio 和 Haptics SDK,允许开发人员将高级触觉反馈元素添加到他们的 Quest 产品线中。Haptics Studio 和 SDK 利用 Unity 和 Unreal RTD 引擎创建 AR VR MR 内容 Meta 的...
近日,国际知名咨询研究机构珠峰集团发布 珠峰集团低代码应用开发平台峰值矩阵评估 调查报告。通过技术创新 产品影响力 市场布局等因素对家厂商进行了评价。其中,Appian 西门子低代码 Microsoft PowerApps Oracleapex Outsystems Salesforce和Servi...
月 日,JEDEC 发布了 JESD 压缩附加存储模块 CAMM 通用规范,这是取代现有 SO DIMM 规范的下一代笔记本电脑内存规范。Jedec CAMM项目主席Tom Schnell表示 CAMM 标准旨在支持和驱动下一代笔记本电脑内存,它为设计人员提供了广泛的模块化选项。随着技术的发展,内存...
电影网讯 小丑 续集 小丑 公布新剧照。在剧照中,阿卡姆疯人院的精神病医生哈莉 奎因 Harley Quinn 后来成为哈雷 哈雷 Harley Harley 正深情地凝视着小丑。剧照中,饰演哈莉 奎因的Lady Gaga,妆容发型纯正,神态自然,吸睛。这部电影是一部 电影。按照制片方的计划,小丑 ...
优质作者名单 标准版起步价与上一代相比保持不变,配置也相同,后两种配置降低了元。Pro版与上一代的起步配置相比发生了变化,唯一没有变化的是 配置,相比上一代首创销售价格上涨了元。性能端的升级点主要是 骁龙代 LPDDRX UFS Q游戏芯片 同时将VC均热板升级为 双层毛细管动力泵 设计,同时增加面...