阿里发布了AI模型EMO，让网友们不再“emo”。

no.571

作者：Tech Boomerang。

校对：程程编辑：芝芝。

人工智能领域真的越来越热闹了，让人不知所措。最近，阿里巴巴发布了一款名为emo的生成式AI模型，听起来有点奇怪，但确实是可以玩的东西。您只需要一个**和一段音频即可生成说话和唱歌类型**。操作相对简单，时间长短没有限制。根据情况，emo生成**，动态和表情都非常逼真，让很多用户玩得很开心。

2月底，阿里巴巴发布了其最新的AI成果，即eMote Portrait Alive（EMO）框架。这是阿里巴巴智能计算研究院开发的创新框架。与其他 AI 框架不同，eMO 的主要功能是通过音频生成富有表现力的肖像。

最大的区别在于它的合成方法。目前，业界主流的AI合成技术都是由3D模型或面部标记驱动的。

emo的合成更为复杂。从音频合成到音频合成，使用了许多复杂的技术。例如，音频驱动的生成技术，直接从给定的图像和音频剪辑组成角色的头部。

其中比较重要的技术是稳定性控制机构。很多AI合成器一眼就能看出来，因为面部表情很僵硬，与语言动作完全不符。 emo引入了速度控制器和面部区域控制器，可以控制面部微表情，使其更具表现力。 **由网友制作**，角色在演唱时还可以根据歌曲的情绪变化，在面部表情上有细腻的变化，非常有表现力。

我通过emo浏览了其他网友制作的AI**，非常好玩。有的网友复活了自己的偶像，有的网友复活了教科书里的历史人物，有很多搞笑**，大家都玩得很开心。网友们开玩笑说，有了emo，就不会再有emo了。

但是，emo页面全是英文**，使用网页翻译后，语言很奇怪。如果你的英语更好，你可以尝试玩它。网络入口可以通过单击此处或复制来打开

当然，这个emo只是一个文人拟像**，但它做得更加流畅和逼真，从逻辑上讲，它与Sora还是有很大区别的。

在过去的几年里，阿里在AI上投入了大量的资金和精力。只要看看emo网页上项目背后的团队介绍，就可以看出阿里在emo上烧了不少钱。

早在去年，阿里巴巴CEO吴永明就提出了“AI驱动，公有云优先”的战略，目标是为各行各业提供高效稳定的AI基础设施。阿里去年推出了多款AI产品，如语言模型通易千问、C端客户AI导购、绘画模型通易万象、AI写真工具妙雅相机等。

目前，各大互联网公司推出的AI产品实在是铺天盖地，AI在互联网上已经无处不在。

此外，字节旗下的建英等工具也推出了许多AI功能。

然而，文盛AI工具的广泛使用也引发了很多担忧。主要是适时的问题，肖像权和欺诈问题。

用户只需要上传**和音频即可生成流畅的**，这很容易涉及人像权利问题。这个问题并不少见，甚至有很多先例。此外，许多网友担心欺诈。随着AI生成技术的提高，AI识别技术是否也应该得到改进？

最后，我想提醒大家，emo目前还不是开源的，所以玩就好了，防止被骗。