no.571
作者:Tech Boomerang。
校对:程程 编辑:芝芝。
人工智能领域真的越来越热闹了,让人不知所措。 最近,阿里巴巴发布了一款名为emo的生成式AI模型,听起来有点奇怪,但确实是可以玩的东西。 您只需要一个**和一段音频即可生成说话和唱歌类型**。 操作相对简单,时间长短没有限制。 根据情况,emo生成**,动态和表情都非常逼真,让很多用户玩得很开心。
2月底,阿里巴巴发布了其最新的AI成果,即eMote Portrait Alive(EMO)框架。 这是阿里巴巴智能计算研究院开发的创新框架。 与其他 AI 框架不同,eMO 的主要功能是通过音频生成富有表现力的肖像。
最大的区别在于它的合成方法。 目前,业界主流的AI合成技术都是由3D模型或面部标记驱动的。
emo的合成更为复杂。 从音频合成到音频合成,使用了许多复杂的技术。 例如,音频驱动的生成技术,直接从给定的图像和音频剪辑组成角色的头部。
其中比较重要的技术是稳定性控制机构。 很多AI合成器一眼就能看出来,因为面部表情很僵硬,与语言动作完全不符。 emo引入了速度控制器和面部区域控制器,可以控制面部微表情,使其更具表现力。 **由网友制作**,角色在演唱时还可以根据歌曲的情绪变化,在面部表情上有细腻的变化,非常有表现力。
我通过emo浏览了其他网友制作的AI**,非常好玩。 有的网友复活了自己的偶像,有的网友复活了教科书里的历史人物,有很多搞笑**,大家都玩得很开心。 网友们开玩笑说,有了emo,就不会再有emo了。
但是,emo页面全是英文**,使用网页翻译后,语言很奇怪。 如果你的英语更好,你可以尝试玩它。 网络入口可以通过单击此处或复制来打开
当然,这个emo只是一个文人拟像**,但它做得更加流畅和逼真,从逻辑上讲,它与Sora还是有很大区别的。
在过去的几年里,阿里在AI上投入了大量的资金和精力。 只要看看emo网页上项目背后的团队介绍,就可以看出阿里在emo上烧了不少钱。
早在去年,阿里巴巴CEO吴永明就提出了“AI驱动,公有云优先”的战略,目标是为各行各业提供高效稳定的AI基础设施。 阿里去年推出了多款AI产品,如语言模型通易千问、C端客户AI导购、绘画模型通易万象、AI写真工具妙雅相机等。
目前,各大互联网公司推出的AI产品实在是铺天盖地,AI在互联网上已经无处不在。
此外,字节旗下的建英等工具也推出了许多AI功能。
然而,文盛AI工具的广泛使用也引发了很多担忧。 主要是适时的问题,肖像权和欺诈问题。
用户只需要上传**和音频即可生成流畅的**,这很容易涉及人像权利问题。 这个问题并不少见,甚至有很多先例。 此外,许多网友担心欺诈。 随着AI生成技术的提高,AI识别技术是否也应该得到改进?
最后,我想提醒大家,emo目前还不是开源的,所以玩就好了,防止被骗。