让我们谈谈大型模型领域最近的一些轰动性发展。 你还记得年初我做了什么吗? 我列出了大型模型未来的 10 大趋势,在年底之前,我们看到了其中的几个成真。 无论是 Gemini、NVIDIA 的 Chat with RTX,还是 OpenAI 最近发布的 Sora,每一个版本都令人眼前一亮,感觉未来已经到来。
朋友们都很好奇,我怎么看索拉。 简而言之,我坚信人工智能的终极形式AGI(通用人工智能)指日可待,而且在几年内。
首先必须要说的是,技术竞争的核心始终是人才的聚集和深耕。 看看 Sora,它的表现远远超过其他类似产品也就不足为奇了。 像OpenAI这样拥有核心技术和强大团队的公司,自然不容小觑。 有一种观点认为,有了人工智能技术,小公司只需要做零星的业务。 但最新的事态发展再次证明,这种观点是幼稚的。
其次,尽管人工智能技术发展迅速,但这并不意味着它会一下子颠覆所有行业。 相反,它更有可能激发人们的创造力。 就《空拉》而言,虽然有人担心它会影响传统影视制作,但我有不同的看法。 一部优秀的**作品不仅在于画面的积累,还在于创作题材、精心编排的剧本和对话。 Sora 可能确实是广告、电影预告片和短片等领域的游戏规则改变者,但它更有可能成为这些领域创意的强大工具。
让我们看看中国大型模型的发展。 虽然从表面上看,它似乎接近GPT-35 个级别,但实际上使用 GPT-40 还有很长的路要走。相信OpenAI手里还有更多尚未揭晓的牌,无论是GPT-5还是其他更先进的技术。 他们知道如何控制节奏并保持领先。
大型语言模型最强大的一点是,它们不仅仅是简单的信息填充机器,而是可以深刻理解世界的知识。 SORA的技术突破不仅在于它可以生成**,还在于它可以模拟自然和物理定律,从而真正理解和再现世界。 这一技术进步使SORA不仅可以在二维平面上操纵图像,而且能够在三维世界中创建符合物理定律的逼真场景,这是大规模模型技术的一大飞跃。
以强大的模型为基础,结合对人类语言的深刻理解和对世界模型的洞察,我们正处于创建跨领域超级工具的门槛上。 想象一下,大型模型如何在生物医学、蛋白质工程、基因研究,甚至物理、化学、数学和其他学科中大放异彩,从而带来前所未有的进步和发现。
SORA的案例,尤其是其模拟物理世界的能力,预示着对机器人和自动驾驶等领域的深远影响。 传统的自动驾驶技术专注于感知技术,而忽略了更关键的认知层面——基于对世界的深刻理解做出判断的能力。 正是这种对世界的理解,将使自动驾驶的未来不仅能够对环境做出机械反应,而且能够像人类驾驶员一样做出复杂的判断和决策。
此外,SORA的成功不仅体现在一流的生产能力上,更重要的是,它标志着大模型真正理解和模拟现实世界的开始,打开了人工智能新成就和突破的大门。
第五点更令人兴奋:为了训练像 Sora 这样的模型,OpenAI 必须让它产生大量数据。 结合扩散技术,这一过程将使AI能够更深入、更全面地了解世界。 一旦人工智能开始这个世界,从所有电影到 YouTube 和 TikTok 上的内容,它对世界的理解将远远超出纯文本学习。 因为一个**中的信息量已经超过了千字,而**中的信息量远远超过了。 这种技术进步意味着,通用人工智能(AGI)的实现可能不再是十年或二十年的话题,而是可能在未来一二十年内成为现实。
我们正处于技术创新的时代,人工智能的每一次进步都在推动我们更接近前所未有的未来。 SORA的案例只是一个开始,未来还有更多的奇迹等待探索和实现。