Sora横空出世，将会颠覆哪些领域？

清澈灵动的眼眸、活泼可爱的萌宠、神秘莫测的海底世界、熙熙攘攘的夏日街区、充满科技感的魔幻都市……这些场景逼真、色彩丰富、氛围浓厚的短视频，全部可以由AI系统制作生成。

2023年，ChapGPT打开AI新世界。AI聊天、AI绘画、AI音乐等一系列AIGC（利用人工智能技术生成内容）相继问世。

2024年初，Sora横空出世，又会带来哪些颠覆性的影响？

一只猫叫醒了正在睡觉的主人，要求吃早饭。主人试图忽略猫，但猫尝试了新的策略。图/OpenAI官网

Sora，比想象中来得更快

2月16日（北京时间），OpenAI公司发布最新“文生视频”大模型Sora，并附带发布了多条由Sora生成的视频。

Sora“逆天”在哪儿？它不仅能够根据文字指令创造出既逼真又充满想象力的场景，而且能生成长达1分钟的超长视频，远超出之前最多不足20秒的文生视频，并且还是一镜到底那种，电影感超强。

一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。图/OpenAI官网

从发布的视频来看，60秒的视频中，视频主体与背景保持了高度的流畅性与稳定性，在一个视频里实现多角度镜头，分镜切换符合逻辑且流畅。此外，Sora对于光影反射、运动方式、镜头移动等细节处理非常到位。

Sora的颠覆力来自哪里？Sora背后有两项核心技术突破——Spacetime Patch（时空Patch）技术和Diffusion Transformer（DiT，或扩散型 Transformer）架构。

如今，Sora团队毫无疑问已经成为世界上最受关注的技术团队之一。记者查询OpenAI官网发现，Sora团队由Peebles等3人领导，核心成员包括12人，其中有多位华人。值得注意的是，这支团队十分年轻，成立时间尚未超过1年。

Sora爆火，“AI革命”正式来临

发挥想象，几行文字指令，就可以迅速形成一条包含各种细节、复杂角度和富有情感的视频。OpenAI先进的AI技术拓展到了视频领域。

Sora将会产生哪些影响？Sora首先将会对娱乐影视、广告营销、教育学习、新闻社交和科学研究等领域产生影响。例如，Sora可以大大节约电影、广告片的创作成本；Sora可以通过创建复杂的动态模拟，再现难以在实验室条件下实现或观察的过程，将科学实验变得虚拟化和可视化。

纽约大学助理教授谢赛宁直言：“Sora将改写整个视频生成领域。”谢赛宁表示：“Sora或许并不需要人们想象中的那么多GPU来训练，如果真是如此，Sora的后期迭代将会非常快。”

英伟达人工智能研究院首席研究科学家Jim Fan认为，Sora是一个数据驱动的物理引擎，称这是视频生成领域的GPT-3时刻，“回到2020年，GPT-3不是一个很完美的模型，但是它有力证明了上下文学习的重要性，所以不要纠结于GPT-3的缺陷，多想想后面的GPT-4”。

360创始人周鸿祎也提到自己对Sora的看法。周鸿祎表示：“这次OpenAI利用它的大语言模型优势，让Sora实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出2D的范围模拟真实的物理世界。”他认为，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力，“今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败TikTok，更可能成为TikTok的创作工具”。

周鸿祎也直言：“一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube和TikTok上的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，这就离AGI真的不远了，不是10年、20年的问题，可能一两年很快就可以实现。”

当然，对于刚刚面世的Sora而言也存在不足。OpenAI指出它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。该模型还可能混淆提示的空间细节，例如混淆左右，并且可能难以精确描述随着时间推移发生的事件，例如遵循特定的相机轨迹。

现实与虚拟的界线变得模糊可能带来系列风险

新模型Sora一方面让内容制作行业感受到了震撼，另一方面市场也在关注其存在的两大隐患。

首先，有广告投放公司的高管表示，这对于广告行业而言是一个巨大的转折点。过去制作视频广告的成本非常高，通常只有大品牌才能承担，而如今，Sora模型为中小企业提供了制作视频广告的新机遇。然而，关于内容版权，仍有一些疑问。目前OpenAI并没有透露训练模型涉及的视频数量以及其具体来源，只是表示所有训练材料均来自公开渠道或者是已授权的内容。

另一大担忧则在于深度伪造。今年是全球选举大年，据统计将影响到包括40多个国家的40多亿人。AI深度伪造技术可能会产生大量的虚假音视频以及图像来影响选举。

这通伪造的电话录音以拜登的口头禅“真是一派胡言”开头，建议选民不要给特朗普投票，而是把选票留到11月大选时投给民主党。图/央视新闻

脸书母公司Meta的全球事务总裁直言，无法“一刀切”直接禁止AI生成的内容在社交媒体传播，因为“打地鼠式”的做法总是会有漏洞存在，现在采取的做法主要是披露，任何由AI生成的内容都需要打上水印，告知看到的用户。不过如何识别不同平台生成的AI内容，还是一大难点。

内容真实性、版权、隐私、数据、安全等问题纷至沓来。社会需要一套完善的政策、法律和伦理规范来应对，确保技术发展不脱轨，保护每个人的利益。

此外，AI对就业的影响可能会进一步加剧。据《青年参考》消息，国际货币基金组织（IMF）表示，人工智能将影响全球近40%的工作岗位，应制定一套政策，利用人工智能的潜力造福人类。