2024年2月16日,旧金山新创科技巨头Open AI 发布了最新文生视频大模型Sora,并在官网发布由其生成的48个视频样例。虽然目前Sora仍处于测试阶段,仅对部分评估人员、视觉艺术家、设计师和电影制作人开放访问权限。但依旧在全球科技圈、媒体圈、文化圈、教育圈等多领域引起了广泛关注和持续的热议,部分专家学者及业内人士甚至认为Sora的发布是AI领域一次具有“里程碑”意义的重大突破,将对各行各业带来重塑式赋能的发展机遇。网络上已经有很多的文章从不同的视角分析、解读Sora,笔者作为数字文化产业园区的管理者,也尝试抛开过于专业的技术解析,聚焦数字文化产业来谈谈Sora模型将带来哪些可能的影响。
Open AI为这一模型命名为Sora,取自日语中“天空”的涵义。研发团队表示,这个名字寓意着无限创意的可能性。笔者从公开的报道中发现,Open AI创始人Sam Altman(奥特曼)有一定的日本情节,曾在采访中公开表示过日本对其团队是非常重要的国家,并强调他个人非常喜欢日本(PS.或许因为日本动漫的缘故)。故将文生视频的模型以日语单词命名。
Sora之所以能引起如此巨大的轰动,在于其在视频生成领域的时长、运镜、光影、画质等维度实现了革命性的技术突破。该模型具备三大核心优势:
1)60 秒超长时长:行业平均视频生成长度约4 秒,而Sora支持生成最长60 秒的高保真视频,主体与背景均保持较高的连贯性与高清画质。
2)多镜头生成能力:Sora可以根据提示词内容针对单视频生成多镜头情景,从而达到多视角展示内容的效果,同时保持角色和视觉风格的一致性。
3)物理世界模拟能力:Sora初步理解并模拟真实物理世界的运行规律,以官方展示案例为例,画家绘画留下新笔触、吃汉堡留下齿痕等细节符合事实规律。
并且,Sora还具备三个主要的视频生成应用场景:1、通过文字创作视频内容。2、通过图片生成视频内容。3、根据视频向前向后延展视频内容。
不难看出,Sora的面世将对视频制作相关行业产生巨大的影响,作为一种可以不断学习、持续进步的AI技术工具,将极大的降低视频制作的创作成本和技术门槛,给与了不懂建模、特效、运镜、剪辑、渲染的创作者提供了一个视频创作的简易工具。无数天马行空的内容将通过文字的形式由Sora转化成丰富多彩的视频内容,再借助互联网传播媒介展示给全世界。这必然是数字内容的爆炸,视觉内容的井喷,数字创作的狂欢,同时,也必将出现巨大的市场机遇和不可忽视的伴生危机。
那么,数字文化产业的哪些领域将随着Sora的面世出现机遇呢?
一、认知层面。AI培训行业必将兴起。新的技术造就新的时代,新的时代催生新的风口,而在当前的信息时代,看到风口却无法参与,大众将产生巨大的恐慌和极度的焦虑。多样的AI培训课程很好的满足各个认知水平的受众对AI不同层级的认知需求,受众广、商业规模大。
二、创作层面。动漫游戏、短视频、微短剧、数字人直播、数字广告等内容创作领域,在Sora等工具的加持下,更多的个人和创作团队将不再受到计算机语音,图片、音频、视频制作等专业限制,更好的将创意转化成为有数字产品或服务,从而降低生产成本,实现更高的商业变现。
三、服务层面。大量的数字内容创作,伴随着海量的内容审核、确权及交易需求。延申而出的数字资产前置审批市场和后置服务市场同样巨大。NFT数字藏品等现象级市场机遇或将频频出现。
虽然Sora的诞生给与了现实世界巨大的震撼和无数的机遇,但我们仍然需看到Sora视频中还存在诸多的瑕疵,如四条腿、两个脑袋的蚂蚁。Open AI在记忆世界、理解世界和预测世界的进化过程中,仍然需要海量的资金和资源投入。正如英伟达创始人兼CEO黄仁勋所说,每个国家都应建立自己的主权AI,“它记录了你的国家文化、社会智慧、常识、历史——你拥有你自己的数据。”但同时,7万亿美金的投入需求,也将开启新时代下大国博弈新的战场。