关键词搜索
顶部横幅广告

视频模型Sora2为何被OpenAI关停?因成本太高少人付费

【金色港湾资讯网为您推荐阅读】

还记得那个让人惊呼“现实不存在了”的冬天吗?

2024年开年之际,Sora的演示视频宛如一枚炸弹,于人们对真实跟虚拟的界限而言,将其炸得粉碎。好莱坞为此而瑟瑟发起抖来,短视频创作者们觉着,在手机里敲上几行字便可生成大片的时代,已然就要来临了。然而仅仅过了两年时间,亲手把Sora停止键按下的,竟然是它自身的创造者。那个曾经被视作通往AGI圣杯的“世界模型”,为何会成为巨头都养不起的吞金兽呢?

每天烧掉一套豪宅的算力刺客

Sora得以维持运转,其真实代价是每日有着高达1500万美元的算力成本,这意味着,只要服务器的灯还亮着,便会有一套比弗利山庄的豪宅在火光之中化为灰烬,在投资人的眼中,它已不再是那个展示肌肉的明星,而是成了一个让财报持续不断流失现金的吞金兽。

大伙新鲜感一旦消逝,发觉除去拿它去做几条获取眼球的朋友圈素材外,差不多寻不到非得付费的缘由。哪怕Sora 2的独立应用曾于短时间之内被下载了好几百万回,然而用户恰似潮水那般,来得迅猛去得更深,这样持续的失血状况,就算家大业大,同样难以承担。这样的呈现,除非拿出切实能令业务重回快速增长轨道得解决方法,不然最终结局就是被市场抛弃。

文本与视频之间的维度鸿沟

人们多有不解,为何借助AI撰写几万字的文章,以及绘制一幅精美插图,成本约莫只在几分钱左右。然而,一旦牵涉到视频生成,那些被寄予深切厚望的AI模型瞬间就会演变成令服务器负荷飙升直至冒烟的“算力刺客”。于此背后,实际上是AI所认知的世界维度存在巨大差异。

序列是一维的文本,是经人类高度浓缩而成的思想符号。当你于对话框内输入问题之际,AI所处理的乃是Token,撰写文章从本质上来说,是AI于一维序列中凭借概率分布对下一个词进行预测。尽管大模型参数令人惊叹,然而这种一维序列的计算量是以线性方式增长的。而视频不但涵盖二维的空间信息,而且还包含时间维度,它属于高维的时空数据。

12亿像素背后的物理引擎之困

如果你向AI提出生成一段时长为10秒钟,并且每秒帧数达到60帧的短片的要求,这就表明它不得不于极为短暂的时间范围之内,进行像素数量高达12亿个的处理以及生成工作。如此这般高维度数据的处理数量层面,当与纯文本相互比较时,二者俨然处于完全不同的数量范畴。为能够对这般庞大的数据予以处理,Sora以具有创新性的方式采用了一项被称作“时空补丁”的技术。

为了避免出现穿模情况以及保持不违和,AI 会在每一帧做反复计算,且这种计算是天文数字级别的,在每一个像素之间也要进行这样的计算。它所做的已不只是单纯生成图像,而是在服务器里,尝试借助算力临时拼凑出一个符合真实世界规律的物理引擎。这种对时间连贯性有着极度渴求的情况,以及对空间连贯性也有着极度渴求的状况,使得算力需求呈指数级爆炸。

沙滩上的海市蜃楼

Sora刚出现的时候,好多人心里都有个浪漫的想法,这个模型能逼真模拟三维物理世界,那它会不会就是通向通用人工智能的“世界模型”呢?大家天真地觉得,只要让AI看够多视频,它就能像人类婴儿那样,自然而然明白什么是重力,什么是惯性。

如一些顶尖AI学者所批判的那般,仅仅凭借海量数据的统计学概率去猜像素,实际上AI根本未曾真正领会物理法则,这便是为何在那些惊艳示人展示里面,我们偶尔会瞧见悬浮于半空之中的椅子,或者出现违背常理的水流情况,事实表明,这种缺少真实世界反馈提供的纯视觉预测,恰似一座构建于沙滩之上的虚幻海市蜃楼。

从视觉幻术转向代码逻辑

按下Sora停止键之际,快速把最关键的资源,朝着以Codex作代表的代码智能体倾斜。代码的世界并无太多模糊不清的视觉猜谜,它格外严谨,还有不容置疑的客观标准,编译器不会说谎。在一回回的报错与修正里,AI历经了完整的感知、行动、观察、修正循环。

正是处于这种真实的反馈当中,AI反倒获取得到了一种理解因果关系的便捷途径。况且,回归至商业的实质,一个能够不知疲倦地编写、测试以及重构代码的AI助手,能够切实地给企业削减庞大的人力成本。在这个资本逐渐趋向于理性的寒冬之际,这种能够马上转变为生产力的工具,远比生成几秒钟酷炫然而却没有用处的视频要来得实际得多。

无法逾越的版权与监管雷区

视频大模型前行艰难,除高昂算力成本外,还有一致命伤,即法律与伦理风险,算力成本是AI公司内忧,版权问题是随时可能引爆外患,视频大模型要达逼真效果,需大量高质量视频数据训练,很多模型早期采用“先抓取,后道歉”野蛮生长策略。

这在视频领域没法行得通,影视作品版权壁垒极为森严。生成效果越逼真,越易引发全球媒体与创作者的巨额版权诉讼。视频生成技术好似“抱着炸弹的孩子”,面对各国政府愈发严苛的监管政策,像Sora这种没有清晰商业模式、却自带极高社会风险的项目,在投资人眼中,无疑是个随时会爆炸的麻烦制造者。

Sora停止运行,也许致使这个世界缺失了一种令人赞叹的视觉幻术,还让无数创作者的短视频梦想暂时破灭。不过,卸下了每日繁重的账单,摆脱了没完没了的版权纷争,这家人工智能巨头终于能够将全部的算力、人才和精力,再次集中到他们最为擅长、且最能产生实际价值的核心业务之上。只是不清楚,当未来某一天我们确实用上那个能够编写代码、能够进行推理、能够解决实际问题的超级智能时,还会不会忆起那个曾使“现实消逝了”的短暂寒冬?

万一哪天,AI生成视频所需成本切实降至几分钱一分钟,那你最打算用它去拍出一个怎样的故事呢?欢迎于评论区留下你的奇思妙想。

分享更多
5
0

您可能还会对下面的文章感兴趣:

底部横幅广告