
朋友们好!一周的工作又接近尾声了,“金大哥”的AI周报,提前为你送上本周的精华总结。
我们先来回忆一下今年年初的那场“大地震”。当OpenAI第一次放出Sora的演示视频时,整个创意和科技圈,是不是都感受到了那种混杂着兴奋、敬畏与一丝丝恐惧的震撼?
Sora就像是AI扔下的一颗“核弹”,它用一种不容置疑的方式,向全世界证明了:是的,AI视频生成,不仅是可行的,而且可以做到无限逼近现实。
但在那之后,Sora就像一位“武林高手”,惊鸿一现,然后便归隐山林,只留下了传说。这几个月来,整个AI视频领域,都处在一种奇特的“后Sora期待期”。我们就像一群看完了《流浪地球》预告片的观众,一边反复回味着那几分钟的震撼,一边焦急地问:“正片呢?正片到底什么时候上映?”
而就在本周,我们虽然没有等来Sora的“正片”,却等来了一场更猛烈的“Sora级别”的“流星雨”。各大巨头,仿佛约好了一样,纷纷亮出了自己秘密研发的“屠龙之刃”。
那么,我们是否正在迎来一个新的、或者说更猛烈的“Sora时刻”?
深度聚焦:这不是“Sora时刻”,这是“Sora洪水”
经过本周的密集轰炸,我得出一个结论:我们正在经历的,不是又一个“时刻”,而是一场“洪水”。
“时刻”,意味着一次性的、标志性的事件。而“洪水”,则意味着这项技术,正在从一个“实验室奇观”,变成一股不可阻挡的、即将淹没我们所有创意工作流的“基础设施”。
第一波巨浪:Google的“Veo”正式登陆YouTube
传闻已久的Google“Sora杀手”——Veo模型,在本周,终于结束了它神秘的内测,正式向所有YouTube Premium订阅用户和部分创作者,开放了公测。
我第一时间体验了一下。平心而论,在单纯的“一句话生成一分钟高清视频”的能力上,Veo和Sora相比,只能说是“各有千秋”,并没有绝对的超越。
但Veo真正的“核武器”,在于它和YouTube生态的“原生级”集成。
在最新的YouTube Studio后台,多了一个“AI素材库”的选项。你可以:
- 生成你的专属B-roll(补充镜头): 你在视频里讲到“沙滩和海浪”,可以直接输入指令,Veo会立刻为你生成一段风格统一、时长自定义的沙滩海浪视频,让你无缝插入到你的时间线里。你再也不用到处找那些千篇一律的版权素材了。
- 动态化你的数据图表: 你可以上传一张静态的Excel图表图片,然后告诉Veo:“让这个柱状图,以一种有趣的方式‘长’出来”,它就能为你生成一段动态的数据可视化视频。
- 一键生成频道介绍/片头: 你只需要输入你的频道名和Slogan,选择一种风格,Veo就能为你生成一段5-10秒的、酷炫的动态片头。
你看,Google的野心,从来不是做一个“玩具”。它正在把顶级的AI视频生成能力,变成创作者触手可及的“水电煤”。这不是一个独立的工具,它是你内容创作流程中的一个“超级按钮”。
第二波巨浪:Meta的“Emu Video 2.0”学会了“随心所欲”
Meta这边则走向了另一个同样可怕的方向:“实时交互式生成”。
他们本周发布的Emu Video 2.0模型,演示了一个让所有剪辑师都感到兴奋的功能。在它生成的视频里,你几乎可以“选中”任何一个动态的物体。
打个比方,它生成了一段“一只猫在客厅里追逐一个毛线球”的视频。你觉得猫的位置不太好,在过去,你只能选择“重画”。而现在,你可以直接用鼠标,像拖动一个图层一样,把那只正在跑动的猫,从画面的左边,拖到右边。
松开鼠标,AI会在几秒钟内,重新渲染出一段全新的、猫的跑动路径完全符合你拖拽轨迹的视频,并且,它还会智能地补全光影、背景和物理碰撞。
这为什么重要? 它正在把AI视频,从一个“许愿-开奖”的模式,变成一个可以被实时“导演”和“操控”的模式。我们离那个“心中有画面,手中就能实现”的未来,又近了一大步。
开源社区的“反击战”
面对商业巨头们的“技术封锁”,开源社区这周也打出了一张漂亮的牌。
一个由欧洲多个大学的AI实验室联合发起的项目“Phoenix”,发布了他们的0.8版本开源视频模型。
虽然在生成质量的“上限”上,Phoenix还无法与Veo或Sora媲美。但它有两个致命的吸引力:
- “小”: 它的模型参数,只有Sora的不到十分之一。这意味着,虽然我们还无法在自己的游戏本上流畅运行它,但一些小型的创业公司和个人开发者,已经可以在可接受的成本内,对它进行“私有化部署”了。
- “可调教”: Phoenix的架构,天生就为“微调”(Fine-tuning)而设计。就在它发布不到72小时,社区里就已经出现了各种“LoRA for Video”的模型。有人把它“调教”成了“宫崎骏动画”风格的专属模型,有人则把它变成了“王家卫电影”风格的色彩和镜头模拟器。
开源社区正在用自己的方式告诉我们:你们可以建起高墙,但我们选择铺开一张巨大的、可以被任何人修改和创造的“画布”。
巨头动态追踪(速览版)
- 微软/OpenAI: 关于GPT-5的传闻,在本周达到了一个新的高峰。多个内部消息源都指向,GPT-5的核心能力,将不再仅仅是语言和逻辑的提升,而在于其强大的“Agentic”能力,即作为“AI智能体”自主规划和执行复杂任务的能力。这与我们上周在周报里讨论的趋势完全一致。
- 苹果: 苹果依然“沉默”,但在招聘网站上,他们关于“大型语言模型研究科学家”和“生成式AI应用工程师”的招聘岗位,在本月增加了近30%。很明显,苹果正在以前所未有的力度,秘密组建自己的“AI军团”,目标直指能完全在iPhone和Mac本地运行的、保护隐私的“端侧AI”。
好了,聊了这么多,让我们回到最初的问题。
我们正在经历的,不是又一个像Sora那样“只闻其声不见其人”的孤立时刻。我们正在经历的,是一场由所有顶级玩家共同掀起的、AI视频技术的“应用化”和“普及化”的洪水。
这股洪水,意味着这项曾经遥不可及的技术,正在以前所未有的速度,涌入我们最常用的创作工具(YouTube),变得越来越“可控”(Meta),也越来越“开放”(Phoenix)。
这周的动态清晰地告诉我们:AI视频的“军备竞赛”,已经从“实验室阶段”,进入了“产品化”的巷战。而对我们这些创作者来说,这无疑是最好的时代。
那么,当洪水来临时,你是选择观望,还是选择拿起冲浪板,去迎接那最壮阔的浪潮呢?
好了,提前祝你周末愉快,我们下周再见!