
今年早些时候,Google 推出的 Gemini Veo 3 把“带声音的真实感 AI 视频生成”正式带入了大众视野。那是第一次,AI 视频不仅“看起来像真的”,而且“听起来也像真的”。
而现在,OpenAI 带着 Sora 2 回来了。
问题也随之变得非常直接:
Sora 2 只是又一次炫技,还是我们真的已经进入了“眼见不一定为实”的时代?
我花了一些时间实际测试了 Sora 2,从如何使用、能做什么、效果如何,到它是否真的有长期价值。下面是我比较诚实的一次体验总结。
Sora 是 OpenAI 推出的 AI 视频生成模型。如果你之前听说过它,那很可能是因为最早的 Sora 曾经凭借极高的画面真实度刷屏网络。
但老实说,早期的 Sora 还不成熟:
Sora 2 才是真正的转折点。
这次更新之后,Sora 已经可以:
它既可以作为 ChatGPT 生态的一部分使用,也有独立的 Sora App,而后者其实比你想象中更重要。
目前,Sora 已经支持 iOS、Android 和网页端。 但现实情况是:
OpenAI 表示 Sora 2 初期会提供免费额度,但说实话,这种“慷慨”大概率不会长期存在。
如果你订阅了 ChatGPT 每月 200 美元的 Pro 计划,还可以使用 Sora 2 Pro:
如果你只是想“现在就体验 Sora 2”
从我个人体验来看,这一点对大多数用户才是关键。
如果你只是想:
那其实不一定非要等官方邀请。
像 XXAI 这样的平台,已经同步更新并接入了 Sora 2 模型,用户可以直接体验视频生成能力,而不需要排队、抢资格或先订阅高价套餐。
在我看来,这对以下人群尤其友好:
在探索阶段,“能不能用”往往比“在哪用”更重要。
本质上,Sora 2 的核心能力只有一个: 👉 通过文字生成 AI 视频
你可以用它生成:
生成时间通常在一到两分钟左右。视频生成后会以草稿形式存在,你也可以选择发布到 Sora 的公开视频流中。
图片转视频 & Cameo 功能
Sora 还支持:
Cameo 是目前最“未来感”的功能之一。你可以录制一小段自己的脸和声音,Sora 就能生成“你出演”的视频内容。
老实说,看着一个几乎一模一样的“自己”说出你从没说过的话,多少有点不安,但技术层面确实很震撼。
内容限制:规则 vs 现实
按官方说法,Sora 不允许:
但现实中,规则的执行并不总是那么清晰。 大量已故名人、历史人物的视频在平台上非常流行,比如 Bob Ross、耶稣等。
这并不是说 OpenAI 不在乎,而是说明:技术发展速度已经开始跑在规则前面了。
简单说:好用,但并不完美。
视频质量
相比初代 Sora,Sora 2 在复杂动作上的进步非常明显。
过去几乎无法完成的任务(比如解魔方),现在成功率高了很多。当然,偶尔还是会出现:
但只要多生成几次、稍微调一下 prompt,做出让人惊讶的效果并不难。
音频表现
音频表现比较看运气:
整体来看,大致和 Veo 3 在同一水平线上。
Cameo 的真实感
Cameo 视频是 Sora 2 最让我印象深刻的部分。
当它成功时,真实度足以让人产生短暂的错觉。但问题也同样存在:你仍然需要多次生成和不断调整,才能达到“以假乱真”的程度。
Sora App 并不仅仅是一个工具,它更像是 AI 视频的社交平台:
从战略角度看,这一步很聪明。毕竟 Veo 3 目前并没有类似的社交形态。
但从体验上来说,内容质量参差不齐,评论区也比较“空”。刷一刷挺有意思,但很难说有什么长期价值。
不过,我个人其实不反感这个方向。 至少,它可能会让一部分 AI 视频内容留在 AI 平台里,而不是继续淹没 TikTok 和 Shorts。
这是我个人最大的犹豫点。
技术本身当然很酷,但我忍不住会想:
为了生成无限量的 AI 梗视频,真的值得投入如此庞大的算力、能源和社会成本吗?
当任何人都能在几分钟内生成“看起来真实、听起来真实”的视频时,“眼见为实”这件事本身就开始崩塌。
这不仅是技术问题,也是社会问题。
作为 OpenAI 的产品,Sora 的数据政策与 ChatGPT 基本一致:
关于 Cameo 的人脸和声音数据,官方表示:
但目前,如果你想删除 Sora 账号,必须连同 ChatGPT 账号一起删除,这一点并不理想。
我的建议很简单: 不要上传任何你不希望未来被泄露的内容。
如果你是为了:
那我会说:值得一试。
但如果你期待的是一个成熟、稳定、可长期依赖的创作工具,那现在还不是时候。
至少目前,Sora 2 更像是:
而这一点,本身就已经值得我们认真对待了。
只是请记住一句话: 在这个时代,看到的,不一定是真的。