OpenAI 发布 Sora 2:具备音频支持的革命性 AI 视频生成器
OpenAI 推出 Sora 2,这是一款突破性的 AI 视频生成模型,为全球创作者带来同步音频、增强的物理模拟和社交分享功能。
OpenAI 发布 Sora 2:具备音频支持的革命性 AI 视频生成器
2025 年 9 月 30 日,OpenAI 在 AI 视频生成领域取得重大突破,宣布推出其下一代视频和音频生成模型 Sora 2。这次发布标志着 OpenAI 所描述的”视频领域的 GPT-3.5 时刻”,为内容创作者、电影制作人和普通用户带来前所未有的能力。
Sora 2 的新功能
同步音视频生成
Sora 2 最具突破性的功能是能够生成同步的音频和视频内容。与只能生成无声视频的原始 Sora 模型不同,Sora 2 现在可以创建:
- 对话同步:角色说话时的唇形同步精确度
- 背景音频:与场景匹配的环境声音
- 音效:与屏幕上动作相对应的逼真音频
- 多风格支持:从写实到动漫,具有相应的音频处理
这一进步使 Sora 2 成为第一个能够生成完整、沉浸式视频体验的 AI 模型,无需单独的音频后期制作。
增强的物理模拟
OpenAI 显著改进了 Sora 2 对现实世界物理的理解。该模型现在能够准确模拟:
- 物体交互:逼真的碰撞和反弹
- 重力和动量:自然的运动模式
- 材料属性:不同物体在各种条件下的表现
根据 OpenAI 的演示,早期版本可能会在投篮不中时将篮球”传送”到篮筐中。而 Sora 2 则会渲染逼真的弹跳和轨迹,展示其先进的物理引擎。
改进的视觉质量
新模型提供:
- 更清晰的逼真度:增强的细节和纹理质量
- 扩展的风格范围:更多样的艺术风格
- 更好的可控性:对生成参数更精确的控制
- 高达 1080p 的分辨率:专业质量的输出
- 长达 20 秒的视频:扩展的内容创作能力
Sora 应用:全新的社交平台
与 Sora 2 一起,OpenAI 推出了 Sora iOS 应用,将其定位为 AI 生成视频内容的社交平台。该应用的功能包括:
类似 TikTok 的界面
- 竖屏视频流:滑动滚动导航
- 发现功能:浏览热门 AI 生成内容
- 社交分享:公开分享或与朋友分享
- 混音功能:修改和基于他人的创作进行创作
Cameo 功能
最具创新性的功能之一是 Cameos 功能,允许用户:
- 创建一次性视频和音频录制以进行身份验证
- 将自己插入到 AI 生成的场景中
- 允许朋友使用自己的形象(需要批准)
- 在自己的形象被使用时接收通知
- 审查和批准或删除包含自己形象的视频
这一功能为个性化内容创作开辟了全新的可能性,同时保持用户对其数字形象的控制。
可用性和访问
当前推出
- 地区:最初在美国和加拿大
- 平台:iOS 应用(Android 即将推出)
- 访问模式:目前仅限邀请
- 优先访问:提供给原始 Sora 模型的重度用户和 ChatGPT Pro 订阅者
API 即将推出
OpenAI 宣布 Sora 2 的 API 将在”未来几周”推出,使开发人员能够:
- 将视频生成集成到自己的工具中
- 构建利用 Sora 2 功能的自定义应用程序
- 为视频制作创建专门的工作流程
安全和透明度措施
OpenAI 实施了几项安全功能:
- 数字内容凭证:指示 AI 生成的元数据
- 可见水印:下载视频上的明确标签
- 身份验证:Cameo 功能所需
- 内容审核:包含个人的视频的审批流程
- 用户同意:控制个人形象的使用
这对创作者意味着什么
Sora 2 代表了内容创作的范式转变:
对专业创作者
- 快速原型视频概念
- 经济高效的预可视化
- 独特的风格可能性
- 增强的叙事工具
对普通用户
- 轻松创建个性化内容
- 社交分享和协作
- 无技术障碍的创意表达
- 有趣且引人入胜的用户体验
展望未来
Sora 2 及其配套社交应用的推出标志着 OpenAI 致力于使先进的 AI 工具变得可访问和社交化。随着平台扩展到美国和加拿大以外,以及 API 向开发人员开放,我们可以期待创新应用和创意用例的爆发。
音频集成、改进的物理模拟和社交功能使 Sora 2 不仅仅是一个工具,而是下一代数字内容创作的平台。无论您是电影制作人、营销人员、教育工作者,还是只是喜欢创作内容的人,Sora 2 都提供了几年前无法想象的前所未有的能力。
请继续关注有关 Sora 2 可用性和功能的更多更新。要获得早期访问权限,请考虑订阅 ChatGPT Plus 或 Pro 计划。