OpenAI 推出 Sora 2:具有先进功能的下一代AI视频模型,反响不一
Brief news summary
OpenAI推出了Sora 2,一款通过仅限邀请的iOS应用提供的生成型AI视频模型。Sora 2能够根据自然语言提示生成带有对话和声音的逼真视频,媲美谷歌的Veo 3。它支持多样的风格,包括假警察录像和复古广告,但其高度逼真性也引发了关于深度伪造和虚假信息的担忧。与xAI的Grok Imagine不同,Sora 2限制面部上传,并加入了Cameos这一需要用户自主选择并获得同意的功能,以使用个人的肖像,旨在减少深度伪造的风险。尽管如此,人们仍通过创建涉及公众人物和受版权保护角色的表情包和视频来滥用该技术,未明确获得授权,带来了知识产权方面的挑战。由于需求量大,访问受限,但Sora 2的创新特性和创意潜力凸显了在不断发展的AI内容环境中,责任使用和加强媒介素养的重要性。本周,OpenAI发布了Sora 2,这款备受期待的下一代生成式AI视频模型,作为一个单独的iOS应用免费提供,仅限受邀用户使用——遗憾的是,目前还不支持安卓系统。在获得邀请后,我一直在探索这个应用并制作视频(甚至通过此赚取了一些收入)。我的感受喜忧参半:这项技术无疑令人印象深刻,应用也挺有趣,但部分内容让人感到不安。 Sora 2由OpenAI(ChatGPT的开发者)开发,能够根据自然语言提示生成带有同步对话和音频的视频。它是真正与谷歌Veo 3竞争的产品,后者自今年早些时候上市以来一直占据着AI视频生成的主导地位。相比之下,Meta的Llama或Grok Imagine工具稍显落后,不过Meta可能会借助Midjourney技术取得一定优势。像Veo 3一样,Sora 2主要生成病毒式的梗图和短视频,风格类似TikTok——内容常含幽默场景,比如一只金毛被逮捕因盗窃牛排,或者一只袋鼠在机场安检被拦下。这些视频虽然好笑,但也突显出娱乐与潜在滥用之间的微妙界限。 Sora 2的视频逼真度越高,伴随而来的深度伪造和虚假信息的风险也越大,而这种风险随着视频质量的提升而增强。不过,OpenAI的内容保护措施远比 Elon Musk的Grok Imagine更为严格,后者因监管松散、出现淫秽性别深伪内容而受到批评。Sora 2会屏蔽包含任何识别出脸孔的视频,除非通过其Cameos功能创建——这是允许在获得本人同意的情况下使用肖像。尝试制作公众人物如泰勒·斯威夫特的视频被拒绝,显示出其更强的保护机制。 Cameos是Sora 2的一项亮点功能,用户可以选择加入或退出肖像被使用的权限,还能授权好友、特定用户或公众使用。该功能引发了大量以OpenAI CEO Sam Altman肖像制作的视频。我自己也试着制作了一个视频,奇怪的是视频中我看起来还挺像本人,但声音却不对——看到自己说或做虚假内容令人不安,但在这个AI时代已逐渐变得正常。 Sora 2与Veo 3依然是同一水平线,能生成逼真的视频,匹配相应的对话和声音。Sora还能用多样的风格制作内容——从伪装的警方随身摄像头录像,到90年代的广告和体育转播——这些内容表面上看不出是AI生成的。有关于Sora 2与Veo 3的详细对比文章即将发布,但Sora 2在真实性方面比GPT-5更令人满意。 在知识产权(IP)方面,Sora 2似乎操作得比较随意。尽管目前围绕AI是否能使用艺术家和IP作品(比如迪士尼起诉Midjourney“无底线剽窃”)的法律争端不断,但美国政府目前倾向于支持AI行业使用IP资源,认为限制这种用途在科技竞争中不切实际。因此,像《海绵宝宝》《星球大战》《瑞克与莫蒂》等带有版权的角色,现已出现在各种病毒式AI视频中。当被问及时,OpenAI未确认是否与华纳兄弟等版权持有人有授权协议。 应用中的内容经常重现公众演讲或文化经典片段,变成病毒式的梗图——比如马丁·路德·金的“I have a dream”演说被恶搞成讨论Xbox Game Pass价格的段子。以《海绵宝宝》的表情包最为普遍,或许是因为千禧一代用户对这一形象有着怀旧情感。虽然公众人物和角色一直是网络梗的热门素材,但AI生成逼真视频的便利大大提高了虚假信息和激怒公众的可能性,尤其在当前文化战火不断的背景下。OpenAI声明,用户享有创作自由,但IP持有人也可以提出删除请求,然而目前没有广泛的IP退出机制。 早期用户可能会频繁遇到“我们正承载大量请求,请稍后再试”的提示,这反映出需求极其火爆,就像早期ChatGPT图像生成阶段一样,造成创建视频的额度难以用完。 在众多功能中,我特别喜欢视频相册这个功能——用户可以横向滚动查看一段视频的不同版本,微调提示即可看到不同的效果。这是一个探索创意的巧妙且有趣的方式。 总体来看,Sora 2和Veo 3一样具有强大的吸引力——都能轻松制作逼真的视频,配上对应的对话和声音。Sora还能生成多种风格的内容——从伪装的警察随身录像,到90年代的广告和体育直播,都不明显是AI制作。关于Sora 2和Veo 3的深入对比即将发布,但Sora 2的表现明显比GPT-5更令人满意。 在知识产权方面,Sora 2似乎操作得较为宽松。尽管关于AI是否可以使用艺术家和IP作品存在一些法律争议(比如迪士尼对Midjourney提起的“无底线剽窃”诉讼),但目前美国政府倾向于支持AI行业使用IP资源,认为限制不切实际。因此,像《海绵宝宝》《星球大战》《瑞克与莫蒂》这些有版权的角色,频繁出现在病毒式AI视频中。OpenAI在被问及时,没有确认是否与华纳兄弟等权利方达成了授权协议。 应用内容经常对公众演讲或经典文化元素进行搞笑改编,变成病毒式的梗图,比如马丁·路德·金的著名演讲被幽默改编成讨论Xbox Game Pass价格的段子。SpongeBob meme尤为盛行,可能反映了千禧一代用户的怀旧情感。虽然公众人物和角色常作为梗图素材,但AI生成的逼真视频使虚假信息和激怒公众的风险大大增加,尤其在当前文化冲突不断升级的背景下。OpenAI表示,用户享有创作自由,但IP持有人可提交删除请求,但目前尚无全面的IP退出机制。 新用户可能会经常遇到“系统繁忙,请稍后再试”的提示,这与早期ChatGPT图像生成时遇到的情况类似,造成视频制作额度难以用完。 我特别喜欢Sora 2的相册功能,用户可以左右滚动查看同一视频的不同版本,通过微调提示,探索各种创意可能性。这是一个既实用又有趣的探索工具。 总而言之,Sora 2像其他短视频App一样具有强烈的粘性——很容易迷失其中一发不可收拾。虽然技术令人印象深刻,但无论点赞多少,这些更好的AI生成“废品”仍然是废品。 披露:Mashable的母公司Ziff Davis在4月对OpenAI提起诉讼,指控其在训练AI系统时未经授权使用受版权保护的材料。
Watch video about
OpenAI 推出 Sora 2:具有先进功能的下一代AI视频模型,反响不一
Try our premium solution and start getting clients — at no cost to you