OpenAI展示了Sora,这是一种可以从文本提示生成逼真视频的AI模型

OpenAI 一直是消费类 AI 领域的开拓者,借助 DALL-E 和 ChatGPT,彻底改变了文本和图像生成。现在,凭借其最新产品Sora,该公司旨在涉足文本到视频生成领域,试图进一步推动人工智能创造力的界限。

Sora 拥有制作长达一分钟的视频的能力,包括具有“多个角色”、细微动作和“详细背景”的复杂场景——所有这些都由用户提示驱动。结果令人惊讶地栩栩如生,展示了人工智能在视觉叙事方面不可否认的潜力。

在 OpenAI 提供的几个演示中,Sora 毫不费力地将提示带入生活。从一辆在山区行驶的老式 SUV 到坐在融化的蜡烛旁边的毛茸茸的怪物的异想天开的场景,生成的视频对所提供的说明表现出非凡的保真度。

然而,Sora 当然不是没有缺陷。一些实例揭示了轻微的不一致或不切实际的动作,突出了需要改进的地方,例如在猫向熟睡的主人索要早餐的场景中。虽然整个场景的渲染令人信服,但敏锐的观察者可能会注意到当主人从睡眠中醒来时偏离现实的微妙动作。然而,与模型产生令人惊叹的视觉叙事的整体能力相比,这些缺陷显得苍白无力。

一个突出的例子是描绘一个毛茸茸的怪物在融化的蜡烛旁边。结果看起来真的很精彩,就像皮克斯电影中的东西一样。错综复杂的细节,例如生物皮毛的纹理,否则很难渲染,展示了 Sora 在处理复杂视觉元素方面的实力。

目前,Sora可供一组选定的“红队成员”使用,他们的任务是评估其潜在风险和影响。此外,OpenAI 正在与视觉艺术家、设计师和电影制作人合作,收集反馈,旨在增强该模型对内容创作者的整体效用。随着 Sora 继续进行改进和评估,它有望使视频创作民主化——为讲故事的人和创作者提供强大的工具,帮助他们将愿景变为现实。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
OpenAI展示了Sora,这是一种可以从文本提示生成逼真视频的AI模型

精彩评论