2024-12-16 17:06:39 科技 63553阅读
“在与包括 Sora 在内的许多文本转视频模型进行了 6 个月的玩耍后,我意识到他们在复杂的身体动作(例如体操)上遇到了困难,”开发者 Deedy Das 告诉 Ars Technica。 “人工智能生成的体操视频现在成为衡量其成功的标杆”。
Sora 制作的体操运动员视频由 Deedy Das 发布在 X 上。
在X上,此人还分享了多段由Sora创作的杂技、跑步、跳跃等快速移动场景的视频。许多场景被一分为二,动作“极其不自然”,假肢显得不真实。
根据 Deedy Das 的说法,像 Sora 这样的 AI 模型创建的快速移动场景与 6 个月前相比有了很大改善,但仍无法制作出慢节奏视频等优质产品。 “总的来说,尽管有所改进,但一切仍然很糟糕,”这位开发人员评论道。 》希望工具A我制作的视频会“学习物理”以创建更真实的场景,但这还没有发生。”
在 Deedy Das 的视频之后,一些 X 用户也表示快速移动是这个工具的弱点。“好像 Sora仍然在基础物理方面遇到困难,这表明现实模拟需要人工智能首先真正理解它,”一位人士评论道。
“我发现生活中的‘常识’并不容易重现另一位人士写道:“在数字环境中,这甚至是最难编码的事情之一。”
Sora 由 OpenAI 在 2 月份推出,仅限一小群人尝试,然后于 2 月 9 日公开发布于 ChatGPT Plus 12该模型可以使用描述命令创建长达一分钟的视频,一群经验丰富的艺术家在不满并指责 OpenAI 的利用后很快就分发了这个工具。据说该工具还存在一些版权问题。年中,当《华尔街日报》询问Sora的训练数据来源是否来自YouTube时,前CTO Mira Murati没有给出明确的答案。
Business Insider后来引用 YouTube CEO 的话说,这确实是一个大问题,OpenAI 不应该使用他们的视频来训练 AI 模型。Bao Lam
OpenAI Sora早期用户不满,对外发布工具
OpenAI Sora运营成本可达数十亿美元