您的位置: 首页 >互联网 >

Sora理解物理世界吗(关于Sora的简介)

2024-02-23 14:10:01 编辑:宰荷荣 来源:
导读 Sora模型发布已经有一段时间,最初它对世界的理解能力让人惊叹,但有业内人士认为,Sora对于世界的理解还停留在比较初级的阶段,对物理世界...

Sora模型发布已经有一段时间,最初它对世界的理解能力让人惊叹,但有业内人士认为,Sora对于世界的理解还停留在比较初级的阶段,对物理世界并没有特别深的理解。

1.相比于以前的视频生成模型,Sora对于物理世界有一定的理解能力,但并不能算很高明,在一个中国舞龙视频当中,Sora生成的中国字其实并不是中国字,只是比较像中国字的一个图形,这是计算机的特性决定的,它具备很强的学习能力和图像生成能力,但对于现象背后的物理意义和文化意义并不如ChatGPT一样具备深刻的理解。

2.Sora在视频的生成能力、连续性和真实世界模拟方面都具有巨大的优势,它生成的视频默认为1080P,还具备视频连接、数字世界模拟、不同世界交互、运动相机模拟等功能,这些功能在其他的视频模型当中被提及较少。

3.Open AI发布的Sora可以生成尺寸更加自由的视频,用户可以选择1920*1080的横屏、竖屏模式,介于两者之间的所有尺寸视频用户都可以自由选择,相比之下比如Runway Gen2视频生成模型,只能选择16:9、1:1、4:3等长宽比的模型,清晰度则为1408*768px。

4.Sora能将两个视频揉合起来,生成一个看起来没有丝毫违和感的视频,在官方演示视频中,先为模型给出一个无人机穿越古罗马的视频,再给一个蝴蝶在海底飞行的视频,Sora能将无人机变成蝴蝶,为古罗马建筑加入珊瑚风格。

5.生成的视频中如果镜头中物体被其他物体遮住,镜头移动到下一阶段,这一物体重新出现时仍然能保持之前的存在状态,这种连续性是视频生成模型的一大突破,可以预见未来Sora将会有广泛的应用前景。


免责声明:本文由用户上传,如有侵权请联系删除!

最新文章

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ   备案号:

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。

邮箱:toplearningteam#gmail.com (请将#换成@)