各位老铁们,大家好,今天由我来为大家分享突破Gen2!字节推出全新视频生成模型,绿巨人VR眼镜体验升级,以及的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!
一句话,就让绿巨人戴上VR眼镜。
4K画质那种。
熊猫的奇幻漂流~
这是字节最新的AI视频生成模型MagicVideo-V2,各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率,轻松hold各种绘图风格。
△从左往右:油画风、赛博风、设计风
测评效果超过Gen-2、Pika以及现有AI视频生成工具。
结果上线不到24小时就引发众人围观,比如一条推文就有近20万浏览量。
不少网友惊讶其效果,甚至直言:比runway和pika还要好。
“比runway和pika还要好”
研究人员也的确进行了实际的效果比较。选手分别为:MagicVideo-V2、StabilityAI的SVD-XT,新潜力玩家Pika1.0,以及Runway的Gen-2。
第一轮:光影效果。
夕阳西下,旅行者独自行走在迷雾森林中。
(从左到右依次是:MagicVideo-V2、SVD-XT,右上Pika,右下Gen-2,下同)
可以看到,MagicVideo-V2、Gen-2和Pika都有明显的光影。不过Pika看不出是为旅行者,MagicVideo-V2的色调更为丰富。
第二轮:情境剧情的表达。
1910 年代的情景喜剧,讲述社会中的日常生活和琐事
这一轮明显也是MagicVideo-V2、Gen-2更胜一筹。SVD-XT呈现的中景构图,虽然年代体现出来了,但表达不够。
第三轮:写实。
小男孩在公园的小路上骑着自行车,车轮踩在碎石上发出嘎吱嘎吱的声音.
这次对比就更为明显了。MagicVideo-V2和SVD-XT是完整体现出句子意思的,不过MagicVideo-V2可以看到小孩明显脚在动的细节。
除此之外,研究人员还将MagicVideo-V2与当下最先方法进行一对一的人类评估。
结果显示,相较于其他方法,人们认为MagicVideo-V2的效果更好。
(绿色、灰色和粉色条分别代表 MagicVideo-V2 被评价为更好、相当或较差的试验效果。)
如何实现?
简单来说,MagicVideo-V2是一条视频生成流水线,集成了文本到图像模型、视频运动生成器、参考图像嵌入模块、插值模块。
首先是有T2I模块首先根据文字生成1024×1024图像,随后I2V模块对该静态图像进行动画处理,生成600×600×32的帧序列,然后再用V2V模块增强,并完善视频内容,最后再用插值模块将序列扩展到94个帧。
这样一来,既保证了高保真,时间上也有连续性。
不过早在2022年11月字节曾推出了MagicVideo V1版。
不过,当时更强调的是高效性,它能在单个GPU卡上生成256x256分辨率的视频。
参考链接:https://twitter.com/arankomatsuzaki/status/1744918551415443768?s=20项目链接:https://magicvideov2.github.io/论文链接:https://arxiv.org/abs/2401.04468https://arxiv.org/abs/2211.11018
— 完 —
量子位 QbitAI · 头条号签
用户评论
太厉害了!之前看AI生成的视频还是挺生硬的,现在能做到让绿巨人戴VR眼镜这种效果,太酷了吧!真期待未来AI能做更多有意思的事!
有15位网友表示赞同!
确实很惊艳!我一直觉得生成模型在视频方面进展很快,这个字节的新技术简直是又迈上了一个台阶。希望能看到更多使用场景!
有14位网友表示赞同!
这效果也太好了吧!一句话就能生成这样的视频,完全颠覆了我的认知!未来我们是不是都可以轻松玩一些特效、动画什么的?
有7位网友表示赞同!
虽然看着很厉害,但我还是比较担心AI带来的问题,比如会不会被滥用用来制作假新闻啊。希望相关部门能加强监管,避免负面影响。
有8位网友表示赞同!
这视频看得我有点慌啊...感觉将来越来越不分清是真是假了,真假难辨可不是个好事呀!
有15位网友表示赞同!
效果确实不错,但我更想知道这个模型是怎么实现的?字节是不是能开源部分代码给我们研究一下?我很想深入了解它的技术原理。
有10位网友表示赞同!
这都2023年了,视频生成AI越来越牛逼了!我以前就觉得人工智能会改变世界,现在看来我的想法是对的!
有8位网友表示赞同!
感觉这种技术还是比较偏向于娱乐吧?对实际生产或者生活场景的帮助似乎没那么大。
有17位网友表示赞同!
如果能把这个技术应用到教育领域,那岂不是太棒了!我们可以轻松制作各种教学视频,让学习更加生动有趣!
有18位网友表示赞同!
我一直觉得人工智能最应该被开发的是医疗、环境保护等方面,这种生成模型虽然厉害,但也更像是一种玩物。希望科技进步能够真正造福人类。
有20位网友表示赞同!
说句实话,我还是比较喜欢传统的视频制作,那种手工的感觉更有温度。AI生成的视频虽然技术先进,但我感觉少了点人情味
有19位网友表示赞同!
我真佩服字节研发团队的脑洞!把绿巨人戴VR眼镜这个创意想出来就很厉害了! 我相信未来会有更多更让人惊喜的效果出现!
有6位网友表示赞同!
一句话让绿巨人戴VR眼镜?这听起来像魔法一样不可思议! 希望这种科技能被更多人掌握,创造更多美好的事物!
有10位网友表示赞同!
我也想试试这个模型!看看能不能自己生成一个视频!感觉很酷炫啊!
有19位网友表示赞同!
看到那么多人评论都觉得很厉害,我倒是觉得没什么特别惊艳的...可能是我对AI视频的要求太高了吧!
有15位网友表示赞同!
我还是更喜欢看真人出演的电影或者电视剧,生成的视频总感觉有一种脱俗感。
有20位网友表示赞同!
说效果超越Gen2,我觉得有点夸张吧?至少我没有看到比Gen2更凄い的地方...
有8位网友表示赞同!