首页 > 游戏资讯 > 游戏攻略

突破Gen2！字节推出全新视频生成模型，绿巨人VR眼镜体验升级

发布时间：2024-10-16浏览：55

各位老铁们，大家好，今天由我来为大家分享突破Gen2！字节推出全新视频生成模型，绿巨人VR眼镜体验升级，以及的相关问题知识，希望对大家有所帮助。如果可以帮助到大家，还望关注收藏下本站，您的支持是我们最大的动力，谢谢大家了哈，下面我们开始吧！

一句话，就让绿巨人戴上VR眼镜。

4K画质那种。

熊猫的奇幻漂流~

这是字节最新的AI视频生成模型MagicVideo-V2，各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率，轻松hold各种绘图风格。

△从左往右：油画风、赛博风、设计风

测评效果超过Gen-2、Pika以及现有AI视频生成工具。

结果上线不到24小时就引发众人围观，比如一条推文就有近20万浏览量。

不少网友惊讶其效果，甚至直言：比runway和pika还要好。

“比runway和pika还要好”

研究人员也的确进行了实际的效果比较。选手分别为：MagicVideo-V2、StabilityAI的SVD-XT，新潜力玩家Pika1.0，以及Runway的Gen-2。

第一轮：光影效果。

夕阳西下，旅行者独自行走在迷雾森林中。

（从左到右依次是：MagicVideo-V2、SVD-XT，右上Pika，右下Gen-2，下同）

可以看到，MagicVideo-V2、Gen-2和Pika都有明显的光影。不过Pika看不出是为旅行者，MagicVideo-V2的色调更为丰富。

第二轮：情境剧情的表达。

1910 年代的情景喜剧，讲述社会中的日常生活和琐事

这一轮明显也是MagicVideo-V2、Gen-2更胜一筹。SVD-XT呈现的中景构图，虽然年代体现出来了，但表达不够。

第三轮：写实。

小男孩在公园的小路上骑着自行车，车轮踩在碎石上发出嘎吱嘎吱的声音.

这次对比就更为明显了。MagicVideo-V2和SVD-XT是完整体现出句子意思的，不过MagicVideo-V2可以看到小孩明显脚在动的细节。

除此之外，研究人员还将MagicVideo-V2与当下最先方法进行一对一的人类评估。

结果显示，相较于其他方法，人们认为MagicVideo-V2的效果更好。

（绿色、灰色和粉色条分别代表 MagicVideo-V2 被评价为更好、相当或较差的试验效果。）

如何实现？

简单来说，MagicVideo-V2是一条视频生成流水线，集成了文本到图像模型、视频运动生成器、参考图像嵌入模块、插值模块。

首先是有T2I模块首先根据文字生成1024×1024图像，随后I2V模块对该静态图像进行动画处理，生成600×600×32的帧序列，然后再用V2V模块增强，并完善视频内容，最后再用插值模块将序列扩展到94个帧。

这样一来，既保证了高保真，时间上也有连续性。

不过早在2022年11月字节曾推出了MagicVideo V1版。

不过，当时更强调的是高效性，它能在单个GPU卡上生成256x256分辨率的视频。

参考链接：https://twitter.com/arankomatsuzaki/status/1744918551415443768?s=20项目链接：https://magicvideov2.github.io/论文链接：https://arxiv.org/abs/2401.04468https://arxiv.org/abs/2211.11018

— 完 —

量子位 QbitAI · 头条号签

用户评论

高冷低能儿

太厉害了！之前看AI生成的视频还是挺生硬的，现在能做到让绿巨人戴VR眼镜这种效果，太酷了吧！真期待未来AI能做更多有意思的事！

有15位网友表示赞同！

寒山远黛

确实很惊艳！我一直觉得生成模型在视频方面进展很快，这个字节的新技术简直是又迈上了一个台阶。希望能看到更多使用场景!

有14位网友表示赞同！

墨染天下

这效果也太好了吧！一句话就能生成这样的视频，完全颠覆了我的认知！未来我们是不是都可以轻松玩一些特效、动画什么的？

有7位网友表示赞同！

铁树不曾开花

虽然看着很厉害，但我还是比较担心AI带来的问题，比如会不会被滥用用来制作假新闻啊。希望相关部门能加强监管，避免负面影响。

有8位网友表示赞同！

太难

这视频看得我有点慌啊...感觉将来越来越不分清是真是假了，真假难辨可不是个好事呀！

有15位网友表示赞同！

那伤。眞美

效果确实不错，但我更想知道这个模型是怎么实现的？字节是不是能开源部分代码给我们研究一下？我很想深入了解它的技术原理。

有10位网友表示赞同！

颜洛殇

这都2023年了，视频生成AI越来越牛逼了！我以前就觉得人工智能会改变世界，现在看来我的想法是对的！

有8位网友表示赞同！

棃海

感觉这种技术还是比较偏向于娱乐吧？对实际生产或者生活场景的帮助似乎没那么大。

有17位网友表示赞同！

夏以乔木

如果能把这个技术应用到教育领域，那岂不是太棒了！我们可以轻松制作各种教学视频，让学习更加生动有趣！

有18位网友表示赞同！

你的眸中有星辰

我一直觉得人工智能最应该被开发的是医疗、环境保护等方面，这种生成模型虽然厉害，但也更像是一种玩物。希望科技进步能够真正造福人类。

有20位网友表示赞同！

一生荒唐

说句实话，我还是比较喜欢传统的视频制作，那种手工的感觉更有温度。AI生成的视频虽然技术先进，但我感觉少了点人情味

有19位网友表示赞同！

命该如此

我真佩服字节研发团队的脑洞！把绿巨人戴VR眼镜这个创意想出来就很厉害了！我相信未来会有更多更让人惊喜的效果出现!

有6位网友表示赞同！

温柔腔

一句话让绿巨人戴VR眼镜？这听起来像魔法一样不可思议! 希望这种科技能被更多人掌握，创造更多美好的事物！

有10位网友表示赞同！

若他只爱我。

我也想试试这个模型！看看能不能自己生成一个视频！感觉很酷炫啊！

有19位网友表示赞同！

Edinburgh°南空

看到那么多人评论都觉得很厉害，我倒是觉得没什么特别惊艳的...可能是我对AI视频的要求太高了吧!

有15位网友表示赞同！

半梦半醒半疯癫

我还是更喜欢看真人出演的电影或者电视剧，生成的视频总感觉有一种脱俗感。

有20位网友表示赞同！

。婞褔ｖīｐ

说效果超越Gen2，我觉得有点夸张吧？至少我没有看到比Gen2更凄い的地方...

有8位网友表示赞同！

热点资讯