首页 > 浏览器指南> 技巧攻略 > 谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频

来源:chrome官网2024-01-29

详情介绍 m详情介绍

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频。谷歌推出的AI扩散模型Lumiere将为我们打开全新的视觉世界。它让我们能够通过文字来创造和表达丰富多样的动作视频,从而改变我们与视频内容的互动方式。随着技术的不断进步和应用场景的拓展,我们期待看到更多由Lumiere模型带来的创意和惊喜。

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频1

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频

谷歌表示,业界绝大多数“文生视频”模型无法生成时间长、质量佳、动作连贯逼真的内容,这是因为此类模型通常“分段生成视频”,首先产生几张关键帧,接着用“时间超级分辨率(Temporal Super-Resolution)”技术,生成关键帧之间的视频文件,这种方法虽然能够节省 RAM,但难以生成“连贯逼真”的视频。

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频2

谷歌提到,他们的新模型 Lumiere 相对于业界模型最大的不同是采用了全新“Space-Time U-Net”基础架构,该架构能够在空间和时间上同时“降采样(Downsample)”信号,从而在“更紧凑的时空中进行更多运算”,令 Lumiere 生成持续时间更长、动作更连贯的视频。

本站注意到,Lumiere 一次可以生成 80 帧视频(16FPS 下 5 秒视频 / 24FPS 下约 3.34 秒视频),虽然这一数据看起来很短,不过研究人员提到,5 秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频3

除了应用“Space-Time U-Net”基础架构外,谷歌还介绍了 Lumiere 的基础特性,该 AI 建立在一个经过预先训练的“文生图”模型基础上,研究人员首先让基础模型生成视频分帧的基本像素草稿,接着通过空间超分辨率(SSR)模型,逐步提升分帧分辨率及细节,并利用“Multidiffusion”通用生成框架提升模型稳定性,从而保证了最终输出的视频一致性和连续性。

谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频4

上述就是浏览器之家分享的【谷歌推出最新AI扩散模型Lumiere:可将文字转化为连贯的动作视频】全部内容,感谢大家的关注和阅读!

继续阅读 m继续阅读
google Chrome浏览器性能优化实操方法详细,用户可通过设置和操作优化浏览器性能,提高运行速度和网页加载效率。 2026-03-04 谷歌Chrome浏览器轻量版提供完整快速安装流程,用户可高效完成安装操作,节省系统资源,保证流畅使用。 2026-02-23 谷歌浏览器下载安装后提供首次设置引导,帮助用户快速完成基础配置,包括同步账号、隐私设置和界面调整,优化浏览器使用体验。 2026-02-28 google Chrome浏览器标签页分组功能能提升整理体验,本教程结合效率测试展示效果,帮助用户实现更高效的页面管理。 2026-03-02 google浏览器支持标签页自动分组功能,方便分类管理。本文提供详细使用攻略和技巧,帮助用户提升浏览器标签管理效率。 2026-03-22 谷歌浏览器下载文件被清理软件误删时,用户可通过恢复工具找回丢失的安装包或重新下载安装,确保文件完整。 2026-03-28 Chrome浏览器下载及安装过程中积累的实用技巧可提升效率,文章总结相关操作经验,帮助用户更好地完成安装流程并避免常见问题。 2026-03-25 Chrome浏览器快捷操作可提高操作效率。文章总结应用经验,帮助用户熟练使用快捷键,实现高效浏览和办公。 2026-04-14 谷歌浏览器智能填表功能优化使用案例展示,通过自动填写和自定义设置,提高表单操作效率,为用户提供便捷体验。 2026-04-11 针对谷歌浏览器插件权限被系统限制问题,提供实用破解方法与权限冲突解决技巧,助力用户恢复插件全部功能,提升浏览器使用自由度。 2026-03-21
相关文章 m相关文章
教程 指南 技巧 问答 专题
返回顶部