百度出手, 330元拍科幻大片
记者/ 何己派 编辑/ 鄢子为
百度加入混战,进入视频生成大模型赛道。
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型,宣布完成重大升级,全面开放Turbo版、Lite版、Pro版及有声版。
7月初,百度蒸汽机视频生成模型首次亮相,不到50天的时间里,2.0版本火速空降,且全系开放,速度惊人。
公司介绍其为“全球首个中文音视频一体化生成的I2V模型”,支持环境音效以及多角色语音的一体化生成。
这意味着,AIGC视频创作,可告别后期配音,使用一张图+提示词,就能实现对视听语言的想象。
至于价格,百度先卖了个关子。
发布会上,公司请来视效指导姚骐,现场分享其用蒸汽机模型制作的科幻短片《归途》。
姚骐曾参与《2012》《黑客帝国3》《变形金刚3》等多部好莱坞电影及国产科幻剧《三体》的视效工作。
他提到,如果是纯实拍或CG制作这样一部短片,成本可能要几百万元,用AI来做,其40多个镜头,每个镜头生成3次,共用AI生成120多个片段素材,成本约330元。
百度随后公布价格:采用梯度会员制,价格为同类产品的70%。比如,蒸汽机Turbo有声版价格为2.5元/秒,限时优惠两周1.4元/5秒。
会后接受《21CBR》等媒体采访时,百度副总裁、移动生态商业体系负责人陈一凡提到,价格能往下压缩,在于两个结合,一是整个策略与工程的架构结合,二是与底下算力的结合。
“(刊例价)从2块钱降到1块4,生成一条视频,也不能算非常便宜,我们还会继续优化成本。”陈一凡认为,包括百度在内的玩家,都会继续降价。
“价格降到一定程度,大家都有经营压力。这个压力有的会通过价格来解决,有的靠其他收益来解决,这就是商业模式的不同了。”他补充道。
前沿技术布局方面,百度商业研发首席架构师李双龙提到几点,包括AI视频实时生成、长视频生成、视频本身的可交互等。
“为什么现在视频只能做5秒到10秒,本质是技术架构导致的。当下以扩散模型为主,这种架构下,并不适合做无限时的视频生成。”李双龙表示,百度正在研究下一代的技术架构方向。