Vidu-国内首个可生成30秒1080p超清视频大模型


Vidu是北京生数科技有限公司联合清华大学发布的中国首个长时长、高一致性、高动态性视频大模型,于2024年4月27日在中关村论坛未来人工智能先锋论坛上发布,2024年7月30日,Vidu上线。

项目地址:https://www.vidu.studio/

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率达1080P的高清视频内容。

项目介绍:

Vidu模型采用团队原创的Diffusion与Transformer融合的架构U-VT,支持一键生成长达16秒、分辦率高达1080P的高清视频内容。

Vidu开放了文生视频、图生视频两大核心功能,提供4s和8s两种时长选择,分辨率最高达1080P。效果方面,Vidu在延续高动态性、高逼真度、高一致性等基础上,新增了角色一致性、动漫风格、文字与特效画面生成等能力。Vidu实测推理速度为生成一段4秒片段需要30秒。

使用方法:

1、如何使用“文生视频”?

2、如何使用“图生视频(用作起始帧)”?

3、如何使用“参考人物角色生成视频”?