今日,北京生数科技宣布AI视频生成模型 Vidu 官网全球上线。Vidu 是一个利用人工智能技术,通过文本或图片生成视频的模型。
今年4月,生数科技与清华大学联合发布了中国首个视频大模型——"Vidu",这标志着中国在视频生成技术方面迈出了重要一步。
"Vidu"采用了团队原创的U-ViT架构,该架构融合了Diffusion和Transformer技术。这一创新的视频大模型能够快速生成长达16秒、1080P高清视频,同时在模拟真实物理世界的基础上,展现出极高的想象力和创造力。其多镜头生成能力和时空一致性是"Vidu"的显著特点。
自发布以来,"Vidu"在全球范围内取得了显著的突破,其性能已经达到了国际顶尖水平,并仍在不断地迭代和优化。这一成就得益于团队在贝叶斯机器学习和多模态大模型领域的深厚积累,以及多项原创性成果。
凭借对U-ViT架构的深入理解和丰富的工程、数据经验,团队迅速攻克了长视频表示与处理的关键技术难题,成功研发出了"Vidu"视频大模型。"Vidu"在提升视频连贯性和动态性方面取得了显著成果,推动了视频处理技术的发展。