北京快手科技有限公司近日宣布,其自主研发的视觉生成大模型可灵AI(Kling)API完成了新一轮的能力升级。升级后的可灵AI API在虚拟试穿和对口型两大功能上实现了显著进步,为电商、广告营销、泛娱乐及AI工具领域的客户提供了更为强大的技术支持。
在虚拟试穿领域,可灵AI的V1.5模型不仅能够处理单个服装的输入,还新增了对“上装+下装”组合服装的支持。这一升级使得系统能够精确捕捉并保留服装的每一个细节,结合图生视频功能,用户可以生成自然流畅的试衣视频,极大地提升了虚拟试穿体验的真实感和实用性。
此外,可灵AI的对口型能力也全面开放,能够基于本地配音或歌唱文件,以及在线生成的配音,实现与视频中人物口型的完美同步。这一功能使得生成的视频画面栩栩如生,达到了真人说话或唱歌的效果,为视频内容创作带来了新的可能性。
快手科技有限公司表示,这些升级将助力企业用户在业务增长上迈出新的步伐,同时也展现了可灵AI在视觉生成领域的强大实力和创新能力。通过这些新功能,用户可以轻松高效地完成各种艺术创作,推动视觉内容的创新和发展。