5月11日消息,数字时代,人工智能技术的快速发展正在为各行各业带来翻天覆地的变革。在设计领域,AI的应用日益广泛,不仅赋予了专业人士更多创造力,更为普通人提供了表达创意的机会。
5月10日,腾讯混元产品负责人陈妍披露了混元大模型在设计领域的一些应用,以及在腾讯业务场景下的最新技术进展。
据陈妍介绍,在AI设计领域,除了文生文这一最基础的能力,腾讯还在进行文生图、文生视频、文生3D的多模态探索。
文生图方面,腾讯混元大模型和国外不一样的地方在于本土化,特别是在很多应用场景上面,用SDI、MDI等。欧美对中国很深度的历史文化的元素理解上是欠缺的,不管是广告还是游戏,让他们做一个古代元素是没有办法很好表现的,相较之下,混元大模型有比较突出的能力。
去年10月,腾讯混元大模型全新升级,正式对外开放 “文生图” 功能。官方公告称,升级后的腾讯混元中文效果整体超过 GPT-3.5,代码能力大幅提升 20%,达到业界领先水平。
陈妍指出,目前文生图已经深度应用在B端和C端,比如创意广告、人像风格化等。陈妍透露,下周腾讯将在北京举办发布会,宣布文生图能力开源。
文生视频方面,2月Sora的发布,给了业内很大震撼。陈妍表示,根据算法路径重新看我们文生视频的能力,时空扩散和解码不一样,可以把视频拉的很长,之前能够做到4秒,这个月我们可以做多16秒,整个过程非常不容易。
除了文生视频,腾讯混元大模型现在还可以做图生视频、视频生视频,具体落地上,可以把实拍图片变成卡通、脸土风或者其他风格,可以局部做替换,还有骨骼驱动视频等。
文生3D方面,现在还没有很广泛的应用,但腾讯已经提前做了一些研究。陈妍认为,文生3D跟生视频、生图比较不一样的点是它生成出来的模型可以再编辑,就是导到3D的编辑工具里面重新做调整。“现在我们也想尝试3D人物的应用,手伴这些东西还是蛮火的。”
最新数据显示,腾讯混元大模型目前已扩展至万亿级参数规模,自上线起即突出其实用性标签,腾讯内部已经有超过400个业务和场景接入混元大模型进行测试,部分已经发布。
陈妍向TechWeb等表示,“目前,大模型国内能力评测中,混元在第一梯队。中文领域能够赶上GPT的水平了,希望对中国的大模型技术越来越有信心。”
据悉,为了激发公众对科技和设计的兴趣,借助AI工具探索人工智能与人类创造力结合的新可能性,腾讯研究院联合清华大学建筑学院、中央广播电视总台央广网联合发起了腾讯未来城市AI创意设计大赛。5月10日,大赛征集活动已经正式启动。
此次大赛征集活动以腾讯深圳前海总部园区科创街区为主题,大赛面向对建筑设计、城市规划、艺术创作、科幻、人工智能感兴趣的公众,征集具有丰富想象力与创新性的城市建成环境场景设计、装置与小品设计、平面视觉设计。
“这应该算是一个实验。”腾讯集团副总裁、腾讯研究院总顾问杨健说到,我们选择在一个特定场景里面,把人工智能的一些新的技术,新的工具拿来,把城市规划、城市设计的专业人士以及对人工智能有兴趣的爱好者召集起来,让大家去了解怎么用这些技术提高规划设计的效率,也希望在这个过程中,能够进一步把腾讯混元大模型具备的能力和理念更好的落地。
作为新一轮科技革命和产业变革的重要驱动力量,人工智能技术发展正在按下“快进键”,给人们带来了无限想象的空间。国际建筑师协会副主席、清华大学建筑学院院长、教授张利表示,AI带给所有的学科和行业的挑战是众所周知的,在我国高质量城市更新的今天,数据与计算技术以及潜在的规划新范式涌现,建筑行业正站在新的历史起点上。虽然我们还远不能肯定AI带来怎样的具体改变,但我们拥抱AI带来的全新可能性,更期待这次竞赛,通过AI能够连接不同的人群,共同为高质量的城市更新贡献智慧。