AI闯进设计圈腾讯混元大模型最新技术进展披露

来源：techWeb 更新时间2024-05-13 08:49:17 点击数：

5月11日消息，数字时代，人工智能技术的快速发展正在为各行各业带来翻天覆地的变革。在设计领域，AI的应用日益广泛，不仅赋予了专业人士更多创造力，更为普通人提供了表达创意的机会。

5月10日，腾讯混元产品负责人陈妍披露了混元大模型在设计领域的一些应用，以及在腾讯业务场景下的最新技术进展。

据陈妍介绍，在AI设计领域，除了文生文这一最基础的能力，腾讯还在进行文生图、文生视频、文生3D的多模态探索。

文生图方面，腾讯混元大模型和国外不一样的地方在于本土化，特别是在很多应用场景上面，用SDI、MDI等。欧美对中国很深度的历史文化的元素理解上是欠缺的，不管是广告还是游戏，让他们做一个古代元素是没有办法很好表现的，相较之下，混元大模型有比较突出的能力。

去年10月，腾讯混元大模型全新升级，正式对外开放 “文生图” 功能。官方公告称，升级后的腾讯混元中文效果整体超过 GPT-3.5，代码能力大幅提升 20%，达到业界领先水平。

陈妍指出，目前文生图已经深度应用在B端和C端，比如创意广告、人像风格化等。陈妍透露，下周腾讯将在北京举办发布会，宣布文生图能力开源。

文生视频方面，2月Sora的发布，给了业内很大震撼。陈妍表示，根据算法路径重新看我们文生视频的能力，时空扩散和解码不一样，可以把视频拉的很长，之前能够做到4秒，这个月我们可以做多16秒，整个过程非常不容易。

除了文生视频，腾讯混元大模型现在还可以做图生视频、视频生视频，具体落地上，可以把实拍图片变成卡通、脸土风或者其他风格，可以局部做替换，还有骨骼驱动视频等。

文生3D方面，现在还没有很广泛的应用，但腾讯已经提前做了一些研究。陈妍认为，文生3D跟生视频、生图比较不一样的点是它生成出来的模型可以再编辑，就是导到3D的编辑工具里面重新做调整。“现在我们也想尝试3D人物的应用，手伴这些东西还是蛮火的。”

最新数据显示，腾讯混元大模型目前已扩展至万亿级参数规模，自上线起即突出其实用性标签，腾讯内部已经有超过400个业务和场景接入混元大模型进行测试，部分已经发布。

陈妍向TechWeb等表示，“目前，大模型国内能力评测中，混元在第一梯队。中文领域能够赶上GPT的水平了，希望对中国的大模型技术越来越有信心。”

据悉，为了激发公众对科技和设计的兴趣，借助AI工具探索人工智能与人类创造力结合的新可能性，腾讯研究院联合清华大学建筑学院、中央广播电视总台央广网联合发起了腾讯未来城市AI创意设计大赛。5月10日，大赛征集活动已经正式启动。

此次大赛征集活动以腾讯深圳前海总部园区科创街区为主题，大赛面向对建筑设计、城市规划、艺术创作、科幻、人工智能感兴趣的公众，征集具有丰富想象力与创新性的城市建成环境场景设计、装置与小品设计、平面视觉设计。

“这应该算是一个实验。”腾讯集团副总裁、腾讯研究院总顾问杨健说到，我们选择在一个特定场景里面，把人工智能的一些新的技术，新的工具拿来，把城市规划、城市设计的专业人士以及对人工智能有兴趣的爱好者召集起来，让大家去了解怎么用这些技术提高规划设计的效率，也希望在这个过程中，能够进一步把腾讯混元大模型具备的能力和理念更好的落地。

作为新一轮科技革命和产业变革的重要驱动力量，人工智能技术发展正在按下“快进键”，给人们带来了无限想象的空间。国际建筑师协会副主席、清华大学建筑学院院长、教授张利表示，AI带给所有的学科和行业的挑战是众所周知的，在我国高质量城市更新的今天，数据与计算技术以及潜在的规划新范式涌现，建筑行业正站在新的历史起点上。虽然我们还远不能肯定AI带来怎样的具体改变，但我们拥抱AI带来的全新可能性，更期待这次竞赛，通过AI能够连接不同的人群，共同为高质量的城市更新贡献智慧。

Chat AI人工智能中文在线使用

专业AI论文生成器一键生成万字论文只需5分钟