新研究揭示AI模型隐藏能力：拥有超越常规提示的学习潜力

来源：互联网更新时间2024-11-20 11:34:52 点击数：

近期，一项新的研究方法揭示了 AI 模型在学习过程中潜在的能力，超出了人们之前的预期。研究人员通过分析 AI 模型在 “概念空间” 中的学习动态，发现了如何让 AI 系统更好地理解和生成图像。

图源备注:图片由AI生成，图片授权服务商Midjourney

“概念空间” 是一种抽象的坐标系统，能够表示训练数据中每个独立概念的特点，比如物体的形状、颜色或大小。研究者表示，通过在这个空间中描述学习动态，可以揭示出概念学习的速度，以及学习顺序受数据属性的影响，这一属性被称为 “概念信号”。这个概念信号反映了数据生成过程对概念值变化的敏感度。例如，当数据集中红色和蓝色之间的差异明显时，模型对颜色的学习速度会更快。

在研究过程中，研究团队观察到模型的学习动态会出现突然的方向变化，从 “概念记忆” 转向 “泛化”。为了验证这一现象，他们训练了一个模型，输入了 “大的红色圆圈”、“大的蓝色圆圈” 和 “小的红色圆圈”。在训练中未出现的 “蓝色小圆圈” 组合，模型无法通过简单文本提示生成。但是，使用 “潜在干预” 技术（即操控模型中负责颜色和大小的激活）和 “过度提示” 技术(即通过 RGB 值增强颜色规格)，研究者成功生成了 “蓝色小圆圈”。这表明，尽管模型能够理解 “蓝色” 和 “小” 的组合，但它并未通过简单的文本提示掌握这一能力。

研究人员还将这一方法扩展到实际数据集，例如 CelebA，它包含多种面部图像属性如性别和微笑。结果显示，模型在生成微笑女性图像时表现出隐藏能力，而在使用基本提示时则显得乏力。此外，初步实验还发现，使用 Stable Diffusion1.4时，过度提示可以生成不寻常的图像，如三角形的信用卡。

因此，研究团队提出了一种关于隐藏能力的普遍假设:生成模型具备潜在能力，这些能力在训练过程中突然且一致地出现，尽管模型在面对普通提示时可能不会表现出这些能力。

Chat AI人工智能中文在线使用

专业AI论文生成器一键生成万字论文只需5分钟