字节跳动发布Infinity：自回归文生图新突破，性能超越扩散模型

来源：AIbase基地更新时间2025-01-03 17:31:34 点击数：

在人工智能领域，字节跳动商业化技术团队的最新成果Infinity模型，以其卓越的性能和创新的技术，成为自回归文生图领域的新王者。这款新开源的模型不仅在图像生成质量上超越了Stable Diffusion3，还在推理速度上展现了显著优势。

Infinity模型的核心创新在于采用了Bitwise Token的自回归框架，这一框架通过预测下一级分辨率的+1或-1构成的细粒度“Bitwise Token”，显著提升了模型对高频信号的捕捉能力，从而生成细节更加丰富的图像。此外，Infinity模型将词表扩展到无穷大，极大地增强了Image tokenizer的表示空间，提高了自回归文生图的性能上限。

在性能对比中，Infinity模型在自回归方法中表现突出，远超HART、LlamaGen、Emu3等方法，并在人类评测中以接近90%的胜率击败了HART模型。同时，Infinity也以75%、80%、65%的胜率击败了SOTA的扩散模型如PixArt-Sigma、SD-XL、SD3-Meidum等，证明了其在同尺寸模型中的优势。