前言
本文将解读目前最受欢迎的人工智能图像生成模型之一,稳定扩散模型(Stable Diffusion Models, SD)[1],该模型能够通过简单的文本描述生成出非常真实的描述图像。
先前的扩散模型(Diffusion Model, DM)是将图像形成过程分解为去噪自编码器的连续应用(编码器-解码器), 并且允许一种指导机制来控制图像生成过程,而无需重新训练。但是需要大量的时间和GPU,推理成本高昂
为了提高这类模型的可用性,同时减少其对资源的大量消耗,需要一种方法来降低训练和采样的计算复杂度。
大约 14 分钟