跳至主要內容
长篇解读扩散模型 | Stable Diffusion

前言

本文将解读目前最受欢迎的人工智能图像生成模型之一,稳定扩散模型(Stable Diffusion Models, SD)[1],该模型能够通过简单的文本描述生成出非常真实的描述图像。

先前的扩散模型(Diffusion Model, DM)是将图像形成过程分解为去噪自编码器的连续应用(编码器-解码器), 并且允许一种指导机制来控制图像生成过程,而无需重新训练。但是需要大量的时间和GPU,推理成本高昂

为了提高这类模型的可用性,同时减少其对资源的大量消耗,需要一种方法来降低训练和采样的计算复杂度。


高礼彬大约 14 分钟深度学习计算机视觉扩散模型diffusion modelstable diffusion
长篇解读YOLO系列模型

目标检测的YOLO是一种基于单个神经网络的目标检测系统,由Joseph Redmon和Ali Farhadi等人于2015年提出。

YOLO将目标检测视为一个回归问题,直接预测输入图像中物体的类别和位置,与传统的两阶段目标检测算法(如R-CNN系列)不同, YOLO不需要提前找到可能存在物体的区域,因此具有速度快、实时检测的优点。

YOLOv1解读 [1]


高礼彬大约 21 分钟深度学习目标检测YOLO