本文介绍: 利用DDIM Inversion做图像重建或图像编辑任务时,直接做有条件的DDIM重建会导致误差累积,从而导致重建结果逐渐偏离原图像;现有的图像编辑方法大多需要对模型进行微调,或对模型权重、内部结构等进行优化,操作起来比较复杂。本文方法:null–text inversion首先对输入图像提取caption,然后在每个采样时间步t,都利用以下损失函数对null–text embedding进行优化,最终得到每个采样时间节点t所对应的优化后的null–text embedding,并实现对图像的重建和编辑
一、论文信息
论文链接:https://arxiv.org/pdf/2211.09794.pdf
代码链接:https://github.com/google/prompt–to–prompt
二、Conditional Diffusion(classifier–free guidance)
三、DDIM Inversion
四、Null–text Inversion
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。