DeepMind谷歌研究员力荐：扩散模型效率&生成质量提升窍门( 二 ) _神经网络

作者的第三组贡献主要为分数建模（score-modeling）神经网络的训练。
这部分继续依赖常用的网络体系结构（DDPM、NCSN），作者通过对扩散模型设置中网络的输入、输出和损失函数的预处理进行了原则性分析，得出了改进训练动态的最佳实践。
比如使用依赖于σ（noise level）的跳跃连接对神经网络进行预处理，使其能够估计y（signal）或n（noise），或介于两者之间的东西。
下表具体展示了模型彩英不同训练配置得到的FID分数。

文章插图

作者从基线训练配置开始，使用确定性采样器（称为配置A），重新调整了基本超参数（配置B），并通过移除最低分辨率层，并将最高分辨率层的容量加倍来提高模型的表达能力（配置C）。
然后用预处理（配置D）替换原来的{cin，cout ， cnoise，cskip}选项。这使结果基本保持不变，但VE在64×64分辨率下有很大改善。该预处理方法的主要好处不是改善FID本身，而是使训练更加稳健，从而将重点转向重新设计损失函数又不会产生不利影响。
【DeepMind谷歌研究员力荐：扩散模型效率&生成质量提升窍门】VP和VE只在Fθ的架构上有所不同（配置E和F）。
除此之外，作者还建议改进训练期间的噪声级分布，并发现通常与GANs一起使用的无泄漏风险增强（non-leaking augmentation）操作也有利于扩散模型。
比如从上表中，我们可以看到：有条件和无条件CIFAR-10的最新FID分别达到了1.79和1.97，打破了之前的记录（1.85和2.1046）。
更多细节欢迎查看论文原文：
https://arxiv.org/abs/2206.00364
参考链接：
https://twitter.com/sedielem/status/1532466208435494930?s=12&t=Uzg6OWwe5AgXHSBrzlnFrg

DeepMind谷歌研究员力荐：扩散模型效率&生成质量提升窍门( 二 )

相关经验推荐

床上表现不好对床上那事越来越不感兴趣怎么回事

电吹风的另类妙用有哪些

三国杀十大感人台词三国杀十大感人台词分别是什么

电饼铛做菜盒子不硬的窍门电饼铛做菜盒子不硬怎么做

泽塔奥特曼捷德是什么形态捷德奥特曼形态介绍

阴阳师妖怪屋微信每日宝箱答案是什么阴阳师妖怪屋3月15日每日宝箱答案一览

水产芽孢杆菌的作用与功效

如何进行大蒜的选留种和提纯复壮大蒜留种技术

小舞|斗罗动画22年6月完结？只余下“3篇章39集”，这集数不够演吧

鬼灭之刃|鬼灭之刃最强法王童磨和战士猗窝座联手，可打败最强剑士黑死牟吗

暗黑2重制版：2.4冲天梯必备神器，商店可白嫖，每日免费一小时

七雄争霸怎么给自己倒酒

揭秘：这个小镇为何人去世后要改姓？

DOINB说对了,RNG新版本首战获胜,别人在练版本,RNG在等版本

电脑关机后键盘灯还亮怎么回事

甘肃庆阳市有哪些特色美食小吃？甘肃省庆阳市特色美食

地下城勇士怎么去刷深渊，地下城怎么才能刷深渊

我的世界瓦的制作方法我的世界仿真瓦片怎么制作

朝天椒如何打枝朝天椒还要整枝打叉吗

《卓娅：天界姐妹》将于2022年2月8日发售

DeepMind谷歌研究员力荐：扩散模型效率&amp;生成质量提升窍门( 二 )

相关经验推荐

DeepMind谷歌研究员力荐：扩散模型效率&生成质量提升窍门( 二 )