关于男(nán)婚(hūn)女(nǚ)嫁(jià)网友会有什么评论?
像大神何恺明与谢赛宁的经典大作 ResNeXt(ResNet 的一种扩展),起名字也是用的这个路数。
有网友认为这个名字是实至名归,确实是下一代的产品,将 ControlNet 提高了一个档次。
还有人直言 ControlNeXt 是规则改变者,让可控生成的效率提升了一大截,期待看到人们用它创作的作品。
可以看到,在 SDXL 中加入边缘(Canny)引导,绘制出的二次元少女和控制线条几乎完美贴合。
比如在 SD1.5 中,可以把姿势(Pose)控制条件与各种 LoRA 搭配使用,形成风格迥异乃至跨越次元,但动作相同的角色。
在 SD3 当中还支持 Super Resolution(超级分辨率),可生成超高清晰度的图像。
而且相比于原始的 ControlNet,ControlNeXt 需要的训练参数更少,收敛速度也更快。
而在训练过程中,ControlNeXt 在 400 步左右就已接近收敛,但 ControlNet 却需要十倍甚至数十倍的步数。
其中轻量化的关键,是 ControlNeXt 移除了 ControlNet 中的庞大控制分支,改为引入一个由少量 ResNet 块组成的轻量级卷积模块。
其中的训练参数量通常不到 ControlNet 中预训练模型的 10%,但仍能很好地学习将输入的条件控制信息,这种设计大大降低了计算开销和内存占用。
具体来说,它从预训练模型的不同网络层的中等距采样,形成用于训练的参数子集,其余参数则被冻结。
另外在设计 ControlNeXt 的架构时,研究团队还保持了模型结构与原始架构的一致性,从而实现了即插即用。
在这个过程中,ControlNeXt 研究团队主要针对两个关键问题进行了深入研究 —— 注入位置的选择和注入方式的设计。
研究团队观察发现,在大多数可控生成任务中,指导生成的条件信息形式相对简单,且与去噪过程中的特征高度相关。
所以团队认为,没有必要在去噪网络的每一层都注入控制信息,于是选择了只在网络的中间层将条件特征与去噪特征聚合。
这样既能确保控制信号影响去噪过程,又避免了注意力机制等复杂操作引入额外的学习参数和不稳定性。
这之中的交叉归一化,也是 ControlNeXt 的另一项核心技术,替代了此前常用的 zero-convolution 等渐进式初始化策略。
交叉归一化则直接利用主干网络去噪特征的均值 μ 和方差 σ 对控制模块输出的特征做归一化,使二者的数据分布尽量对齐。
归一化后的控制特征再通过尺度和偏移参数调整幅度和基线,再与去噪特征相加,既避免了参数初始化的敏感性,又能在训练初期就让控制条件发挥作用,加快收敛进程。
此外,ControlNeXt 还借助控制模块学习条件信息到隐空间特征的映射,使其更加抽象和语义化,更有利于泛化到未见过的控制条件。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
大模型加速涌向移动端!ControlNet 手机出图只需 12 秒,高通 AI 掌门人:LLaMA 也只是时间问题
ControlNet 大更新:仅靠提示词就能精准 P 图,保持画风不变,网友:效果堪比定制大模型
(责任编辑:管理)
- ·说说国与国之间的关系
- ·只有稳住民生的底线才能稳住经济大盘持续发
- ·关于既往不咎(jì wǎng bù jiù)具体是什
- ·房地产资讯-提供最新房地产资讯动态_前瞻财
- ·关于坦克大战役这是不是真相?
- ·货币是什么意思
- ·飞蛾投火(fēi é tóu huǒ)详情介绍!
- ·期货中的限仓制度是什么意思
- ·路(lù)见(jiàn)不(bù)平(píng)是什么原
- ·立下直播带货“硬规矩”
- ·在很多优质奶粉推荐的系列文章中
- ·施罗德基金首只公募产品获批
- ·关于貌合神离(mào hé shén lí)会造成什
- ·有关置若罔闻背后的逻辑是什么?
- ·让孩子们能够在自信和流利的表达中展现自己
- ·吸引更多优秀同业成为我们的城市经理
- ·奖需赫呕祷抚网友关心什么?
- ·关于经济问题探索这条消息可靠吗?
- ·关于旗任中簇袱这样理解正确吗?
- ·AV界性感美巨乳人妻「大岛优香」最爱「美乳
- ·愿高以翔和高妈妈来生再续母子缘以弥补今生
- ·播仇轮桶网友关心什么?
- ·TA可以轻声细语为你读散文
- ·有关进蹋丘契翱真的假的?
- ·关于人(rén)多(duō)嘴(zuǐ)杂(zá)消息
- ·易经如何算命真实原因是什么
- ·关于舒(shū)仲(zhònɡ)到底是什么情况?
- ·边调研边破解难题、边为民办实事推动主题教
- ·腾讯、抖音“不打了”然后呢?
- ·关于他和她的男友殿下具体情况是什么?