EN
www.ytalibaba.com

9·1看短视频清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

9·1看短视频
9·1看短视频嘉兴市海宁区许村镇龙渡社区 钱副书记:公安这边在跟进,我们工作人员也是有去跟公安上沟通这个事情的。这个风筝线的话应该可能是我们这边的居民,他如果说在这个公园里面,放风筝什么的。因为那边现在也没有一个监控,能够给到一个明确的,是说,具体是哪一个人在那边放风筝,然后就是把那个风筝线遗留在树上那样子。然而,尽管产量在下滑,社会库存量仍然在增加。中国酒业协会发布的《2024中国白酒市场中期研究报告》显示,2024年上半年有超过60%经销商表示库存增加。库存压力让经销商的资金周转困难,超过30%经销商表示面临现金流压力,超过50%表示利润空间有所减少。9·1看短视频免费观看已满十八岁电视剧下载安装中国数实融合50人论坛智库专家洪勇认为,由于国补政策强调品牌正规性和供应链保障,这对以自营、正品行货为主的京东形成显著利好。京东正在国补背景下抢占更多市场份额。现行《土地管理法》《城市房地产管理法》《城乡规划法》《城镇国有土地使用权出让和转让暂行条例》等法律法规均要求,改变土地建设用途的,应当经过人民政府自然资源主管部门的同意。
20250815 👙 9·1看短视频财联社6月16日电,据CCTV国际时讯报道,当地时间6月15日,据美联社援引一位知情美国官员的话报道称,美国总统特朗普否决了以色列向美国提出的“刺杀伊朗最高领袖哈梅内伊”的计划。据这名知情官员透露,特朗普政府认为刺杀哈梅内伊将加剧冲突。以色列总理内塔尼亚胡当天在接受美国福克斯新闻网采访时被问及相关计划。内塔尼亚胡没有直接回应,但他表示,他认为以色列“会做需要做的事”,他认为美国“知道什么对美国有利”。此外,内塔尼亚胡还称,伊朗将特朗普视为其核计划的威胁和“头号敌人”,并计划暗杀特朗普。九十九夜xbox360据此前消息称,曼联从布伦特福德签下姆贝乌莫的交易已接近完成。曼联本周早些时候提交了一份超过6000万英镑的改进报价,而这位25岁喀麦隆前锋在几周前就已经与曼联就个人条款达成协议。
9·1看短视频
📸 曹永强记者 李锁群 摄
20250815 👀 9·1看短视频据此前媒体报道,美国移民与海关执法局等联邦机构6日和7日出动大批执法人员,在洛杉矶县多地展开针对非法移民的搜捕行动,连续两日与当地社区居民发生严重冲突。女性一晚上3次纵欲导致不孕值得注意的是,轻量级眼镜市场的增长还得益于大模型的快速发展,通义千问、DeepSeek、文心大模型等模型是现阶段AI眼镜产品的主流底层大模型。
9·1看短视频
📸 刁凤岩记者 王进福 摄
🍆 凭借出色的表现,尼科-威廉姆斯在今夏再次吸引了巴萨的关注,巴萨重新将其视为引援目标。但毕尔巴鄂竞技俱乐部对这种公开接触感到不满,因为巴萨不想支付球员的5800万欧元全额解约金,而是用这种公开会面的方式施加压力。《每日体育报》称,德科和球员经纪人的这次会面并没有带来帮助,尤其是毕尔巴鄂竞技方面希望会面应该保密,而不是被泄露给媒体。ysl水蜜桃86满十八岁还能用吗
扫一扫在手机打开当前页