开云集团「中国」Kaiyun·官方网站-开云体育(中国)官方网站不外此类模子并不常见-开云集团「中国」Kaiyun·官方网站

开云体育(中国)官方网站不外此类模子并不常见-开云集团「中国」Kaiyun·官方网站

发布日期:2025-06-25 05:54  点击次数:61

开云体育(中国)官方网站不外此类模子并不常见-开云集团「中国」Kaiyun·官方网站

IT之家 6 月 24 日讯息,业界常常使用扩散模子或自归来模子来研发 AI 生图模子开云体育(中国)官方网站,苹果公司近期发布的论文深入该公司正在聘请一条被“淡忘”的归一化流(Normalizing Flows)时候途径研发相应模子。

据先容,这一“归一化流”时候是一种通过学习数学变换的形态,将果然寰宇的数据(如图像)诊治成结构化噪声,并再将噪声回复为图像样本的生成模子。其最大上风是大致精准盘算生成图像的概率,这是扩散模子无法作念到的。这一特质使得归一化流在对概率条目较高的任务中具有特有迷惑力。不外此类模子并不常见,原因在于其研发本钱更高,同期早期领受畸形令候生成的模子时常相对隐晦、穷乏细节。

IT之家参考苹果公司《Normalizing Flows are Capable Generative Models》论文,其推出一种名为 TarFlow(Transformer AutoRegressive Flow)的新式归一化流时候模子,该模子的中枢念念路是将一张待生成的大图拆成“小区块”,再以相应区块为单元进行生成一系列像素值,每一块图像像素值的生成齐依赖于前边已生成的部分,继而变成圆善的图像,因此大致有用幸免图像被压缩为固定词汇表时产生的质料亏本与进展僵化的问题。

固然,TarFlow 在生成高区别率图像方面仍存在局限,这就引出了第二篇盘考《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

参考这篇论文,苹果在 TarFlow 的基础上进一步提议了增强版块:STARFlow(Scalable Transformer AutoRegressive Flow)。

该模子最大的改造在于,它不再凯旋在像素层面生成图像,而是在“潜空间”(latent space)中职责,领先生成图像的压缩暗意,再通过解码器进行放大回复。因此模子可不消再瞻望数百万个像素值,而是先管制图像的大体结构,细节部分留给解码器进行补充,从而在不亏本质料的前提下培育生成恶果。

此外开云体育(中国)官方网站,STARFlow 还改造了对文本辅导的管制形态。它不再内建专用文本编码器,而是相沿调用现存道话模子(举例谷歌推出的小道话模子 Gemma,表面上不错凯旋在建立上运转)来管制用户的道话指示。这么一来,模子的图像生成部分不错专注于图像细节的生成与优化。



相关资讯
热点资讯
  • 友情链接:

Powered by 开云集团「中国」Kaiyun·官方网站 @2013-2022 RSS地图 HTML地图