电子包浆技术:如何利用AI反向压缩图片并探索赛博做旧效果

日期: 2025-02-11 15:06:06|浏览: 232|编号: 93374

友情提醒:信息内容由网友发布,本站并不对内容真实性负责,请自鉴内容真实性。

Lenna(左)的原始图片,Lenna,带有“电子铜绿”(右)图片来源:电子铜绿图片网络旧/魔术海螺实验室

如果您反向使用 AI,可以压缩图片吗?

|撰写王

评论|

每当我在互联网上看到有趣的表情符号和模因时,许多人都会暗中说:“您的照片非常好,但现在它属于我的。”

但是,当人们再次将“被盗”图片传递给其他帖子时,在线平台通常会再次压缩图片,节省存储空间和网络带宽。如果图形被“窃取”过多,则将多次重复压缩。每次压缩时,图像质量都会有所下降,变得更加“模糊” - 甚至变得更绿色和黑暗。被“偷走”多次的图片会变成绿色,甚至成为模因,甚至诞生一系列具有松弛图像质量的表情符号。原因可能是:如果图片非常有趣,它将被更多的人保存,压缩更多的次数,并且图片质量会更糟;相反,如果图片质量非常差,则可能意味着它非常受欢迎。

显然,这张被盗的色卡也被盗了很多次

这有点像一个流行的古董,在长期以来,无数人都认真地与之一起演奏,最后在地面上形成了一层闪亮的“糊状”。在互联网时代,炉渣图片和整体绿色的质量已成为“电子铜绿”和“网络铜绿”。有些人甚至以高质量看到了那些好照片,并且总是觉得他们没有“随着时间的流逝受洗”。他们心里叹了口气:“它是干的,根本不是圆形的。因此,电子铜绿模拟器诞生了。

图像来源:电子铜绿图片网络老化/魔术海螺实验室

图片为什么变成绿色

将绿色旋转的图像实际上是操作系统的核心代码中的一个错误。 系统为开发人员提供了图像压缩接口,该接口使开发人员可以轻松地压缩JPEG图像(即JPG图像)。但是,为了加速压缩计算过程,该接口的基础实现算法在颜色模式转换过程中具有错误。

我们在手机屏幕屏幕存储RGB信息(红色红色,绿色,蓝色)上看到的图片,可以说出屏幕上的每个红色,绿色和蓝色子像素的光芒看起来像。但是,在图像处理过程中,通常需要将其转换为YUV信息(亮度,蓝色密度偏移,红色密度偏移)。由于人眼对Y代表的亮度信息更敏感,因此该算法可以集中于压缩紫外线信息。这样,当人眼的感知并不十分差异时,图片所占据的存储空间可以尽可能最小化。

一般而言,从RGB颜色模式转换为YUV颜色模式略有下降,但损失很小,这不会使图片朝着绿色的方向疯狂地运行。但是,为了加快此转换计算过程,开发人员使用了不当使用的位操作,从而导致数据从RGB转换为YUV时被删除。因此,重复压缩过程时,Y,U和V的三个值将继续减少。亮度y值的下降将使图像更深,而紫外线将继续减少,这会导致颜色向绿色方向转移(请参见下图)。因此,被压缩多次的图片会变成绿色和黑暗。

当y = 0.5时,紫外线会减小紫外线时变绿色。图像来源:

这个问题在2016年4月中旬解决。根据系统的发布日期,自2016年8月22日发布 7 以来,该问题才解决。(但是,考虑到大多数手机制造商都跟进 有延迟,甚至以后将解决此问题。)因此,仅当几年前系统上使用JPEG图片时,图像绿色的问题才是。将生成。

新图片压缩算法

尽管有些人喜欢图片中绿色和深色的“电子铜绿”,但他们认为这些图片具有更多的“风味”。但是,开发人员当然需要具有正确结果且不会变绿色的图像压缩算法。除了修复图像压缩接口中的错误外,还开发了许多有效的图像格式。例如,由开发的WebP格式和Apple推广的HEIC格式都使用了相对高级的图像压缩算法。与传统的JPEG格式相比,这两种格式在观看更好的同时占用更少的空间。

最近,基于文本生成图像的AI已流行。这些AI算法中的大多数都是基于扩散模型,并且可以在训练大量文本和图像后从用户输入的文本输入中生成图像。尽管图片的细节并不完美,但可以日夜产生图片的AI仍然会使人们看到巨大的潜力。有些人甚至为此感到遗憾,如果继续这样做,画家可能会失业。

此图片由 Ernie-Vi​​lg 图模型生成。使用关键字“无法编写手稿的编辑正在办公室抢走鱼,赛博朋克,油画”。图片来源: Ernie-Vi​​lg 照片

将来这种人工智能在多大程度上可以发展,我们不会首先描述它。取而代之的是,瑞士开发人员Bü具有“口语思想” - 可以用于图像压缩吗?

人工智能压缩

Bü选择了免费和开源的 ai:。它主要由三个模块组成:变异自动编码器(自动,VAE),U-NET和文本编码器。

压缩图像时不需要文本输入,因此Bü文本编码器;而VAE可以将图像编码为潜在的空间表示。在潜在的空间表征下,图像分辨率变得较低(从512×512到64×64),但颜色精度得到提高(从8位到32位)。

VAE还可以将图片的潜在空间表示解码为图片的原始外观。即使在潜在的空间表示中再次压缩图像,VAE也可以将图像大致恢复成本。最后,Bü将未压缩的768KB图像压缩到5KB。如果您看着肉眼,如果将图像压缩到此尺寸,JPEG和WebP的压缩损失将是显而易见的。

从左到右是WebP图片,JPG图片,AI压缩图片和原始图片。图像来源:Bü

AI电子浆

当然,这种压缩算法并不完美。尽管此图像压缩算法可以欺骗人的眼睛,但在两个参数中,它没有明显的优势,并且在两个参数中均客观地评估图像质量。

毕竟,此图像压缩算法仍然允许AI基于压缩的缩略图“猜测”其原始图像的外观。在某些细节上,恢复的图像与原始图像不可避免地不一致,这会产生一种新的“电子铜绿”。 Bü发现,当此图像压缩算法处理面和文本时,它可能会对脸部产生奇怪的(有时是“ ”)的影响,而VAE重建的文本几乎很难识别。换句话说,使用先前的压缩算法,这些图片将产生绿色的“电子铜绿”,而新时代的AI压缩算法将使面部和文本产生奇怪的“电子铜绿”。

从左到右是WebP图片,JPG图片和AI压缩图片,请注意红色圆圈脸上的奇怪状态。图像来源:Bü

AI的复杂性还使此图像压缩算法难以推广。传统的图像压缩算法是一组固定算法,可以使用轻量级程序实现。 AI以其庞大的计算量而闻名。此AI图像压缩算法需要一个完整的4GB空间来存储参数文件,并且解码时间比其他压缩算法更长。

因此,此图像压缩算法目前不值得促进。即使促进了它,也无法完美解决“电子铜绿”的问题。取而代之的是,由于人工智能的特征,它将产生人类无法想象的不可想象,新的和奇怪的事情。 “电子铜绿”。

但是,现在最受欢迎的电子铜绿不是整体绿色和深色的,而是层层和难以去除水印...

提醒:请联系我时一定说明是从101箱包皮具网上看到的!