用“压缩感知”复活图像

点赞:8027 浏览:32569 近期更新时间:2024-01-21 作者:网友分享原创网站原创

迄今为止世界上最大像素的照片应该要算德国德累斯顿(Dresden)市AFB公司在200g年12月21日使用Canon 5D Mark ||拍摄的“德累斯顿一角”了它足足有260亿像素,由1655幅图像组合而成,每幅有2 16千万像素,全部拍摄时间长达176分钟,而用一台16个处理器和48GBt内存的机器把它们拼贴起来又花了94个小时.但是如果一项被称为“压缩感知”(pressive sensing)的理论能在技术上实现应用,这项工作也许只要一分钟.因为根本用不着去记录每一个像素.

与传统思路相反

在信息论中的―个重要理论是香农,奈奎斯特(Shannon/Nyquist)采样定理,它认为,无错误地重建―个信号所需的样本数是由带宽决定的(带宽是指信号所占据频谱的最短间隔长度),也就是说为了采集IM的信息,我们至少需要2M的带宽,这被称为奈奎斯特率(Nyquist rate),否则会导致信息失真.

“压缩感知”理论与传统的思路相反,它认为,为什么不事先利用较少的采样数据,在事后再利用最优化的方法反向重建出原始信息呢

这样的思路也有道理.信号通常是有规律可循的(如果没有规律,完全随机的信号实际上毫无意义,就像电视机屏幕上的雪花噪声),有规律则可以压缩,而可压缩信号的采样频率会大大低于奈奎斯特率,复原后的信息也不会造成失真,这样,我们可以极大地降低对数据处理的要求.

用“压缩感知”复活图像参考属性评定
有关论文范文主题研究: 关于图像的文章 大学生适用: 自考论文、电大毕业论文
相关参考文献下载数量: 88 写作解决问题: 怎么撰写
毕业论文开题报告: 论文提纲、论文选题 职称论文适用: 职称评定、高级职称
所属大学生专业类别: 怎么撰写 论文题目推荐度: 免费选题

意外中的发现

和很多科学突破一样,压缩感知的发现也纯属意外.2004年,加州理工学院教授Emmanuel Candes在计算机上测试图像算法,他所测试的图像质量很差,有很多雪花一样的噪点,他认为一个名叫LI―minimization的算法能清理掉噪点中的条纹.当他输入指令,让算法开始工作时,奇迹发生了:和预料中一样,图像变干净了但同时他又意外地发现图像细节竟然变得完美起来,这种感觉简直像魔术一样不真实,就如同一位只告诉了你她的手机中的3个尾数,你却一下子猜对了其余8个数!Candes在不同的图像上重复进行测试,每次的结果都很完美.

Candes又在博士后助理Juscin Romberg的帮助下,提出了一个粗略的理论去破译这个“魔术”,并在黑板上展示给加州大学洛杉矶分校的同事陶哲轩看.他们交谈后,Candes认为陶哲轩可能不太信服他的这项发现,因为从一幅本就糟糕的图得到一个清晰度极大改善的图,几乎是不可能的.然而,第二天晚上,陶哲轩就对这一发现给出了一个更完整的理论解释,两人后来合作发布了多篇压缩感知的重要论文.

“压缩感知”的巨大潜力让它很快成为研究大热门,接下来的短短6年中,“压缩感知”领域迅速产生了上千篇论文.

运用“公式”来重建图片

压缩感知的工作原理可以用如何得到一幅图像来解释.比如你拿到一张长宽均为1024像素的照片,它的图像由100万像素组成,像素作为最基本单元,其本质就是信号采样.对于100万像素的图像,传统的成像方式便是进行100万次测量,但压缩感知的方式,是只需要测量很小一部分,比如随机从照片不同位置挑选10万个像素,然后通过后期处理补上另外的90万个像素.

要实现这点,依赖于名叫“稀疏”的数学概念.稀疏是用来描述图像复杂性的一种方式.比如我们拍摄飘着自云的天空,其中便有着大片的蓝色和白色,而且这两种色彩远远多于其他色彩,我们可以说,这是一张“稀疏”的照片.


Emmanuel Candes和陶哲轩也发现,一幅图像可以用少量的色块表示.比如我们所拍摄的蓝天白云,图像中有大块的单色,检测如这个单色块有300 x 300像素那么大,那么在拍摄时我们可以只需要记录块的维度、坐标和颜色,而不必去记录每一个像素.当重建时再按照维度、坐标和颜色的“公式”便可真实还原出照片.如果是五颜六色的图像,我们只需要将色块缩小到人眼无法识别差异的程度,照样可以用此方法.也许你会觉得,将一个不完整的图像重建成完整图像一定会产生误差,但Candes和陶哲轩却用数学证明了,采用这种方式,图像发生错误的可能性趋近于零!

拯救了孩子的实验性算法

在大众消费领域,由于硬件的不断跳水,数码相机压缩不压缩照片对普通用户没有太大的影响.但在更多需要大量数据集的地方,比如核磁共振成像、天文望远镜、统计信号处理、机器学习、生物计算、高光谱成像、表面计量、光谱分析、机器人和控制等领域,“压缩感知”的作用不可限量.

比如核磁共振成像(MRI),通常需要15到~40分钟的扫描,它使用强磁场和电磁波,通过识别水分子中氢原子信号的分布来推测水分子在人体内的分布,进而探测和捕获器官组织的清晰图像.扫描是一个痛苦的过程,儿童需要全身麻醉.扫描的时间越长,对儿童可能造成的伤害几率也越高.根据《连线》杂志报道,去年春天,斯坦福大学儿童医院对一位2岁的婴儿进行测扫描,他的肝脏有缺陷,在移植了捐赠的肝脏后一度好转,但不久又出现恶化.医生需要对肝脏组织进行扫描以诊断哪里出了问题.为了获得高清晰度的扫描图像,医生需要他始终保持平静,否则呼吸会导致图像模糊.操作MRI机器的医生需要花2分钟时间完成扫描.但让脆弱的孩子停止呼吸如此长时间,最后恐怕就不止是肝脏会出问题了.所幸当时这台MRI机器采用了一套实验性的“压缩感知”算法,让医生只需40秒时间完成扫描.当天晚些时候,“压缩感知”重建的图像让医生发现是孩子的胆管出现了堵塞,清理堵塞处后,肝脏便恢复了正常工作.

不仅仅是用于造成图像

不仅仅是用于生成图像,“压缩感知”在很多领域都将产生重大的影响.因为每一种有意义的信号都是“稀疏”的――只要你能找到正确的方式进行定义.例如,音乐是由几种音符组成,我们可利用“压缩感知”,从音质已经变差的碟片中恢复音乐,而且与几十年前刚录制时丝毫不差.

全世界每天要产生无数PB的数据,每18个月新增的数据量就会翻一番――类似描述计算机性能的摩尔定律,如何高效而安全地保存这些数据今天,我们的视听信息是在复杂的压缩格式下保存起来的.问题是软件会过时,比如今日微软的Office软件就难以正常读取90年代储存的微档格式.这个问题部分与文档格式的开放标准有关,但如果用压缩感知算法记录一幅图像(或其他什么文件),则只需要原始数据量的十分之一,甚至是百分之一,那么我们根本就不需要再去压缩,只需要在必要时候重建图像就行了.

猜你想找