silver lining's blog

超分重建简介

超分辨率重建简介

1. 引言


图像超分辨率重建技术就是利用一组低质量、低分辨率图像(或运动序列)来产生单幅高质量、高分辨率图像。图像超分辨率重建应用领域及其宽广,在军事,医学,公共安全,计算机视觉等方面都存在着重要的应用前景。在计算机视觉领域,图像超分辨率重建技术有可能使图像实现从检出水平(detection level)向识别水平(recognition level)的转化,或更进一步实现向细辨水平(identification level)的转化。图像超分辨率重建技术可以提高图像的识别能力和识别精度。图像超分辨率重建技术可以实现目标物的专注分析,从而可以获取感兴趣区域更高空间分辨率的图像,而不必直接采用数据量巨大的高空间分辨率图像的配置。

目前超分辨率技术主要有以下两大类:基于重建的方法基于学习的方法


2. 基于重建的方法


基于重建的超分辨率方法的基础是均衡及非均衡采样定理。它假设低分辨率的输入采样信号(图像) 能很好地预估出原始的高分辨率信号(图像)。绝大多数超分辨率算法都属于这一类,其中主要包括频域法和空域法。

频率域方法是图像超分辨率重建中一类重要方法,其中最主要的是消混叠重建方法。消混叠重建方法是通过解混叠而改善图像的空间分辨率实现超分辨率复原,最早的研究工作是由 Tsai 和 Huang在 1984 年进行的。在原始场景信号带宽有限的假设下,利用离散傅立叶变换和连续傅立叶变换之间的平移、混叠性质,给出了一个由一系列欠采样观察图像数据复原高分辨率图像的公式。多幅观察图像经混频而得到的离散傅立叶变换系数与未知场景的连续傅立叶变换系数以方程组的形式联系起来,方程组的解就是原始图像的频率域系数,再对频率域系数进行傅立叶逆变换就可以实现原始图像的准确复原。

在空域类方法中,其线性空域观测模型涉及全局和局部运动、光学模糊、帧内运动模糊、空间可变点扩散函数、非理想采样等内容。空域方法具有很强的包含空域先验约束的能力,主要包括非均匀空间样本内插、迭代反投影方法、凸集投影法、最大后验概率以及混合 MAP/ POCS 方法、最优和自适应滤波方法、确定性重建方法等。

3. 基于学习的方法


基于学习的方法是近年来超分辨率算法研究中的热点,它采用大量的高分辨率图像构造学习库产生学习模型,在对低分辨率图像进行恢复的过程中引入由学习模型获得的先验知识,以得到图像的高频细节,获得较好的图像恢复效果。

具体步骤为:

  1. 将高分辨率图像按照降质模型进行降质,产生训练集。

  2. 根据高分辨率图像的低频部分和高频部分对应关系对图像分块,通过一定算法进行学习,获得先验知识,建立学习模型。

  3. 以输入的低分辨率块为依据,在建立好的训练集中搜索最匹配的高频块。

基于学习的超分辨率方法中关键是建立学习模型,获得先验知识。常用的学习模型有马尔科夫随机场模型、图像金字塔模型、神经网络模型、主成分分析模型等。基于学习的方法充分利用了图像本身的先验知识,在不增加输入图像样本数量的情况下仍能产生高频细节,获得比基于重建方法更好的复原结果,并能较好的应用于人脸和文字等图像的复原。

4. 研究前景

目前,图像超分辨率重建的研究比较成熟,但距离实用还有较大差距。未来研究方向主要集中在以下几个方面:

  1. 发展和寻求新的退化模型,使成像模型更加精确和全面,实现对点扩散函数和噪声的精确估计。图像超分辨率增强的成功依赖于准确的、符合实际成像系统特性和成像条件的降模型,而要获得符合实际成像过程的降质模型是十分困难的,通常采用简单、确定的降质模型进行近似,这样的近似模型与实际成像过程差距较大。

  2. 压缩域的超分辨率重建。传统的超分辨率算法都是针对图像序列,而实际中最常见的图像序列是视频文件。因而下一步的工作可以针对不同的视频压缩格式和编解码技术,在超分辨率算法中综合考虑成像模型和压缩算法带来的图像降质效果,以及运动补偿和编码传输机制,实现压缩域的超分辨率重建。

  3. 效率和鲁棒性问题。目前的超分辨率算法具有很高的计算复杂度,如何减少计算量,提高算法速度,是下一步值得研究问题。同时,在目前很多算法中都做了各种假设,如照度变等,这在实际应用中是很难满足的,因此需要研究稳健的算法满足实际应用的需要。

  4. 模糊图像和三维图像的超分辨率研究。模糊一直是图像处理中的一个难点,如何对模糊图像进行超分辨率需要进一步研究。目前针对三维图像的超分辨率研究还很少,如何对三维图像进行建模也是一个值得研究的课题。

  5. 超分辨率客观评价标准研究。目前对于图像超分辨率结果主要依靠人的主观评价,缺少一种客观的评价标准,现有的 PSNR、MSE 等并不能很好的反映超分辨率效果,需要发展一种客观的评价机制。
    6.

5. 超分图像质量评估方式

主观评价方法

主观评价主要是由人在感性认识上从主观感觉和统计结果的角度对图像质量做出相应的判定,主要的方法是目视判读。人类视觉系统被认为是最精密的光学成像系统,通过人眼接收物体的反射光在大脑中成像,然后由大脑根据储存的经验知识进行分析得到结论,这个过程所需时间很短。因此主观评价方法具有直观、简单的优点。

客观的评价方式

目视判读的优点是操作简单、效率高,可以有效剔除一些质量差的影像,避免无谓的工作,但是这种判定会因为观察人员的素质、经验、水平的不同以及外部环境的影响而产生较大的差异,因此需要有易于掌控和科学支持的定量评价方法。客观评价方法主要就是采用定量的评价指标对影像做定量分析,由此获取对图像质量好坏的判定。 按照对参考图像的需求,可将客观评价方法分为三类,分别为:无参考、部分参考和完全参考图像质量评价。

图像质量评价离不开视觉评价,主观评价方法可以从配准、影像的整体亮度、色彩、反差、清晰度、影像内纹理、地物边缘、是否有蒙雾或马赛克等现象出现等方面做出判定,直观地得到图像在空间分解力、清晰度等方面的差异。但是这种方法的主观性比较强,人的视觉对影像上的各种变化并不都很敏感,图像的视觉质量强烈地取决于观察者,具有主观性、不全面性
全面客观视频质量评价方法是指把原始参考视频与失真视频在每一个对应帧中的每一个对应像素之问进行比较。准确的讲,这种方法得到的并不是真正的视频质量,而是失真视频相对于原始视频的相似程度或保真程度。最简单的方法如均方误差MSE和峰值信噪比PSNR,其应用比较广泛。

  1. 均方误差 MSE(Mean Square Error)
    image

    其中,fij,f’ij分别代表原始参考视频对应帧和失真视频对应帧,M,N分别表示视频帧的高和宽.

  2. 峰值信噪比 PSNR(Peak Signal to Noise Ratio)
    image

    PSNR本质上与MSE相同,是MSE的对数表示。PSNR是最普遍,最广泛使用的评鉴画质的客观量测法,不过许多实验结果都显示,PSNR的分数无法和人眼看到的视觉品质完全一致,有可能PSNR较高者看起来反而比PSNR较低者差。这是因为人眼的视觉对于误差的敏感度并不是绝对的,其感知结果会受到许多因素的影响而产生变化(例如:人眼对空间频率较低的对比差异敏感度较高,人眼对亮度对比差异的敏感度较色度高,人眼对一个区域的感知结果会受到其周围邻近区域的影响.

  3. 结构相似性度量 SSIM (Structural Similarity Index)
    image
    SSIM模型旨在比较参考和受损信号的结构信息,研究感知结构的损伤,而不是感知误差。上节中基于HVS的模型,采用自底向上的方法,模拟人类视觉系统中每个与质量感知相关的器官的功能,然后将每个部分联结起来实现评价模型,而SSIM是一种自顶向下的方法,模拟的是HVS整体的功能.

Reference

简介

各种质量评估方法

常见超分图像评估指标

开源评估工具