2. 中国矿业大学 计算机科学与技术学院, 江苏 徐州 221116
2. School of Computer Science and Technology, China University of Mining and Technology, Xuzhou 221116, China
单幅图像超分辨率(single image super resolution, SISR)被广泛应用于计算摄影等领域[1-2], 其目标是学习低分辨率(low resolution, LR) 图像与高分辨率(high resolution, HR)图像间的映射关系. 近年来, 深度学习技术在SISR中取得了显著进展. Dong等[3]率先将卷积神经网络(convolutional neural networks, CNN)用于SISR, 提出了SRCNN. 为了减少计算成本, Dong等[4]删除了SRCNN中的预处理操作, 提出了它的轻量级版本. Lim等[5]提出了增强深度超分辨率网络EDSR, 删除了SRResNet[6]特征提取模块中的批归一化层, 显著提升了网络推理速度. Zhang等[7]引入通道注意力机制, 构建了RCAN, 使网络能够有针对性地关注不同通道的特征, 提升了CNN的表达能力. 程德强等[8]提出的多递归残差网络结构MCSR, 通过加大网络的深度, 获得了更好的重建效果. 赵小强等[9]通过构建类金字塔结构, 学习多尺度信息用于图像重建. 程德强等[10]提出一种基于多尺度空间注意力引导的图像超分辨率重建网络. 随着对注意力机制研究的加深, 不少研究工作[11-13]关注到自注意力机制对解决长距离特征依赖的优势, 能进一步提高网络重建图像的能力, 但此项技术算力消耗巨大, 增加了网络的训练难度. 因此, 轻量级网络成为图像超分辨率领域的另一个研究热点. 轻量化模型因其容易部署、处理速度高等优点, 被广泛应用于现实场景中. Ahn等[14]提出级联残差网络CARN, 在保持较少参数的同时实现了出色的性能. Hui等[15]提出了一种信息蒸馏网络IMDN, 通过逐步提取分层特征来减少网络参数量. Liu等[16]将其中的通道分割操作替换成卷积核大小为1×1的标准卷积, 提出了残差特征蒸馏网络RFDN, 降低了网络的参数量, 并提高了网络的性能. 宋昭漾等[17]提出了一种U型网络加强对不同层次信息的利用. 为了加强特征的复用, 程德强等[18]提出了一种多尺度密集连接网络. Huang等[19]通过密集连接使得图像的早期特征得到重用, 但密集连接会使得网络训练的过程中出现大量冗余计算, 降低模型的推理速度. 为了缓解这个问题, Huang等[20]在训练过程中对不重要的权重进行剪枝, 减少了冗余计算. 但无论如何, 上述网络利用浅层特征的方式都是通过跳跃连接, 且重用全部的浅层特征, 这无疑是低效的. 鉴于此, 本文提出基于浅层特征调制的轻量级图像超分辨率重建网络, 其主要工作可被归纳为: 1)提出了浅层特征调制层(shallow feature modulation layer, SFML), 建立了浅层特征与深层特征间高效的映射关系. 浅层特征通过SFML生成特征掩码矩阵
本文所提出的浅层特征调制网络(shallow feature modulation network, SFMN)如图 1(a)所示, 主要由3个部分组成: 浅层特征提取、深层特征提取和图像重建.
|
图 1 基于浅层特征调制的轻量级图像超分辨率重建网络及实现细节 |
浅层特征提取由卷积核大小为3×3的标准卷积完成, 此过程可以表述为
| $ \begin{align} {F_s} = {H_{\rm conv3}}({I^{\rm LR}}). \end{align} $ | (1) |
其中:
浅层特征往往带有图像轮廓、边缘等对图像重建任务具有重要意义的信息, 而目前主流网络的关注点在于优化网络拓扑, 忽视了对浅层特征的利用. 针对这一问题, 本文提出浅层特征调制层, 通过浅层特征指导深层特征的生成, 在网络保持轻量的情况下, 高效地利用浅层特征, 提高图像重建质量, 并设计基于浅层特征调制层的双分支深层特征提取模块. 考虑到网络的轻量化, 对每个模块的输入输出分别使用两个卷积核大小为1×1的标准卷积, 完成特征通道降、升维操作, 以降低网络的参数量.
1.2.1 浅层特征调制层本文利用常见的特征生成网络(由3个3×3的卷积和3个ReLU[21]激活函数构成)来进行浅层特征提取. 如图 1(b)所示, 浅层特征调制层由4组3×3卷积和LReLU[22]激活函数的组合(下述为调制操作)组成, 输入的浅层特征分别通过上下两组调制操作, 生成特征掩码矩阵
| $ \begin{align} &\alpha = \tau ({H_{\rm conv3}}(\tau ({H_{\rm conv3}}({F_s}))))m, \end{align} $ | (2) |
| $ \begin{align} &\beta = \tau ({H_{\rm conv3}}(\tau ({H_{\rm conv3}}({F_s})))), \end{align} $ | (3) |
| $ \begin{align} &{F_m} = {\rm SFML}({F_d}| {(\alpha , \beta )) = \alpha \otimes {F_d}} \beta. \end{align} $ | (4) |
其中:
为了增强网络特征提取能力, 提高训练过程中对浅层特征的高效利用, 本文基于浅层特征调制层设计一个双分支模块用于提取深层特征. 相比于单一分支的结构, 双分支的特征提取结构强化了对不同深层特征的高效利用, 从而提高网络重建能力.
图 1(c)为双分支浅层特征调制模块. 包含上下两个分支结构, 上分支由2个浅层特征调制层、2个3×3的卷积以及一个ReLU激活函数组成, 下分支仅由2个3×3的卷积和一个ReLU激活函数构成.
模块上下分支分别采用两种不同方式校准输出: 上分支目的在于高效复用浅层特征, 利用浅层特征对深层特征进行调制. 为此, 采用元素相减的方式进一步放大与下分支所学特征的差异, 并用此差异进行上分支特征校准. 下分支则使用标准卷积操作完成深层特征提取, 并采用自校准的方式建立特征之间的远程依赖关系.
规定第
| $ \begin{align} &F_{{{\rm SFML}_1}} = \sigma ({H_{\rm conv3}}({H_{\rm SFML}}({H_{\rm conv1}}(F_{{{\rm DSFM}_{i - 1}}})))), \end{align} $ | (5) |
| $ \begin{align} &{F_{\rm conv3}} = \sigma ({H_{\rm conv3}}({H_{\rm conv1}}(F_{{\rm DSFM}_{i - 1}}))), \end{align} $ | (6) |
| $ \begin{align} &{F_{\rm diff}} = F_{{\rm SFML}_1} \ominus {F_{\rm conv3}}. \end{align} $ | (7) |
其中: 两分支的特征差异
为了更好地融合上下两分支的输出特征, 本文设计一个基于注意力机制的特征选择模块, 通过该模块输出注意力权重, 通过动态权重来约束上下两分支的输出. 受到A2N[23]的启发, 本文遵循了约束动态权值的方法, 将两个注意力权重之和设置为1.
| $ \begin{align} &{W_{\rm up}} = \delta ({H_{\rm conv1}}({F_{{\rm DSMF}_{i - 1}}})), \end{align} $ | (8) |
| $ \begin{align} &{W_{\rm down}} = 1 \ominus {W_{\rm up}}. \end{align} $ | (9) |
其中:
| $ \begin{align} &{F_{\rm up}} = {H_{\rm conv3}}({H_{\rm SFML}}(\delta ({F_{\rm diff}}) \otimes {F_{{\rm SFML}_1}})), \end{align} $ | (10) |
| $ \begin{align} &{F_{\rm down}} = {H_{\rm conv3}}(\delta ({H_{\rm conv1}}({F_{{\rm DSFM}_{i - 1}}}))\otimes {F_{\rm conv1}}), \end{align} $ | (11) |
| $ \begin{align} &{F_{{\rm DSFM}_i}} = {H_{\rm ESA}}({H_{\rm conv1}}({W_{\rm up}} \otimes {F_{\rm up}} + \\ &\; \; \; \; \; \; \; \; \; \; \; \; \; \; \; \; {W_{\rm down}} \otimes {F_{\rm down}})) + {F_{{\rm DSFM}_{i - 1}}}. \end{align} $ | (12) |
其中:
文献[24]表明, ESA机制通常放在特征提取模块的末尾, 使网络关注更感兴趣的区域得到具有代表性的特征, 从而提高网络的学习能力. ESA的轻量化结构是其被广泛使用的原因之一, 通过跨步卷积和通道降维操作, ESA会大大降低其参数量和计算成本.
1.3 图像重建如图 1(a)所示, 图像重建部分包含上采样层和重建层. 上采样层采用图像超分辨率中常用的亚像素卷积, 它可以在不引入额外参数的情况下, 将低分辨率的特征映射到高分辨空间, 其原理如图 2所示.
|
图 2 亚像素卷积示意图 |
SISR中常用的损失函数为
| $ \begin{align} {L_1} = \frac{1}{{MN}} \sum\limits_{x = 1}^M { \sum\limits_{y = 1}^N {| {{I^{\rm SR}}(x, y) - {I^{\rm HR}}(x, y)} |} }. \end{align} $ | (13) |
其中:
本文使用DIV2K数据集[25]作为训练数据集, 其中有800张训练图像、100张验证图像、100张测试图像. 本文采用5个基准数据集进行测试, 即: Set5[26]、Set14[27]、B100[28]、Urban100[29]以及Manga109[30]. 本文采用随机90°和水平翻转的方式增强训练图像, 并将训练图像随机裁剪为48×48的图像片, 以获得足够的训练样本. 训练过程中, 每批次随机输入16个图像片. 网络训练采用Adam优化器, 其参数设置为
| $ \begin{align} &{\rm PSNR}= 10 \times \lg\Big(\frac{{{\rm MAX}^2}}{{\rm MSE}}\Big), \end{align} $ | (14) |
| $ \begin{align} &{\rm SSIM} = \frac{{(2\mu_1\mu_2 + C_1)(2\sigma_{12} + C_2)}}{{(\mu_1^2 + \mu_2^2 + C_1)(\sigma_1^2 + \sigma_2^2 + C_2)}}. \end{align} $ | (15) |
其中: MAX为HR图像中最大像素值, MSE为均方误差,
为了验证本文算法的有效性, 将本文模型SFMN与主流的轻量级网络: EDSR-baseline[5]、IMDN[15]、RFDN[16]、SMSR[31]、LBNet[32]、ShuffleMixer[33]、RLFN[34]、ARRFN[35]、PILN[36]、DRSAN[37]分别在客观评价指标和主观视觉效果两方面进行对比. 为了充分验证SFMN网络模型的效果, 分别在3种不同缩放因子下进行实验. 表 1展示了不同超分辨率重建算法在5个基准数据集上取得的PSNR和SSIM. 由表 1中数据可以看出, 本文提出的SFMN在保持低参数量的情况下, 达到了较好的重建效果. 与2023年模型PILN[36]、DRSAN[37]相比, 除了在缩放因子为2的结果上本文算法有些许指标不是最优, 但均保持在次优水平. 这是由于相比于其他模型, 本文算法加强了对浅层特征的利用, 从而能在下采样倍数更高的低分辨率图像中捕获更多的特征信息. 从3倍和4倍缩放因子下的重建指标中可以看出, 本文算法均优于其他算法. 在纹理细节信息较多的Urban100数据集上, 本文算法相比于次优算法分别提升0.03 dB/0.0015和0.11 dB/0.0017. 由表 1可以看出, 本文算法在4倍缩放因子下的结果取得最优效果, 并较之次优算法有着较大的提升. 在5个基准数据集Set5、Set14、B100、Urban100和Manga109上, 本文算法相比于次优算法分别提升: 0.11 dB/0.0009、0.07 dB/0.0012、0.04 dB/0.0009、0.11 dB/0.0017和0.18 dB/0.0018.
| 表 1 3种缩放因子下网络在5个基准数据集上的测试指标对比 |
在主观视觉效果方面, 本文选取了纹理细节丰富的图片进行比较, 分别是4倍的缩放因子情况下, Urban100数据集上的Img033、Img093和Img100. 从图 3(a)可以看出, 本文算法能够较好地保持大楼线条走向, 边缘更加清晰, 其余算法重建出的质量都存在线条扭曲的现象. 图 3(b)更体现出本文算法的优势, 可以看出, 本文算法能够很好地重建出图中白色横线, 与原始真值图像保持一致, 而其他算法则存在将线条方向错误重建的问题. 从图 3(c)中可以看出, 本文网络重建出的图像所受到的影响最小, 最接近原始图像, 图片中的“旗帜”线条较好地维持成垂直方向. 因此, 得益于本文所提出浅层特征调制方法, 使得网络模型能够更好地处理图像的纹理细节, 图像纹理更细腻, 更接近真值图像, 视觉效果更好.
|
图 3 标准测试集下4倍放大视觉效果比较 |
在SISR中, 大部分网络的工作集中在深层特征的优化上, 如图 4(a)所示. 通过改进深层特征提取模块的结构和个数, 达到优化网络性能的目的, 而很少有人关注并有效利用浅层特征. 本文通过提出浅层特征调制层, 利用浅层特征生成掩码矩阵, 指导生成深层特征, 实现了对浅层特征的高效利用, 解决了上述盲点问题.
|
图 4 算法创新性与合理性分析 |
为验证浅层特征对深层特征具有指导意义, 本文对特征进行可视化操作. 如图 4(b)所示, 浅层特征为图像通过一个3×3的卷积提取到的特征、浅层特征和真实HR图像的高频信息, 均是经过高斯核函数提取的浅层特征得到的. 可以看出, 浅层特征的高频信息和真实图像的高频信息之间存在相似性. 为了进一步量化这种相似性, 本文选取Set5数据集为测试集, 提取Set5数据集中图像的浅层特征, 通过高斯核函数得到浅层特征的高频信息, 并将浅层特征高频信息与HR图像高频信息进行逐像素点相减并取绝对值. 若得到的结果位于0 ~ 5之间, 则认为在该位置上, 浅层特征高频信息与HR图像高频信息相似. 如 图 4(c)所示, Set5数据集中的5张图片所提取出的浅层特征相似程度分别为: baby 58.24%、bird 46.58%、butterfly 35.89%、head 53.47%以及woman 45.94%, 平均相似程度为48.02%. 图 4(c)中的红色折线部分为浅层特征高频信息与HR图像高频信息之间的结构相似度, 其计算结果依次为: 0.514 8、0.431 4、0.839 0、0.431 9、0.511 7, 平均结构相似度为0.545 7. 可以认为, 浅层特征的高频信息中, 含有大量与最终真实图像相似的信息, 高效地对浅层特征进行利用, 可以在不需要堆叠网络层并减少网络参数的同时, 提高图像重建的质量. 这些量化数据表明本文所提出浅层特征对深层特征具有指导意义.
2.5 消融实验本小节通过消融实验验证浅层特征调制层、基于注意力特征选择模块以及校准方法的有效性. 先作以下说明, DSFM为原网络的双分支特征调制模块, DSFM_woSFML为DSFM去除特征调制层后的模块; DSFM_woATT为DSFM去除注意力特征选择后的模块, DSFM_woCAL为DSFM去除两种校准方式后的模块. 本节分别将DSFM_woSFML、DSFM_woATT以及DSFM_woCAL替换原网络中的DSFM构建出3个网络进行训练, 并在纹理细节较多的Urban100数据集上进行二倍上采样重建. 训练过程中, 学习率设置为
| 表 2 不同方法之间有效性对比 |
由表 2可以看出, 对比DSFM和DSFM_woSFML可以得到, 网络参数量在仅增加27 K的情况下, PSNR和SSIM分别提升了0.11dB, 0.001 5, 表明增加浅层特征的利用有益于图像重建任务, 经过浅层特征指导生成的深层特征能够更好地用于图像重建; 基于注意力特征选择模块采用适合轻量级的像素注意力[38](pixel attention, PA), 几乎未增加网络参数, 但动态权重平衡了两分支的输出特征, 高效地进行特征融合, 使得网络性能得到提升. 对比DSFM和DSFM_woATT可以看出, PSNR和SSIM分别提升0.08 dB和0.001 4. 根据DSFM和DSFM_woCAL对比可以看出, 有校准的模块比无校准的模块在PSNR上提升0.06 dB, 在SSIM上提升0.001 2. 因此, 可以认为两种不同的校准方式, 进一步放大了两分支特征之间的差异, 使得两分支可以学习到不同层次的特征信息, 提高网络重建性能. 本文采用图 1(c)所示的双分支浅层特征调制模块结构, 为确定最优的模块数目做出以下对比实验. 表 3展示了不同模块个数堆叠出的网络结构参数, 对不同模块数目的网络进行训练, 设置训练学习率为
| 表 3 模块数量、网络参数对网络性能的影响 |
由表 3中可以看出, 网络参数量增长与堆叠的模块数成正相关关系, 每增加两个模块会增加约0.2 M的参数量, 但网络的拟合泛化能力并不与模块数量成正相关. 当模块数在10 ~ 16之间时, 网络性能与模块数成正比, 但继续增加模块会使得网络性能下降, 从16增加到18后, 模型PSNR下降1.09 dB, SSIM下降0.037. 因此, 为保证网络的轻量化, 实验中, 选取16个双分支浅层特征调制模块进行深层特征的提取操作.
轻量级图像超分辨率网络一般采用减少通道数的方式减少网络的参数量. 为确定本文网络最优通道数, 即在保持低参数量的同时, 保持重建性能, 对通道数目进行消融实验对比. 实验设置模块数为3, 学习率为
| 表 4 通道数对网络性能的影响 |
由表 4可以看出, 通道数和网络参数量及性能呈正相关. 通道数为64的网络相比于通道数为48的网络, PSNR提升0.13 dB, SSIM提升0.000 9. 同样, 通道数为96的网络的客观指标PSNR和SSIM, 相比于通道数为64的网络, 分别提升0.11 dB和0.000 5. 综合考虑网络的性能的参数量, 本文确定模块数目为16, 通道数确定为64.
为了进一步验证浅层特征对于深层特征的生成具有指导意义. 本文做出以下实验, 如图 5所示. 首先, 通过有无浅层特征调制操作, 验证浅层特征对于指导深层特征生成的必要性; 其次, 将浅层特征调制层利用跳跃连接替代, 验证所提出的浅层特征调制操作的高效性. 统一确定模块个数为5, 学习率为
|
图 5 浅层特征调制层消融实验 |
如图 5所示, (a)、(b)、(c)三个子图所对应的模块名分别为: with_mod、without_mod和with_skip. 表 5为(a)、(b)、(c)子图模块测试所得客观指标, 从with_ mod和without_mod指标可看出, 当存在浅层特征调制时, 由于调制层存在卷积操作, 网络参数量增加31 K, 计算量增加0.53 G, 但网络性能得到大幅度提高. 在4个基准数据集Set5、Set14、B100、Urban100上的PSNR分别增加1.21 dB、0.79 dB、0.42 dB、0.88 dB, SSIM分别提高0.027 1、0.016 3、0.010 2、0.035 1, 表明了浅层特征对于深层特征具有指导意义, 经过调制后的深层特征包含更加丰富的纹理信息, 能够更好地用于图像重建任务.
| 表 5 缩放因子为4时不同模块在4个基准数据集下的指标对比 |
从without_mod和with_skip的对比中可看出, 通过使用浅层特征到深层特征的跳跃连接, 可以在牺牲网络参数和计算量的情况下, 通过特征复用提高网络性能. 但通过对比with_mod和with_skip的实验结果能够看出, 网络所增加的计算量相同, 但使用本文所提出的浅层特征调制模块可以进一步提升网络的性能指标, 在数据集Set5、Set14、B100、Urban100上的PSNR分别增加0.53 dB、0.33 dB、0.17 dB、0.38 dB, SSIM分别提高0.009 1、0.005 4、0.003 2、0.013 8, 所重建出的图像质量更好. 为了能够更加直观地看出重建图像的差异, 本文选取Urban100数据集中的Img092和B100数据集中的148026进行主观视觉对比, 从图 6中可以看到, with_mod网络重建出的图像最好, 能够更好地保持图像边缘纹理信息.
|
图 6 2种网络4倍重建图像对比 |
本文提出了一种基于浅层特征调制的轻量级网络, 用于图像超分辨率重建. 首先, 设计了浅层特征调制层, 引导深层特征生成, 以改善浅层特征未能充分利用的问题, 并丰富图像特征的纹理细节信息; 其次, 构建了双分支结构和注意力机制引导生成的权重, 高效地融合多路输出特征. 在5个基准数据集(Set5、Set14、B100、Urban100、Manga109)上进行测试, 缩放因子为4. 相比于次优算法, 本文算法在峰值信噪比上的提升为0.11 dB、0.07 dB、0.04 dB、0.11 dB、0.18 dB; 结构相似度提升为0.000 9、0.001 2、0.000 9、0.001 7、0.0018.
尽管本文所提出的模型表现优异, 但仍存在局限性. 本文的调制模型是一阶的, 即调制特征和输入特征之间存在线性映射关系. 显然, 这种方式未必是最优的. 未来将深入探索浅层特征与深层特征之间的高效映射关系, 在保持网络轻量化的同时, 追求更优的重建性能.
| [1] |
Jiang H, Asad M, Liu J J, et al. Single image detail enhancement via metropolis theorem[J]. Multimedia Tools and Applications, 2024, 83(12): 36329-36353. |
| [2] |
Jiang H, Cai H K, Yang J. Learning in-place residual homogeneity for image detail enhancement[C]. IEEE International Conference on Acoustics, Speech and Signal Processing. Calgary, 2018: 1428-1432.
|
| [3] |
Dong C, Loy C C, He K M, et al. Image super-resolution using deep convolutional networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(2): 295-307. DOI:10.1109/TPAMI.2015.2439281 |
| [4] |
Dong C, Loy C C, Tang X O. Accelerating the super-resolution convolutional neural network[M]. Computer Vision — ECCV 2016. Cham: Springer International Publishing, 2016: 391-407.
|
| [5] |
Lim B, Son S, Kim H, et al. Enhanced deep residual networks for single image super-resolution[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Honolulu, 2017: 1132-1140.
|
| [6] |
Ledig C, Theis L, Huszár F, et al. Photo-realistic single image super-resolution using a generative adversarial network[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, 2017: 105-114.
|
| [7] |
Zhang Y L, Li K P, Li K, et al. Image super-resolution using very deep residual channel attention networks[C]. Computer Vision — ECCV 2018. Cham: Springer International Publishing, 2018: 294-310.
|
| [8] |
程德强, 郭昕, 陈亮亮, 等. 多通道递归残差网络的图像超分辨率重建[J]. 中国图象图形学报, 2021, 26(3): 605-618. (Cheng D Q, Guo X, Chen L L, et al. Image super-resolution reconstruction from multi-channel recursive residual network[J]. Journal of Image and Graphics, 2021, 26(3): 605-618.) |
| [9] |
赵小强, 王泽, 宋昭漾, 等. 基于类金字塔图残差网络的图像超分辨率重建[J]. 控制与决策, 2024, 39(3): 786-794. (Zhao X Q, Wang Z, Song Z Y, et al. Pyramid-like graph residual network for image super-resolution reconstruction[J]. Control and Decision, 2024, 39(3): 786-794.) |
| [10] |
程德强, 王培杰, 董彦强, 等. 基于多尺度空间注意力引导的图像超分辨率重建网络[J]. 北京航空航天大学学报, DOI: 10.13700/j.bh.1001-5965.2023.0547. (Cheng D Q, Wang P J, Dong Y Q, et al. Image super-resolution reconstruction based on multi-scale spatial attention guidance network[J/OL]. Journal of Beijing University of Aeronautics and Astronautics, DOI: 10.13700/j.bh.1001-5965.2023.0547.) |
| [11] |
王雪松, 晁杰, 程玉虎. 基于自注意力生成对抗网络的图像超分辨率重建[J]. 控制与决策, 2021, 36(6): 1324-1332. (Wang X S, Chao J, Cheng Y H. Image super-resolution reconstruction based on self-attention GAN[J]. Control and Decision, 2021, 36(6): 1324-1332.) |
| [12] |
Zhou Y P, Li Z, Guo C L, et al. SRFormer: Permuted self-attention for single image super-resolution[J/OL]. 2023, arXiv: 2303.09735.
|
| [13] |
Liu Q G, Gao P, Han K, et al. Degradation-aware self-attention based transformer for blind image super-resolution[J/OL]. 2023, arXiv: 2310.04180.
|
| [14] |
Ahn N, Kang B, Sohn K A. Fast, accurate, and lightweight super-resolution with cascading residual network[M]. Computer Vision — ECCV 2018. Cham: Springer International Publishing, 2018: 256-272.
|
| [15] |
Hui Z, Gao X B, Yang Y C, et al. Lightweight image super-resolution with information multi-distillation network[C]. Proceedings of the 27th ACM International Conference on Multimedia. New York, 2019: 2024-2032.
|
| [16] |
Liu J, Tang J, Wu G S. Residual feature distillation network for lightweight image super-resolution[C]. Computer Vision — ECCV 2020 Workshops. Cham: Springer International Publishing, 2020: 41-55.
|
| [17] |
宋昭漾, 赵小强, 惠永永, 等. 多级信息补偿的U型网络图像超分辨率重建算法[J]. 控制与决策, 2023, 38(9): 2479-2486. (Song Z Y, Zhao X Q, Hui Y Y, et al. Image super-resolution reconstruction algorithm of U-shaped network based on multi-level information compensation[J]. Control and Decision, 2023, 38(9): 2479-2486.) |
| [18] |
程德强, 赵佳敏, 寇旗旗, 等. 多尺度密集特征融合的图像超分辨率重建[J]. 光学精密工程, 2022, 30(20): 2489-2500. (Cheng D Q, Zhao J M, Kou Q Q, et al. Multi-scale dense feature fusion network for image super-resolution[J]. Optics and Precision Engineering, 2022, 30(20): 2489-2500.) |
| [19] |
Huang G, Liu Z, Van Der Maaten L, et al. Densely connected convolutional networks[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, 2017: 2261-2269.
|
| [20] |
Huang G, Liu S C, van der Maaten L, et al. CondenseNet: An efficient DenseNet using learned group convolutions[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, 2018: 2752-2761.
|
| [21] |
Nair V, Hinton G E. Rectifed linear units improve restricted Boltzmann machines[C]. International Conference on Machine Learning. Haifa, 2010: 807-814.
|
| [22] |
Xu B, Wang N Y, Chen T Q, et al. Empirical evaluation of rectified activations in convolutional network[J/OL]. 2015, arXiv: 1505.00853.
|
| [23] |
Chen H Y, Gu J J, Zhang Z. Attention in attention network for image super-resolution[J/OL]. 2021, arXiv: 2104.09497.
|
| [24] |
Liu J, Zhang W J, Tang Y T, et al. Residual feature aggregation network for image super-resolution[C]. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle, 2020: 2356-2365.
|
| [25] |
Agustsson E, Timofte R. NTIRE 2017 challenge on single image super-resolution: Dataset and study[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Honolulu, Piscataway: IEEE, 2017: 1122-1131.
|
| [26] |
Higham D J, Higham N J. MATLAB guide[M]. The 3rd Edition. Philadelphia: Society for Industrial and Applied Mathematics, 2016.
|
| [27] |
Bevilacqua M, Roumy A, Guillemot C, et al. Low-complexity single-image super-resolution based on nonnegative neighbor embedding[C]. Proceedings of the British Machine Vision Conference. Surrey, 2012: 1-10.
|
| [28] |
Zeyde R, Elad M, Protter M. On single image scale-up using sparse-representations[C]. Curves and Surfaces. Berlin, 2012: 711-730.
|
| [29] |
Martin D, Fowlkes C, Tal D, et al. A database of human segmented natural images and its application to evaluating segmentation algorithms and measuring ecological statistics[C]. Proceedings of 8th IEEE International Conference on Computer Vision. ICCV. Vancouver, 2001: 416-423.
|
| [30] |
Matsui Y, Ito K, Aramaki Y, et al. Sketch-based manga retrieval using manga109 dataset[J]. Multimedia Tools and Applications, 2017, 76(20): 21811-21838. |
| [31] |
Wang L G, Dong X Y, Wang Y Q, et al. Exploring sparsity in image super-resolution for efficient inference[C]. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville, 2021: 4915-4924.
|
| [32] |
Gao G W, Wang Z X, Li J C, et al. Lightweight bimodal network for single-image super-resolution via symmetric CNN and recursive transformer[J/OL]. 2022, arXiv: 2204.13286.
|
| [33] |
Sun L, Pan J S, Tang J H. ShuffleMixer: An efficient convnet for image super-esolution[J]. Advance in Neural Information Processing Systerms, 2022, 35: 17314-17326. |
| [34] |
Kong F Y, Li M X, Liu S W, et al. Residual local feature network for efficient super-resolution[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. New Orleans, 022: 765-775.
|
| [35] |
Qin J H, Zhang R M. Lightweight single image super-resolution with attentive residual refinement network[J]. Neurocomputing, 2022, 500: 846-855. |
| [36] |
Qin J Y, Chen L H, Jeon S, et al. Progressive interaction-learning network for lightweight single- image super-resolution in industrial applications[J]. IEEE Transactions on Industrial Informatics, 2023, 19(2): 2183-2191. |
| [37] |
Park K, Soh J W, Cho N I. A dynamic residual self-attention network for lightweight single image super-resolution[J]. IEEE Transactions on Multimedia, 2021, 25: 907-918. |
| [38] |
Zhao H Y, Kong X T, He J W, et al. Efficient image super-resolution using pixel attention[C]. Computer Visio — ECCV 2020 Workshops. Cham: Springer International Publishing, 2020: 56-72.
|

