随着不同用途卫星的发射以及遥感技术的飞速发展, 遥感图像的分辨率越来越高, 涵盖的光谱谱段越来越广, 有效完成多目标分类工作从而正确解译卫星数据成为了一个具有挑战性的课题[1-6].目前应用于自然图像分类的经典方法有K近邻分类法(K-NN)、随机森林法(RF)、支持向量机(SVM)、稀疏表示分类器(SRC)[7-10]等.K-NN法以测试样本邻域信息为参照确定其所属类别, 能够较快地完成分类工作, 然而分类精度受数据集的影响较大.RF法通过训练集重构来放大分类模型间的差异, 从而提高组合分类模型的外推预测能力, 实现分类精度的提升, 具有较强的分类鲁棒性, 缺陷是算法训练时间过长.SVM以其在小样本学习上的优势, 降低了学习机对样本信息的依赖性, 然而, 当样本数增多以及为解决多目标分类而创建多个二类SVM分类器时, 过高的机器内存要求和不断增加的运算时间, 都影响了SVM方法的效率.SRC方法以稀疏表示思想为基础, 通过寻找测试样本在不同类别训练样本上的最优稀疏表示系数确定其类别号, 具有很高的分类精度, 然而生成过完备词典对电脑存储的高要求以及过长的运算时间是其主要的缺陷[11].而应用于遥感图像的分类方法, 除了以上几种分类方法外[12-15], 早期的工作是围绕目标物光谱分析为基础的, 生成具有代表性的目标特征曲线或归一化指数进行分类判别.归一化指数的方法, 是指特殊波段间运算所产生的能够代表目标明显特征的指数, 如归一化植被指数(NDVI)、归一化水体指数(NDWI)、归一化雪盖指数(NDSI)分别用于提取植物、水体、雪覆盖信息[16].特征曲线分析方法, 是以同类物质样本在光谱空间的概率相似性为基础的, 主要方法有最大似然法、最小距离法等[17].这些早期遥感图像的分类方法具有很强的先验知识的支撑, 具有很高的分类精度, 然而适用范围却局限于多源数据、多光谱信息.近年来, 基于人工神经网络的遥感图像分类方法通过模拟人类神经系统的结构与功能, 将样本信息以神经元形式传递、加权分析和反馈的方式实现遥感图像的多目标分类.人工神经网络, 主要包括前向网络、反馈网络和自组织网络, 其结构设计很复杂, 具有很强的特征捕捉能力, 在多目标分类工作中取得了不错的效果, 然而过长的学习时间以及网络结构难以收敛等因素都制约了其应用价值[18,19].结合这些经典分类方法的利弊, 我们希望找到一种新的方法, 既不过分依赖数据集的构成, 又能降低算法的存储需求, 并能保证较高的精度和速度.
哈希方法以其低存储、高效率等优势在图像检索领域率先得到了广泛应用, 近年来逐渐推广到图像分类、识别等问题中[20].哈希方法的主要思想是, 在不改变原数据语义相似性的基础上, 通过将高维特征空间映射到低维的汉明空间, 以低字节二值哈希码代替原有的高维实数特征以表征原有数据信息.早期哈希方法如局部敏感哈希(LSH)是数据无关的哈希技术, 对投影向量及二值码初始化采取特定分布中随机采样的策略, 虽然在模拟数据中有足够的理论支撑, 但在实际场景下性能得不到保证[21].近10年的哈希方法研究重心逐渐转化到利用数据自身以及一些监督信息设计高效的哈希函数上, 其主要的分支划分为无监督哈希和监督哈希.无监督哈希方法主要有谱哈希(SH)[22]、可扩展图哈希(SGH)[23]、流形哈希(IMH)[24]等, 通过挖掘数据集的分布信息, 以谱聚类方法、流形结构等模型求解.而通过将语义信息等先验知识嵌入到哈希函数学习中, 监督哈希方法近年来发展迅速, 其主要代表方法有核监督哈希(KSH)[25]、最小损失哈希(MLH)[26]、监督离散哈希(SDH)[27]、列采样监督离散哈希(COSDISH)[28]、旋转不变离散哈希(RIDISH)[29].以标签化类别信息加入到样本训练和测试中, 通过引入核学习、度量学习等方法用于生成二值码, 监督哈希方法在多目标分类应用中更为适用[30].KSH[25](CVPR 2012)通过将核映射思想引入到哈希技术中, 以内积代替汉明距离运算, 在保证样本相似性的基础上提高了分类精度.SDH[27](CVPR 2015)采用适当的嵌入学习算法, 将哈希码直接映射到标签信息上, 并采用离散循环坐标梯度下降方法(DCC)在离散约束下按位求解, 简化了运算过程, 大大提高了算法效率.COSDISH[28](AAAI 2016)以迭代采样语义相似矩阵的多列完成所有数据的训练学习, 代替了传统的松弛化约束求解的方式, 提高了分类方法的速度和稳定性.
目前为止, 哈希方法在自然图像分类问题上已取得了很大的成功, 然而要引入到遥感领域还需要结合遥感卫星成像前后的具体星情.遥感图像的目标识别, 除了受样本有限、纹理丰富等遥感图像数据因素的影响外, 还会因在轨相机的姿态、传感器拍摄时不同方位角和俯仰角而发生变化.随着遥感目标数量的不断增大, 不断增加的几何校正预处理过程已经不能满足在轨实时目标检索和匹配工作的需求.对常见卫星遥感图像, 其成像模型可用中心投影成像来近似, 可以认为观测数据和实际数据间近似满足仿射变换关系[31].为此, 在将哈希引入遥感图像多目标分类时, 需要考察样本的仿射变换信息, 使这些信息的哈希特征表达具有相似性并能更好地表达原样本的类别信息.针对上述问题, 本文提出一种仿射不变离散哈希的框架, 在SDH目标函数中引入仿射不变因子约束, 通过求解汉明空间的离散优化问题实现优质二值码的生成.而仿射不变因子约束项迫使仿射变化扩大的同型号样本集具有相同的二值码, 从而保证了哈希算法的仿射不变性.本文的框架图如图 1所示.
本文的主要贡献有以下两个方面.
(1) 提出一种仿射不变离散哈希方法, 通过在监督离散哈希二值码的生成过程中加入仿射不变项模型优化, 有效地解决了因卫星成像形成的仿射变换畸变对分类精度的影响.
(2) 通过在不同数据集下的实验对比, 其结果表明, 不论是横向对比于经典的哈希方法, 还是纵向对比于经典的分类方法, 本文方法均兼顾了多目标分类的精度和速度.
2 仿射不变离散哈希(AIDH) 2.1 监督离散哈希(SDH)假设有n个样本,
不同于无监督哈希最小化样本间距离相似性的求解方式, 监督哈希利用了训练样本的标签信息, 使得真实类别(标签)与预测类别间的差异尽可能地小.监督哈希的正则化目标函数可表示为
$\left. \begin{gathered} \mathop {{\text{min}}}\limits_{B,W,H} \sum\limits_{i = 1}^n {{{\left\| {{y_i} - {W^T}{b_i}} \right\|}^2} + {\lambda _1}} {\left\| W \right\|^2} \hfill \\ {\rm{s.t}}:{b_i} = {\text{sgn}}(H({x_i})),i = 1,...,n \hfill \\ \end{gathered} \right\}$ | (1) |
其中,
为了获得高质量的哈希码, 使得学习到的二值编码能够保持原有样本空间的相似性, 并减少因随机映射生成哈希函数的误差, 考虑构建哈希函数H(X)将样本的连续特征映射到二值化空间上, 对二值编码B进行离散约束.于是, 式(1)改写为
$ \left. \begin{gathered} \mathop {\min }\limits_{B,W,H} {\left\| {Y - {W^T}B} \right\|^2} + {\lambda _1}{\left\| W \right\|^2} + {\lambda _2}{\left\| {B - H(X)} \right\|^2} \hfill \\ {\text{s}}{\text{.t}}:B \in {\{ - 1,1\} ^{L \times n}},i = 1,...,n \hfill \\ \end{gathered} \right\} $ | (2) |
式(2)的第3项代表哈希函数H(X)与二值码B之间的拟合误差, λ1为惩罚因子.哈希函数通常是采用映射学习算法获取, 为保持样本的非线性结构, 采用如下形式:
$ H(X) = {P^T}\phi (X) $ | (3) |
其中,
若直接将哈希用于遥感图像的目标分类中, 会受限于拍摄时的高度和角度等因素, 形成不同程度的仿射变换.为此, 我们希望在SDH的基础上做出改进, 生成一种具有仿射不变性的哈希编码.
设图像仿射变换前后坐标分别为G(x, y)和G(x, y)∈R2, 则有:
$ {\kern 1pt} {\kern 1pt} \left[ {\begin{array}{*{20}{c}} {x'} \\ {y'} \\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} A&t \\ 0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} x \\ y \\ 1 \end{array}} \right] $ | (4) |
其中, 非奇异阵
依据MSA特征提取的方法可知, 图像在仿射变换前后的对应像素点亮度函数具有相同分布, 这种同分布的关系是独立于仿射变换的; 那么图像的仿射变换不会改变图像所代表物体的语义信息[33].由于仿射变换前后的图像对应着相同标签模式类的信息, 那么可以将仿射后扩大的样本加入到训练样本集, 并加以仿射约束信息优化原有目标函数, 生成更优质的哈希码[2].
定义R个旋转角度α = {α1, α2, …, αR}及其旋转变换
由于仿射变换前后不改变物体本身的语义信息, 那么所得到的哈希码应该是相似的, 生成的哈希码对数据集具有仿射不变性[5,34].类似于旋转不变HOG特征的处理方案, 添加仿射不变约束项如下:
$ Q(B,{T_{\alpha ,\beta }}B){\text{ = }}{\lambda _3}\sum\limits_{i = 1}^n {{{\left\| {{b_i} - \overline {{T_{\alpha ,\beta }}{b_i}} } \right\|}^2} = {\lambda _3}{{\left\| {B - \overline {{T_{\alpha ,\beta }}B} } \right\|}^2}} $ | (5) |
其中,
这样, 式(2)的原目标函数就可以改写为
$ \left. \begin{align} & \underset{B,W,H}{\mathop{\text{min}}}\,{{\left\| Y-{{W}^{T}}B \right\|}^{2}}+{{\lambda }_{1}}{{\left\| W \right\|}^{2}}+{{\lambda }_{2}}{{\left\| B-H(X) \right\|}^{2}}\text{+}{{\lambda }_{3}}{{\left\| B-\overline{{{T}_{\alpha ,\beta }}B} \right\|}^{2}} \\ & \text{s}\text{.t}:B\in {{\{-1,1\}}^{L\times n}},i=1,...,n \\ \end{align} \right\} $ | (6) |
可以看到, 通过添加此约束项可以迫使每个样本生成哈希码更接近于其张成的仿射样本子空间的均值, 从而实现整体样本集Xα, β与其二值哈希编码B尽可能地相似.式(6)即为仿射不变离散哈希所需优化的目标方程[35].
2.3 优化求解方案仿射不变离散哈希的未知变量分别为B、W、H, 可以通过交替优化的方式把式(6)的问题分解为3个子问题, 分别进行求解.
(1) P-step:固定B、W, 优化P.
由于P优化的过程只与H(X)有关, 因而, 只需优化式(6)中的第3项.求解结果如下:
$ P = {(\phi (X)\phi {(X)^T})^{ - 1}}\phi (X){B^T} $ | (7) |
(2) W-step:固定P、B, 优化W.
原方程简化为求解只有前两项的监督哈希问题, 通过最小二乘法可求解:
$ W{\text{ = (}}B{B^T}{\text{ + }}{\lambda _1}I{{\text{)}}^{ - 1}}B{Y^T} $ | (8) |
(3) B-step:固定W、P, 优化B.原问题转化为求解式(9)所示函数:
$ \left. \begin{gathered} \mathop {\min }\limits_B {\left\| {Y - {W^T}B} \right\|^2} + {\lambda _2}{\left\| {B - H(X)} \right\|^2} + {\lambda _3}{\left\| {B - \overline {{T_{\alpha ,\beta }}B} } \right\|^2} \hfill \\ {\text{s}}{\text{.t}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} B \in {\{ - 1,1\} ^{L \times n}} \hfill \\ \end{gathered} \right\} $ | (9) |
将式(9)展开, 再化简, 等价于求解:
$ \left. \begin{gathered} \mathop {{\text{min}}}\limits_B {\left\| {{W^T}B} \right\|^2} - 2Tr({B^T}A) \hfill \\ {\text{s}}{\text{.t}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} B \in {\{ - 1,1\} ^{L \times n}} \hfill \\ \end{gathered} \right\} $ | (10) |
其中,
受SDH优化方式的启发, 采用DCC来按位求解哈希码, 每一位对应B的一行数据.
令bi为矩阵B的第i行, qi为矩阵Q的第i行, wi为矩阵W的第i行;
$ \left. \begin{gathered} {\left\| {{W^T}B} \right\|^2} = const + 2{w^T}{\widetilde W^T}\widetilde Bb \hfill \\ Tr({B^T}A) = const + {a^T}b \hfill \\ \end{gathered} \right\} $ | (11) |
式(11)中const为常数项, 不影响优化过程.将式(11)代入式(10)中约掉常数项和倍数项, 可得:
$ \left. \begin{gathered} \mathop {{\text{min}}}\limits_b ({w^T}{\widetilde W^T}\widetilde B - {a^T})b \hfill \\ {\text{s}}{\text{.t}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} b \in {\{ - 1,1\} ^n} \hfill \\ \end{gathered} \right\} $ | (12) |
这个问题可以获得如下的闭解:
$ b = {\text{sgn}}(a - {\widetilde B^T}\widetilde Ww) $ | (13) |
因而, 本文方法的基本步骤可见下面的算法[35].
算法.仿射不变离散哈希(AIDH).
输入:训练样本
输出:二值码
(1) 在训练样本集中随机选取m个样本, 并利用径向基函数求得式(3)中的ϕ(X).
(2) 随机方式初始化所有样本的二值码
(3) 循环下述3个步骤直至收敛.
W-step:利用式(8)计算W.
P-step:利用式(7)计算P, 代入式(3)中, 求解H(X).
B-step:利用式(13)按位迭代学习bi, 得到哈希码
为了验证AIDH算法的有效性, 本文采用两个数据集NWPU VHR-10和RSOD-Dataset.NWPU VHR-10是西北工业大学团队标注的航天遥感目标检测数据集, 而RSOD-Dataset是武汉大学团队标注的一个遥感图像公共数据集[36].两个数据集通过提供了源图像以及各自图像中所含带目标坐标信息的标签文件(ground truth), 给出了可提取的多类目标样本.这两个数据集的优势就在于源图像的存在给出了旋转样本边缘的信息, 避免了样本自旋转产生的边缘黑带.
NWPU VHR-10提供了650幅图像, 生成了3 896个目标, 分为10个数据类, 分别为757架飞机、302艘舰船、655个油桶、390座棒球场、524座网球场、159座篮球场、163座足球场、224个港口、124座桥梁、598个车辆.这些数据来自谷歌地球(分辨率0.5m~2m)和法伊英根数据(分辨率0.08m)[4].RSOD-Dataset提供了936幅图像, 生成了7 400个目标, 分为4个数据类, 分别为5 374架飞机、1 698个油桶、176架立交桥、149个操场.这些数据取自谷歌地图和天地图等, 图 2给出了该数据集的各类目标信息, 而各类目标的分辨率见表 1.
在数据的特征选择上, 使用的是国际上公认的Gist特征[37].该特征是512维的, 由基于视觉词袋模型的网格化Gabor小波系数组成.在样本集设置上(以RSOD-Dataset为例), 按比例随机抽取2 000个来自4类的目标作为测试样本集; 然后, 对剩余的5 400个样本集作仿射变换, 并对扩大后的样本集打乱次序后作为训练样本集, 将训练和测试样本集的特征及其类别标签合成到一个.mat文件中用于算法验证.本文的实验中, 旋转系数为R = 11, α = {30°, 60°, …, 330°}, 缩放系数都是S = 2, β = {0.5, 0.75}.此外, 为了验证算法的有效性, 我们生成了10组.mat文件, 取平均值作为算法的精度结果.本文的所有实验是在软件MATLAB 2014a上仿真实现的, 电脑的处理器是英特尔酷睿i7-8550U, CPU主频1.99GHz, 内存为8GB RAM.
3.2 实验对比及定量分析本文是以哈希方法为基础的遥感多目标分类, 实验分为两部分, 一是比较本文方法和经典的哈希方法之间的精度, 二是比较本文方法与传统的多目标分类方法之间的优越性.
3.2.1 哈希方法之间的性能对比为了验证仿射不变离散哈希方法在哈希函数改进上的优越性, 本文选取了谱哈希(SH)[22]、可扩展图哈希(SGH)[23]、核监督哈希(KSH)[25]、列采样监督离散哈希(COSDISH)[28]、监督离散哈希(SDH)[27]、旋转不变离散哈希(RIDISH)[29]作为对比方法以验证算法的精度.此外, 为了验证本文方法相对于旋转不变离散哈希的优势, 特增加一步实验, 旋转 & 尺度不变离散哈希(RI & SIDISH)代表的是旋转不变离散哈希方法在旋转不变约束项中加入缩放变换的结果.
定量指标上, 选取4个指标来评价算法的精度.表 2~表 5显示出这些指标在各种哈希算法下的评价结果.
(1) 平均分类精度(MAP):准确分类的目标占总数的比例.
(2) 前1 000个样本的分类精度(precision of top 1000 returned samples):对所有测试样本寻找其匹配度较高的前1 000个训练样本计算其分类精度, 再对这些测试样本分类精度取平均值.
(3) 汉明距离在半径为2时的分类精度(precision of Hamming distance with radius 2):以汉明距离小于等于2为测度, 对所有测试样本寻找与其接近的训练样本并计算分类精度, 再对这些测试样本的分类精度取平均值.
(4) 各分类精度(AP):各类目标的分类精度.
表 2~表 4从宏观的角度给出了7种哈希方法在多目标分类中的精度对比情况.在哈希字节的选取上, 给出了8字节、16字节、32字节和64字节的数据.可以看到, 随着哈希字节数的增长, 各种哈希方法的增长趋势是一致的, 直至32字节, 而到了64字节时, 很多哈希方法的精度反而会有所降低.这种情况的发生往往取决于数据集的分布以及过拟合的发生.鉴于此, 在表 5中给出了32字节时各目标分类的结果.
两个数据集均能有效验证7种哈希方法的分类精度.从宏观对比上看, 武汉大学RSOD-Dataset数据集的分类精度较高于西北工业大学NWPU VHR-10数据集的分类精度, 究其原因是, 武汉大学的数据集虽然样本数很多, 但是数据类型较少(4个), 样本的差异性较大, 数据集较为简单, 使得分类的精度偏高.而西北工业大学的数据集, 包含的数据类型较多(10个), 样本集的多样性增加了准确分类的难度, 更能层次化地反映出不同算法在多目标的分类效果.
从监督和无监督哈希方法之间对比上来看, 两种无监督哈希方法SH、SGH的精度较低, 甚至连30%都不到, 这符合了机器学习中无监督方法在没有先验信息时, 即使挖掘更多的数据自身的特征也难以有效提升分类精度的结论.而6种监督哈希方法的平均分类精度都达到了至少65%以上.而且, KSH方法在8字节处的分类精度就已达到了67.73%的精度, 说明了哈希方法以较少的字节依然能够很好地区分出不同目标类的语义信息.COSDISH方法在8字节处就取得了高于KSH、SDH的分类精度, 然而, 随着哈希码字节数的增多, 分类精度的增长却不如其他方法明显, 该方法的优点在于, 对样本数目不敏感, 两个数据集下分类精度随字节增长的幅度相似, 代表着这种算法的稳定性很高.
观察表 2后4行的数据可以发现, RIDISH相对于SDH有更大的提升在于8字节处就能获得8成以上的分类精度, 这主要得益于该方法考虑了样本的旋转多样性.而观察RIDISH和RI & SIDISH的精度可以发现, 在加入原数据的缩放样本后, 数据的精度反而有所下降(约为4%).这个现象表明, 数据的尺度性会影响到RIDISH的分类精度.而本文方法在考察了样本的仿射变换信息后, 精度达到了93.74%, 高于RI & SIDISH方法的89.91%, 即说明本文方法在不同尺度目标的语义表达的有效性, 达到了改进哈希方法对仿射不变性的要求.同时, 本文方法在MAP等精度上也略高于RIDISH方法, 表明本文方法继承并发扬了旋转不变哈希在哈希码约束项上改造的优势.
图 3和图 4直观地给出了两个数据集下7种哈希方法在不同字节数时的3种分类精度指标.
不难看出, SH、SGH方法的分类精度偏低, 32字节之后精度不再提升甚至会有所下降, 尤其是汉明半径在2以内的分类精度在64字节处极低, 表明汉明半径以2为测度时加入进了过多的误判样本.而KSH、COSDISH、SDH则高于两种无监督哈希方法, 这一方面得益于类标签信息的引入, 另一方面则是核学习方法的优势.然而, 这两种方法在8字节处的精度还是偏低于后3种方法, 毕竟字节数过少难以准确地表达出样本的特征.而RISDH、RI & SIDISH和本文方法在各字节下均保持着较高的精度, 而且分类效果相对稳定, 这主要得益于样本集扩充和算法的有效性, 以样本点的成倍增加弥补了特征维数低的不足.
表 5给出了两个数据集中不同哈希方法在32字节下, 各目标的分类精度以及总体分类精度(MAP).从纵向对比可以看到, NWPU VHR-10数据集在飞机、油桶、车辆等小目标的分类精度上均较高, 而篮球场、桥梁、足球场等大目标的精度则偏低.这种现象的出现原因有两个:(1)小目标的分辨率都较高, 辨识度高, 降低了分类的难度; 反之, 大目标覆盖范围广, 分辨率较低, 又包含了很多有用信息, 无形中提高了分类的难度.(2)从数据集的构成上看, 小目标的样本数较多, 而大目标的样本数较少.这一点无疑更加重要, 从“网球场”这一类来看, 同样是大目标数据, 在样本数足够多的情况下依然取得了不错的效果.同样地, 对于RSOD-Dataset而言, 立交桥和操场的分类精度要低于飞机和油桶.而从横向对比不同方法在各目标分类精度的结果来看, 本文方法虽然在个别目标类的分类精度与RIDISH不相上下(表格中加粗显示), 但是, 整体分类精度的提高, 尤其是篮球场和桥梁两个“短板”精度上的提高, 反映出仿射不变离散哈希在多目标分类上的优势.
最后, 我们给出各参数对本文方法的影响.AIDH主要有3个参数(R、S、m), 分别是旋转系数、缩放系数以及锚点数.下面通过变化其中一个参数、固定另外两个参数来分析各参数对算法精度的影响.旋转系数对算法的影响是以旋转间隔角的变化来体现的, 通过变换旋转间隔角以分析其对分类精度的影响.缩放系数方面, 可以通过缩放尺度变化以分析其对分类精度的影响.而锚点数, 则通过增加哈希模型中改变锚点的个数来分析其对分类精度的影响.下面以NWPU VHR-10为例, 图 5给出了本文方法在哈希码为8字节、32字节时MAP随参数变化的影响情况, 其中旋转间隔角以15、30、45、90、180、360完成实验; 缩放比例按照0.75、0.5、0.25、(0.5, 0.75)、(0.25, 0.75)、(0.25, 0.5)作对比(不作旋转); 锚点数则给出了500、1 000、1 500、2 000、4 000个锚点作为对比参数.
图 5所示实验结果表明, 当算法的3个参数在32字节时对MAP的提升幅度小于8字节时, 其中不同字节下锚点数的增长对算法的精度都有稳定性提升, 这是来源于SDH方法引入嵌入学习对算法精度提升的效果.在8字节时, 随着旋转间隔角的减小, 算法的精度不断提升, 直至15后(R = 12)趋于平稳; 而在缩放系数方面, 在0.5和0.75这两个尺度下, 达到算法精度的极值点; 当缩放系数小于0.5时, 算法精度则有所降低.为此, 本文选取(0.5, 0.75)两个尺度相结合作为缩放系数; 而从锚点数的影响上来看, 当锚点数小于2 000时, 随着锚点数的增加, 分类精度稳步提升, 而大于2 000后, 分类精度则基本不发生变化, 因此实验中选取2 000作为锚点数.从定量上来看, 锚点数可以对分类精度带来10%~15%的稳步提升, 而旋转系数和缩放系数在8字节下对算法精度影响更大, 有5%~10%的提升.分析这种现象的原因在于, 本文算法能够在低字节下更充分地挖掘样本信息并做出更有效的哈希码表达, 而随着字节数的增大, 哈希码承载的维度越高, 表达信息就越多, 算法的优势也就不再明显, 从而MAP的提升有限.
3.2.2 不同分类器方法的性能对比为了验证仿射不变哈希方法在分类方法上的优越性, 本文选取了K-NN[12]、RF [13]、SVM[14]、SRC [15]作为对比方法以验证算法的精度, 以MAP和运算用时作为评价标准.表 6给出几种分类方法的对比情况, 其中, 稀疏表示分类器采用L1范数的L1-SRC测试, 本文方法给出了32字节的数据.
表 6给出了5种方法在两个数据集下的MAP和所用时间对比情况.首先看MAP数据, 稀疏表示分类器方法的分类精度与本文方法不相上下, 而其余的经典分类方法的精度都低于这两种方法; 而在RSOD-Dataset数据集上, 这种精度优势则有所缩小.K近邻分类方法和RF方法精度相近, K-NN在样本数较多的RSOD-Dataset数据集上精度略高于RF的算法精度.SVM方法以其小样本学习的优势具有较好的分类精度, 在几种方法中排在中间的位置, 换到类别数较少的RSOD-Dataset数据集上, 也很接近于SRC和AIDH.
再比较一下几种方法运行耗时情况.比较两个数据集后发现, RSOD-Dataset数据集比NWPU VHR-10数据集的用时要多出一倍左右, 这是因为RSOD-Dataset的样本数比NWPU VHR-10的样本数要多出一倍; 而各种方法随着样本数的增加, 所消耗的时间也随之成倍增加.再比较各分类算法, K-NN方法虽然精度较低, 但是运行时间却是很快的, 在NWPU VHR-10数据集下只需要20多秒即完成了运算, 并且两个数据集下都很稳定.综合考虑, 在样本数适当提高的情况下, K-NN方法在效率上是可观的.SVM和RF都是比较耗时的方法, 在小数据集上也花去了1分钟左右的时间.而在精度上有优势的L1-SRC方法, 由于算法随样本数增长时运算量过大同时也更占用内存, 因而运行时间也增加很多, 在大数据集下花掉了将近5分钟的时间.本文方法只在式(3)的锚点计算以及式(5)的约束平均项计算上消耗了一点时间, 哈希码迭代的次数也仅在6次之内完成, 而且哈希码的存储单位只在32字位上, 因此, 算法的运行时间很短, 大约是10s左右.
此外, 再比较几种方法的机器存储类型.几种对比方法的特征都是512维的特征, 在RSOD-Dataset数据集下, 它们占用的存储空间达到了15MB.即使由于仿射变换扩大了数据集构成, 32位的AIDH方法的样本存储量也只有767KB.以32位的二值码代替512维的浮点型数据, 哈希方法的优势是大幅降低算法用时的主要原因.
综上所述, 相比于其他几种分类方法, 本文方法以其数据存储和编码优化的优势, 在较短的运算时间内获得了更高的分类精度.
4 结论本文首先回顾了经典分类方法在遥感图像处理中的优势与不足, 将兼具低存储和高效性的哈希方法引入到遥感多目标分类领域中.为解决哈希方法在仿射变换数据监测的有效性, 构建仿射不变离散哈希模型.通过在监督离散哈希方法中, 加入仿射不变项约束, 迫使同型号目标分享相同的二值码, 增加同类目标哈希码的相似性, 实现哈希方法的仿射不变性.为了验证算法的有效性, 本文采用NWPU VHR-10和RSOD-Dataset数据集作为样本库进行了实验.实验中, 以6种不同的哈希方法以及4种不同的分类方法作对比, 并以平均分类精度、运算用时等作为定量指标评价.实验结果表明, 相比于各对比方法, 本文方法改善了几个样本类别数较少的目标类的精度, 从而取得了更高的总体分类精度.此外, 哈希方法低存储的优势使得本文方法相较于经典分类方法在速度上得到了提升.
[1] |
Zhang NJ, Zhang J, Zhang X, Lang HT. Task distribution balancing for parallel two-parameter CFAR ship detection. Journal of Remote Sensing, 2016, 2: 344-351(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/ygxb201602015 |
[2] |
Zhen JX, Fu J, Fu X. Aircraft target recognition in remote sensing images based on distribution of the feature points and invariant moments. Journal of Image and Graphics, 2014, 4: 592-602(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/zgtxtxxb-a201404014 |
[3] |
Chen Z, Ma HC, Zhang L. Cloverleaf interchange boundary extraction from airborne LiDAR data based on advanced neighborhood structure and contour analysis. Journal of Remote Sensing, 2013, 17(5): 1146-1157(in Chinese with English abstract).
|
[4] |
Cheng G, Han JW, Zhou PC, Guo L. Multi-class geospatial object detection and geographic image classification based on collection of part detectors. ISPRS Journal of Photogrammetry & Remote Sensing, 2014, 98(1): 119-132.
http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=c15722fa36b873da4e3eae42f72acbbd |
[5] |
Cheng G, Zhou PC, Yao XW, Yao C, Zhang YB, Han JW. Object detection in VHR optical remote sensing images via learning rotation-invariant HOG feature. In: Proc. of the Int'l Workshop on EORSA. 2016. 433-436.
|
[6] |
Chen XM. The study of disaster target automatic classification based on high-resolution remote sensing images[Ph.D. Thesis]. Beijing: China University of Geosciences, 2016(in Chinese with English abstract).
|
[7] |
Hou YT, Peng JY, Hao LW, Wang R. Research of classification method for natural images based on adaptive feature-weighted K-nearest neighbors. Application Research of Computers, 2014, 31(3): 957-960(in Chinese with English abstract).
[doi:10.3969/j.issn.1001-3695.2014.03.077] |
[8] |
Bosch A, Zisserman A, Munoz X. Image classification using random forests and ferns. In: Proc. of the IEEE Int'l Conf. on Computer Vision. 2007. 14-21.
|
[9] |
Wu W, Nie JY, Gao GL. Improved SVM multiple classifiers for image annotation. Computer Engineering & Science, 2015, 37(7): 1338-1343(in Chinese with English abstract).
[doi:10.3969/j.issn.1007-130X.2015.07.018] |
[10] |
Wright J, Yang AY, Ganesh A, Sastry SS, Ma Y. Robust face recognition via sparse representation. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.
[doi:10.1109/TPAMI.2008.79] |
[11] |
Zhao LJ, Tang P. Scalability analysis of typical remote sensing data classification methods:A case of remote sensing image scene. Journal of Remote Sensing, 2016, 20(2): 157-171(in Chinese with English abstract).
http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=ygxb201602001 |
[12] |
Wang XM, Zhang HL. Hyperspectral remote sensing image classification using geodesic-based KNN. Journal of Shanxi Coalmining Administrators College, 2013, 26(4): 135-137(in Chinese with English abstract).
[doi:10.3969/j.issn.1008-8881.2013.04.059] |
[13] |
Pal M. Random forest classifier for remote sensing classification. Int'l Journal of Remote Sensing, 2005, 26(1): 217-222.
[doi:10.1080/01431160412331269698] |
[14] |
Zhao CH, Liu W, Xu Y, Wen JH. A spectral-spatial SVM-based multi-layer learning algorithm for hyperspectral image classification. Remote Sensing Letters, 2018, 9(3): 218-227.
[doi:10.1080/2150704X.2017.1415475] |
[15] |
Wu SL, Chen HD, Bai Y, Zhu GK. A remote sensing image classification method based on sparse representation. Multimedia Tools and Applications, 2016, 75(19): 12137-12154.
http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0232541825/ |
[16] |
Bulley H, Bishop MP, Shroder JF. Integration of classification tree analyses and spatial metrics to assess changes in supraglacial lakes in the Karakoram Himalaya. Int'l Journal of Remote Sensing, 2012, 34(2): 387-411.
|
[17] |
Sisodia PS, Tiwari V, Kumar A. Analysis of supervised maximum likelihood classification for remote sensing image. In:Recent Advances & Innovations in Engineering., 2014, 1-4.
http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_97dd64e7b0894c23177bc8f01195e95a |
[18] |
Cheng G, Zhou PC, Han JW. Learning rotation-invariant convolutional neural networks for object detection in VHR optical remote sensing images. IEEE Trans. on Geoscience and Remote Sensing, 2016, 54(12): 7405-7415.
[doi:10.1109/TGRS.2016.2601622] |
[19] |
Meher Sk. Knowledge-encoded granular neural networks for hyperspectral remote sensing image classification. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6): 2439-2446.
[doi:10.1109/JSTARS.2015.2395991] |
[20] |
Wang JD, Shen HT, Song JK, Ji JQ. Hashing for similarity search:A survey. Computer Science, 2014, 1-29.
[doi:10.5121/csit.2014.41000] |
[21] |
Gionis A, Indyk P, Motwani R. Similarity search in high dimensions via hashing. In: Proc. of the 25th VLDB Conf. 1999, 8(2): 518-529.
|
[22] |
Weiss Y, Torralba A, Fergus R. Spectral hashing. In: Proc. of the Int'l Conf. on Neural Information Processing Systems (NIPS). 2008,282(3): 1753-1760.
|
[23] |
Jiang QY, Li WJ. Scalable graph hashing with feature transformation. In: Proc. of the Int'l Conf. on Artificial Intelligence (ICAI). 2015, 9(3): 2248-2254.
|
[24] |
Shen FM, Shen CH, Shi QF, Hengel AVD, Tang ZM. Inductive hashing on manifolds. In: Proc. of the Computer Vision and Pattern Recognition (CVPR). 2013. 1562-1569.
|
[25] |
Liu W, Wang J, Ji RR, et al. Supervised hashing with kernels. In: Proc. of the Computer Vision and Pattern Recognition (CVPR). 2012. 2074-2081.
|
[26] |
Norouzi M, Blei DM. Minimal loss hashing for compact binary codes. In: Proc. of the Int'l Conf. on Machine Learning (ICML). 2011. 353-360.
|
[27] |
Shen FM, Shen CH, Liu W, Shen HT. Supervised discrete hashing. In: Proc. of the Computer Vision and Pattern Recognition (CVPR). 2015. 37-45.
|
[28] |
Kang WC, Li WJ, Zhou ZH. Column sampling based discrete supervised hashing. In: American Association for Artificial Intelligence (AAAI). 2016. http://cs.nju.edu.cn/lwj/paper/AAAI16_COSDISH.pdf
|
[29] |
Xu H, Liu YZ, Sun QS. Object classification of remote sensing images based on rotation-invariant discrete hashing. In: Proc. of the Pacific RIM Conf. on Multimedia. 2017. 264-274.
|
[30] |
Shen XB. Study of multi-view embedding learning techniques with applications[Ph.D. Thesis]. Nanjing: Nanjing University of Science and Technology, 2017(in Chinese with English abstract).
|
[31] |
Tang T. Affine invariant feature and its application to target recognition in remote sensing images[Ph.D. Thesis]. Changsha: National University of Defense Technology, 2006(in Chinese with English abstract).
|
[32] |
Wang FG, Feng XC, Zhang XB. Stationary wavelet transform for affine invariant image object recognition. Computer Engineering and Applications, 2007, 43(21): 239-241(in Chinese with English abstract).
[doi:10.3321/j.issn:1002-8331.2007.21.072] |
[33] |
Zhang JY, Chen Q, Bai XJ, Sun QS, Xia DS. Affine invariant feature extraction algorithm based on generalized canonical correlation analysis. Journal of Electronics & Information Technology, 2009, 31(10): 2465-2469(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/dzkxxk200910034 |
[34] |
Gao F, Wen XJ. A new method for affine invariants extraction based on affine geometry. Journal of Image and Graphics, 2011, 16(3): 389-397(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/zgtxtxxb-a201103014 |
[35] |
Kong J, Sun QS, Ji ZX, Liu YZ. A novel fast object detection method in remote sensing image based on affine-invariant supervised discrete hashing. Journal of Nanjing University Natural Science, 2019, 55(1): 49-60(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/njdxxb201901005 |
[36] |
Long Y, Gong YP, Xiao ZF, Liu Q. Accurate object localization in remote sensing images based on convolutional neural networks. IEEE Trans. on Geosciences and Remote Sensing, 2017, 55(5): 2486-2498.
[doi:10.1109/TGRS.2016.2645610] |
[37] |
Liu J, Guo J, He ZL. Scene classification based on gist and PHOG feature. Computer Engineering, 2015, 41(4): 232-235(in Chinese with English abstract).
http://d.old.wanfangdata.com.cn/Periodical/jsjgc201504044 |
[1] |
张临杰, 张杰, 张晰, 郎海涛. 任务分配均衡的双参数CFAR舰船检测并行算法. 遥感学报, 2016, 2: 344-351.
http://d.old.wanfangdata.com.cn/Periodical/ygxb201602015 |
[2] |
曾接贤, 付俊, 符祥. 特征点和不变矩结合的遥感图像飞机目标识别. 中国图像图形学报, 2014, 4: 592-602.
http://d.old.wanfangdata.com.cn/Periodical/zgtxtxxb-a201404014 |
[3] |
陈卓, 马洪超, 张良. 改进邻域结构与轮廓分析的LiDAR点云立交桥提取. 遥感学报, 2013, 17(5): 1146-1157.
|
[6] |
程希萌.基于高分遥感影像的灾害目标自动分类技术[博士学位论文].北京: 中国地质大学, 2016.
|
[7] |
侯玉婷, 彭进业, 郝露微, 王瑞. 基于KNN的特征自适应加权自然图像分类研究. 计算机应用研究, 2014, 31(3): 957-960.
[doi:10.3969/j.issn.1001-3695.2014.03.077] |
[9] |
吴伟, 聂建云, 高光来. 一种基于改进的支持向量机多分类器图像标方法. 计算机工程与科学, 2015, 37(7): 1338-1343.
[doi:10.3969/j.issn.1007-130X.2015.07.018] |
[11] |
赵理君, 唐娉. 典型遥感数据分类方法的适用性分析——以遥感图像场景分类为例. 遥感学报, 2016, 20(2): 157-171.
http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=ygxb201602001 |
[12] |
王小美, 张红利. 基于测地距离的KNN高光谱遥感图像分类. 山西煤炭管理干部学院学报, 2013, 26(4): 135-137.
[doi:10.3969/j.issn.1008-8881.2013.04.059] |
[30] |
沈肖波.多视图嵌入学习方法及其应用研究[博士学位论文].南京: 南京理工大学, 2017.
|
[31] |
唐涛.图像仿射不变特征及其在遥感图像目标识别中的应用[博士学位论文].长沙: 国防科技大学, 2006.
|
[32] |
王凤国, 冯象初, 张小波. 平稳小波变换在仿射不变性目标识别中的应用. 计算机工程与应用, 2007, 43(21): 239-241.
[doi:10.3321/j.issn:1002-8331.2007.21.072] |
[33] |
张洁玉, 陈强, 白小晶, 孙权森, 夏德深. 基于广义典型相关分析的仿射不变特征提取方法. 电子与信息学报, 2009, 31(10): 2465-2469.
http://d.old.wanfangdata.com.cn/Periodical/dzkxxk200910034 |
[34] |
高峰, 文项坚. 利用仿射几何的仿射不变特征提取方法. 中国图像图形学报, 2011, 16(3): 389-397.
http://d.old.wanfangdata.com.cn/Periodical/zgtxtxxb-a201103014 |
[35] |
孔颉, 孙权森, 纪则轩, 刘亚洲. 基于仿射不变离散哈希的遥感图像快速目标检测新方法. 南京大学学报(自然科学), 2019, 55(1): 49-60.
http://d.old.wanfangdata.com.cn/Periodical/njdxxb201901005 |
[37] |
刘静, 郭建, 贺遵亮. 基于Gist和PHOG特征的场景分类. 计算机工程, 2015, 41(4): 232-235.
http://d.old.wanfangdata.com.cn/Periodical/jsjgc201504044 |