软件学报  2018, Vol. 29 Issue (8): 2501-2510   PDF    
基于Haar小波域指标自适应选择载体的JPEG隐写
黄炜1, 赵险峰2     
1. 厦门大学 软件学院, 福建 厦门 361005;
2. 信息安全国家重点实验室(中国科学院 信息工程研究所), 北京 100093
摘要: 为了解决目前图像纹理复杂度建模的隐写载体选择指标难以有效适用于JPEG隐写的问题,提出一种基于Haar小波域指标自适应选择载体的JPEG隐写方法,以高阶Haar小波变换模型建立JPEG图像像素关系,计算各方向上的分解图像矩阵的范数均值,用于选择难以被检测的载体.该指标比已有方法的像素间建模能力更强,更能反映JPEG隐写所影响的像素间关系,且能增强JPEG隐写的隐蔽性.实验结果表明,在大多数情况下,与现有载体选择指标相比,该方法与隐写隐蔽性具有更高的相关性.使用该方法优选的载体进行隐写,比优选前的隐蔽性提高约7.7%,比用现有指标优选载体的JPEG隐写方法的隐蔽性平均提高约2.0%.因此,该方法隐写具有更高的隐蔽性.
关键词: 隐写     载体选择     Haar小波     范数    
JPEG Steganography Based on Adaptive Cover Selection Using Haar Wavelet Domain Indicators
HUANG Wei1, ZHAO Xian-Feng2     
1. Software School, Xiamen University, Xiamen 361005, China;
2. State Key Laboratory for Information Security(Institute of Information Engineering, The Chinese Academy of Sciences), Beijing 100093, China
Foundation item: Fujian Natural Science Foundation Program Youth Innovation Project (2018J05112); National Natural Science Foundation of China (61402390, U1636102); National Key Technology R & D Program of China (2014BAH41B01); National Key Research and Development Program of China (2016YFB0801003)
Abstract: The existing steganographic cover selection indicators based on image texture complexity modeling are not compatible with JPEG steganography. To solve this problem, a JPEG steganography is proposed based on cover selection using Haar wavelet domain indicators. This method establishes the relationship of JPEG image pixels by taking high-ordered Haar wavelet translation as the model, and calculates the average norm of the decomposition image matrix in each direction to select highly undetectable covers. Moreover, the proposed indicator, which performs better than most of the existing models in the inter pixel modeling ability, can enhance the concealment of JPEG steganography in cover selection. Experimental results show that, in most cases, the proposed JPEG steganography using cover selection achieves higher concealment than that without selecting covers by an average value of about 7.7%. This figure has higher concealment than the existing cover selection indicators by an average value of 2.0%. Therefore, the proposed steganography attains better concealment.
Key words: steganography     cover selection     Haar wavelet     norm    

隐写术(steganography)[1]是一种信息隐藏技术, 它通过编码将隐蔽信息藏于主流媒体中来掩盖通信的事实.随着JPEG图像的广泛使用, 以JPEG为载体的隐写成为研究人员关注的重点之一.相应地, 隐写分析(steganalysis)[2]则是检测给定信号中隐写行为存在性或存在可能性的技术, 它通常借助统计或模式分类的方法预测给定信号存在隐写行为的可能性.现有文献中, 衡量隐写算法在通用配置下的优劣指标主要为隐蔽性, 一般是指该隐写算法所嵌入的一组图像在隐写分析时的平均错误率[3].如果错误率较高、较难被准确检测, 则认为隐写算法是较安全的[4].因而, 提高隐写算法的隐蔽性, 对保护个人的隐私和企业的商业秘密具有现实意义.

高隐蔽性隐写方法主要通过3个方面增强隐蔽性:(1)通过密钥置乱图像像素, 将隐蔽信息随机分散到图像的不同位置[5]; (2)结合编码学方法减少扰动像素或JPEG系数数量[6]等; (3)利用校验网格码(sydrome trellis code, 简称STC)[7]等编码方法, 自适应选择在总体代价之和较小的位置嵌入.目前, 空域最有效的空域通用小波隐写(S-UNIWARD)[8]和最小化最优检测器的功率(MiPOD)[9]等算法以及JPEG隐写最有效的边信息通用小波隐写(SI-UNIWARD)[8]、JPEG通用小波隐写(J-UNIWARD)[8]等都采用该方法, 极大地提高了隐写隐蔽性.自适应隐写方法通常将图像的纹理属性作为代价函数, 故可知, 图像中纹理复杂程度与隐写分析准确率有一定的联系.

现有的通用隐写分析方法通常提取图像特征并选用合适的分类器进行训练和预测, 其中, 对JPEG图像隐写最有效的特征之一是22 510维校准富模型特征(CC-JRM)[10], 而最有效的低维特征之一是联合校准特征[11].上述两种特征主要通过对待测图像截取4行4列重新压缩以估计原图像, 计算图像的灰度共生矩阵来刻画图像像素间的关系, 具有很好的效果.这说明, 用于刻画图像像素间关系的指标与隐写分析准确率有一定的相关性.

学者们[4, 12-15]已意识到, 隐写行为的隐蔽性不仅与隐写算法设计有关, 也受载体图像的选择的影响.载体选择是指在多样本隐写的环境[16]下选出一类隐写分准确率较低的图像用于嵌入, 可以进一步提升隐蔽性.载体选择方法可按隐写者对隐写分析者的掌握程度分为无知识、部分知识和全知识这3类[13].其中, 无知识的方法通常对某个影响隐写隐蔽性的图像属性计算评价指标, 作为载体选择的依据, 计算复杂度低, 适合于在便携设备等情形下使用.除了较为直观的图像尺寸、可嵌入位置和JPEG质量因子之外[13], 还有纹理复杂度评价指标.全知识类[17, 18]需要隐写分类器的反馈, 其中, 构造隐写分类器、提取特征等环节计算量很大.部分知识类[19]则需要反复生成隐写图像用以计算载体和隐写图像之间的相似度, 运行耗时长.

目前用于载体选择的图像纹理复杂度指标, 在指示空域位图隐写隐蔽性方面取得了很好的效果, 却不能很好地指示JPEG隐写隐蔽性.主要指标包括信息熵[14]、局部方差[12]和线性预测误差法[15]等.信息熵方法仅与图像的直方图特性有关, 对纹理的指示作用较弱; 局部方差以水平或垂直位置相邻两个像素间差值平方和为指标, 仅考虑相邻像素间的线性关系; 线性预测误差法则用最近的8或24个像素预测中央的像素, 将预测均方误差作为指标, 仅考虑了3×3或5×5分块像素间的线性关系.事实上, JPEG编码的有损压缩是非线性的, 对JPEG量化系数的改变反映为空域上8×8像素分块的改变, 因而上述线性的载体选择指标具有提高的空间.

为了解决目前图像纹理复杂度隐写载体选择指标难以有效适用于JPEG隐写的问题, 本文提出一种基于Haar小波指标自适应选择载体的JPEG隐写.该方法对图像做高阶Haar小波变换, 计算各方向上的分解图像矩阵的范数作为载体选择的指标.该指标采用的小波域模型比已有方法的模型像素间建模能力更好.在公开图像和隐写算法下的实验下, 本文方法与隐写分析准确率的Spearman秩相关系数[12]比现有主要载体选择指标平均高约0.027, 优选后隐写隐蔽性在原基础上提高约7.7%, 比现有载体选择指标平均高约2.0%.实验结果表明, 使用其优选的载体进行隐写, 在原有隐写算法基础上提高了隐蔽性, 在大多数情况下比现有图像纹理指标效果要好.

本文第1节描述载体选择问题的模型.第2节列举现有的载体选择指标, 包括信息熵法、局部方差法、线性预测误差法等, 并说明其对JPEG隐写和隐写分析的局限性.第3节介绍本文方法, 即Haar小波分解图像及高阶统计量, 从理论上探讨其与JPEG隐写特征之间的关系.第4节介绍实现流程.第5节通过实验比较随机选择、已有方法和本文方法载体选择在不同条件下隐写分析的准确率.最后总结全文.

1 载体选择问题模型

本文探讨隐写者对隐写分析者无知识的载体选择问题, 模型如下.

假设隐写者制备得到一组图像c={c1, c2, …, cn}, 选择其中部分的图像, 将长度为m的隐蔽信息分片并依次嵌入.最终得到需要发送的图像为x={x1, x2, …, xn}, 其中, xi=cixi=E(ci, mi, k), E为隐写算法, mi为信息分片, k为密钥.设存在某种评价指标f(x)对任何图像x计算出一个数值, 可以对在某个给定一组阈值{Fj}之下估算所有符合f(x)∈(Fj-1, Fj]的一组图像在隐写分析时的平均错误率εj.由于隐写者对隐写分析者无知识的情况下很难估计εj, 一般地, f(x)和εj存在一定的Spearman秩相关性.

由于隐写算法对图像的修改量较为轻微, 图像x的评价指标f(x)在隐写前后变化不大, 且对于隐写者和隐写分析者是公开的.隐写分析者有能力根据接收到的图像预测其可能的准确程度调整在综合决策时的参考权重.隐写者也可以根据f(x)选择适合隐写的一组载体图像序号I, 所有iI, 选择不隐写, 即xi=ci; 而对任何iI, 选择隐写嵌入信息, 即xi=E(ci, mi, k).为了防止被隐写分析者检测出, 隐写者应使得在该种选择下, 在iI时, 隐写分析者的错误率尽量大.即隐写者应使隐写分析者在检测载体图时能够较准确且较有把握地将其判为不含隐写, 而检测隐写图像时尽量做出准确率较低的判定.

2 已有基于图像纹理的载体选择指标和方法

在现有文献中提出的载体选择指标和方法中, 可指示隐蔽性用于载体选择的指标主要有3种.

(1) 信息熵(entropy).信息熵法计算图像像素灰度值的熵值${f_{ENT}} = \sum {( - {p_i}\log {p_i})} $作为图像复杂度指标, 其中, pi表示图像中灰度值i出现的概率.图像的熵越大, 图像灰度值越丰富, 隐写的隐蔽性越强.

(2) 局部方差(local variance, 简称LV).局部方差法先计算相邻两个像素之间的差值, 再对差值求方差, 以横向和纵向的方差均值为指标, 即以${f_{LV}} = \frac{1}{2}\sum {[{{({x_{i, j}} - {x_{i - 1, j}})}^2} + {{({x_{i, j}} - {x_{i, j - 1}})}^2}]} $为指标, 其中, xi, j是位置(i, j)上的像素灰度值.一般局部方差越大的图像, 相邻像素之间变化剧烈, 纹理越丰富, 隐写的隐蔽性越强.

(3) 线性预测误差(linear prediction error, 简称LPE).线性预测误差法在局部方差利用相邻像素预测的基础上, 采用了线性预测模型${\hat x_{i, j}} = {\pmb \beta} N({x_{i, j}}, k) + {\pmb \varepsilon} $, 即以像素xi, jk阶邻接像素N(xi, j, k)的线性方程来预测xi, j, 将预测误差${f_{LPE}} = \sqrt {\sum {{{({x_{i, j}} - {{\hat x}_{i, j}})}^2}} } $作为指标.预测误差越大, 建模越困难, 隐写隐蔽性越强.

然而, 上述指标不可避免地存在以下不足:第一, 信息熵方法只与图像像素灰度值的概率分布函数有关, 缺乏像素在图像中位置的信息, 因而难以很好地指示该类图像在隐写分析时的难易程度; 第二, 局部方差法只考虑了相邻两个像素的差值, 即便k阶LPE方法也仅限于一个像素周围(2k+1)2-1个像素的关系.JPEG隐写受JPEG编码8×8像素分块的DCT变换、量化和反量化等的影响, 不仅应考虑像素与紧邻周围的像素的相关性, 还应该考虑更大范围的像素对隐写行为的影响, 从而设计更复杂的纹理复杂度评价模型, 如小波域模型.

3 小波域的载体选择指标 3.1 小波变换简介

小波变换是一种将信号数据分割成不同频率成分的工具.从滤波器组的角度, 原始信号经低通、高通滤波和下采样等处理得到低频和高频成分, 分别表示图像的总体和细节信息.以SI-UNIWARD算法所用的Daubechies小波(消失矩为8)为例, 其高通滤波器采用g=[-0.0544, 0.3129, -0.6756, 0.5854, 0.0158, -0.2840, -0.0005, 0.1287, 0.0174, -0.0441, -0.0140, 0.0087, 0.0049, -0.0004, -0.0007, -0.0001], 低通滤波器则采用h=[-0.0001, 0.0007, -0.0004, -0.0049, 0.0087, 0.0140, -0.0441, -0.0174, 0.1287, 0.0005, -0.2840, -0.0158, 0.5854, 0.6756, 0.3129, 0.0544].分别用h·gT, g·hT, g·gT对信号做卷积后得到一阶LH, HL和HH方向的降解, 重复降解与下采样可得到更高阶的降解.

3.2 JPEG隐写在小波域的变化

研究人员认为, 一些在纹理复杂的区域嵌入信息较难检测.在PQ的衍生版本[6]中, PQe优先嵌入在能量大的区域和PQt优先嵌入在纹理复杂的区域, 因而隐蔽性有显著提升.在SI-UNIWARD, J-UNIWARD等方法中, 更是利用修改前后小波系数的差值作为选择嵌入位置的权重.通常, 计算能量和纹理采用的是像素间差值或系数平方和的方法, 只能计算8个相邻方向上的差异.而小波系数的表示范围更广, 可以求取不同方向上的像素差值.

通过比较高隐蔽性隐写算法的嵌入位置的共同点, 可知嵌入某些位置的隐蔽性高于其他区域.本文选取MME3[5]、PQe、PQt和nsF5等隐写算法, 它们虽然都不以小波域特征选择嵌入位置, 但在纹理复杂区域嵌入比较密集.以BOSSBase图像库序号为52的图像为例(图 1(a)), 其纹理较为复杂的区域是山与天空的交界处和水面的波纹处.通过对原图像与不同隐写算法0.05bpac(bit per non-zero AC coefficient, 简称bpac)隐写图像求差值, 可以得到这些算法的嵌入位置(图 1(b)~图 1(e)).从图中可以看出, 其共同特点是山峰与天空交界处及水面波纹处的改动量大于其他位置的改动量.对上述原图像做小波变换求取高频HH分量(图 1(f))可知, 纹理复杂的区域集中在小波变换的HH分量上.小波分解图像中系数大的区域, 正是高隐蔽性隐写算法所共同优先选择的位置.

Fig. 1 Comparison of the original image, embedded positions of different steganographic images (in 0.05 bpac), and the HH decomposition image of the original one 图 1 原图像、各种隐写算法(0.05 bpac)隐写图像的嵌入位置与原图小波HH分量图对照

JPEG与空域隐写相比增加了DCT变换和量化等过程, 周围像素差值大的位置无法像空域隐写直接判定为较难隐写分析的位置.但是相邻像素值差异较大的区域, DCT变换及量化后表现为高频区域系数较大, 统计较不稳定, 不利于隐写分析.因此, 统计图像高频分量变化情况, 对选出较难被隐写分析的载体具有现实的可行性.

相应地, 从隐写分析角度而言, 当前最有效的若干种JPEG隐写特征(如CCJRM和DCTR特征等)主要计算JPEG量化系数的共生矩阵.其中, CCJRM计算JPEG量化系数在水平、竖直和对角线等各个方向上的共生矩阵, 将块间和块内等系数残差合并成为最终高维特征.DCTR特征则是将JPEG图像解码至空域, 并将每一块的像素与DCT基础模式矩阵作卷积, 再计算卷积得到的矩阵的直方图.该过程也对可以视为对空间上相邻4个分块的256个系数做正交投射.JPEG量化系数的一阶或高阶概率分布模型(如直方图、共生矩阵)在JPEG隐写分析上起着重要的作用, 能够反映JPEG隐写对自然图像的修改.这些特征在处理量化系数时不仅考虑局部的系数间关系, 还考虑了相邻分块间的系数关系.相邻分块间的系数关系, 是现有基于线性的载体选择指标无法描述的.

小波域系数的特征与隐写分析特征设计上有较好的一致性.离散小波变换从本质上是一种卷积运算, 同时, 小波变换是正交的, 这一特性可以有效保持图像的多样性, 这与DCTR特征使用正交投射的目的是相近的.小波变换的多尺度特性还可以刻画不同范围的图像内容信息.现有特征在设计时, 也采取了同时考虑分块间和分块内的JPEG量化系数关系的做法.因此, 从隐写分析角度而言, 采用小波域的指标刻画隐写的隐蔽性具有可行性.

3.3 小波域指标

由上一节可知, JPEG隐写在纹理复杂或能量较高的分块或位置进行嵌入较难被检测到.即便测试的算法并非以小波域指标为代价函数, 这类区域在小波域上仍集中反映为高频降解图像中系数较大的区域.本文设计了一种指标, 反映图像高频降解图像包含较大系数的数量, 从而用于指示图像隐写被检测出的难易程度.

首先, 对图像X进行离散小波变换.使用高低通滤波器对图像做二维卷积, 分别在水平和垂直方向上进行卷积, 并对上述结果做步长为2的下采样, 得到3个方向上的第1级小波分解图像, 包括WLH=(g*hT*X)↓2, WHL= (h*gT*X)↓2和WHH=(g*gT*X)↓2.随后对WHH继续分解, 得到第2级的小波分解图像.不断重复上述步骤, 得到更高级的小波分解图像.一般地, 第1级~第3级小波分解已可以表示图像的细部纹理特征.由于JPEG隐写通常是在8×8分块上进行的, 第3级小波在两个方向上都经过了3次下采样, 即每个分块被下采样为1个系数.因此, 级数再往上时, 高频部分不再表示细部的纹理特征, 参考意义不大.

由于小波分解图像的维度大, 不宜直接作为选择载体指标, 需要将其降至一维标量.我们尝试过不同的小波分解方法以及各种指标, 包括一阶、二阶和三阶范数等多种统计量.其区别在于分解图像中绝对值大的系数对整幅图像指标值的占比, 阶数越高, 含有绝对值大的系数的图像越适合作为载体图像.本文采用的计算公式为

${f_{WB}} = \frac{1}{3}\left[ {{{\left( {\sum {|W_{u, v}^{h, k}{|^r}} } \right)}^{ - r}} + {{\left( {\sum {|W_{u, v}^{v, k}{|^r}} } \right)}^{ - r}} + {{\left( {\sum {|W_{u, v}^{d, k}{|^r}} } \right)}^{ - r}}} \right]$ (1)

其中, k是小波变换的阶数, r是小波分解图像系数范数的阶数.实验对比发现, 一般三阶Haar小波的一阶距表现较好, 即取k=3, r=1.此时, Haar小波高通滤波器采用${\pmb g} = \left[ { - \frac{1}{{\sqrt 2 }}, \frac{1}{{\sqrt 2 }}} \right]$, 而低通滤波器采用${\pmb h} = \left[ {\frac{1}{{\sqrt 2 }}, \frac{1}{{\sqrt 2 }}} \right]$.不同隐写算法和隐写特征对小波分解图像的各个方向修改量并不完全相同, 因此, 为使指标能够稳定地适用于不同的隐写算法和隐写特征, 在设计时, 对水平、竖直和对角线等3个方向求取均值, 即它们的权重是相等的.

3.4 与已有载体选择指标的关联

本文提出的载体选择指标与LV, LPE指标在原理上有一定的相同点.这些指标都假设图像像素之间具有相关性, 利用图像中的像素与相邻像素之间的关系来对图像纹理特性建模.通过评价该载体的纹理特性, 指示该载体用于隐写的隐蔽性.

本文方法在原理上与已有方法也有明显区别.LV考察的是像素点与横向和纵向相邻像素点之间的关系, LPE考察的则是像素点与周围8个(LPE1)、24个(LPE2)像素点之间的差异.与LV, LPE反映线性关系不同的是, 本文方法采用小波变换, 考虑了图像像素的非线性关系.虽然一阶Haar小波变换是像素间的差值关系, 但是本文方法涉及2阶及以上Haar小波变换, 可以展示不同缩放尺寸下的像素间关系.图像熵的原理则与LV、LPE、本文方法区别较大, 它计算图像像素直方图, 而与图像像素的空间位置排列无关.

4 本文方法实现流程

基于Haar小波域指标自适应选择载体的JPEG隐写的实现框架如图 2所示.

Fig. 2 Implementation framework of JPEG steganography based on adaptive cover selection 图 2 自适应选择载体的JPEG隐写实现框架

传统的多样本隐写方法(图 2实线部分)通常将消息进行分片, 顺序或随机地从图像库中选用一部分图像用于嵌入.而本文载体选择的隐写方法在传统隐写方法基础上增加了提取指标及载体选择环节(图 2虚线部分).具体步骤如下.

(1)   从载体图像库中随机选择N幅图像作为待发送的图像.

(2)   在隐写算法实施之前, 对选中的每个图像做Haar小波变换, 并根据公式(1)计算Haar小波域指标值.

(3)   将所计算的指标值按照降序排列.

(4)   优先选择在指标值排名靠前的图像进行隐写嵌入, 直至消息嵌入完成.如果不足, 则选择更多的图像;

(5)   将所选择的待发送图像(包括隐写和未隐写图像)一起传输, 避免传输过多纹理丰富的图像引起怀疑.

在多样本隐写的具体实现并非所有图像都参与了隐写, 发送方在发送信息时对隐蔽消息的分片加入固定格式, 如:依次嵌入消息长度、分片偏移量、消息数据、校验码.接收方在提取信息时, 如果校验错误则放弃解码.

本文方法有如下优点:第一, 通过计算指标选择载体, 避免大量计算影响用户体验; 第二, 纹理丰富的图像较难检测是普遍规律, 兼容现有的大多数隐写算法; 第三, 解码端不需要较大的改动, 便于使用.

5 实验 5.1 实验条件与评价指标

本文选用公开图像库BOSSv0.92(10 074张, 512×512像素)和BOSSv1.01(10 000张, 从BOSSv1.01图库RAW格式等比例缩小至512像素×768像素).从图像库每次随机选取1 000张图像用于测试, 其余9 000(BOSSv0.92为9 074)张用于训练.图像使用隐写算法得到隐写图像, 提取特征并用训练和测试, 得到1 000对测试结果.同时, 计算1 000幅测试图像的各种纹理复杂度指标.在仿真嵌入时, 选用在JPEG量化系数非自适应的nsF5算法和在边信息内容自适应的SI-UNIWARD算法.实验所用JPEG质量因子为85.隐写分析使用目前最为有效的高维JPEG特征之一:CC-JRM特征和DCTR特征[20], 对应的分类器是组合FLD分类器.实验还测试了空域隐写下的情况, 选用目前较难检测的MiPOD和S-UNIWARD隐写方法以及最为有效的MaxSRM特征[21].

本文评价图像纹理度量与该类图像用于隐写分析的准确率值二者之间的关系, 主要选用相关性指标和准确率两种评价指标.

(1) 相关性指标

计算图像纹理度量与隐蔽性之间的Spearman秩相关系数[12]:

$\rho (X, Y) = \frac{{\sum\nolimits_i {({x_i} - \bar x)({y_i} - \bar y)} }}{{\sqrt {\sum\nolimits_i {{{({x_i} - \bar x)}^2}\sum\nolimits_i {{{({y_i} - \bar y)}^2}} } } }}$ (2)

其中, xi, yi分别为X, Y中第i个元素Xi, Yi的次序, $\bar x, \bar y$分别为xiyi的均值.在实验时, X为图像纹理度量组成的向量, Y为图像隐蔽性构成的向量, Yi表示第i幅载体图像及对应隐写图像在隐写分析时正确预测的次数. Spearman秩相关系数绝对值较大的纹理评价指标与该图像用于隐写时的隐蔽性相关性较大, 用其优选出纹理复杂度高的图像, 同时也能较为准确地优选出隐写隐蔽性较强的图像.

(2) 隐蔽性指标

将图像按照纹理度量排序, 优先选择排名靠前的若干幅载体图像后, 统计该部分图像的载体及对应隐写图像在隐写分析时的准确率.该指标相对直观, 能够从优选后准确率变化比较各种图像纹理度量的优劣.同样比例下优选载体时, 隐写分析准确率越低的隐蔽性越好.在优选的图像数量上升过程中, 优选图像数量与隐写分析准确率关系曲线抖动越小, 隐蔽性越好.

5.2 载体选择指标的相关性检验

为了验证本文方法的有效性, 本节以公开图像库为例计算图像纹理指标与隐蔽性之间的Spearman秩相关系数, 并与信息熵、LPE和LV等指标做对比.实验对每一对测试图像计算图像纹理指标组成向量X, 并计算分类器对这一对图像预测结果的正确次数组成向量Y.将两组向量代入公式(2)即得到Spearman秩相关系数.本文Haar小波域纹理指标在不同参数下与隐蔽性的Spearman秩相关系数实验的结果见表 1.表中主要列举在nsF5 0.10 bpac, SI-UNIWARD 0.70 bpac和0.90 bpac下, 参数k, r和Haar小波算法在公式(1)的H(水平)、V(竖直)、D (对角线)和它们的均值(表中标注为均值)作为指标时的Spearman秩相关系数.

Table 1 Spearman correlation coefficients of each component of proposed indicatorsunder different JPEG steganography algorithms 表 1 在不同JPEG隐写算法下, 本文指标各组成成分的Spearman相关系数

从表中可以看出, 在不同情况下, 各分量的相关系数有高低差别, 但均值指标比HVD各分量更稳定.当k=3, r=1时, 小波系数H, V和D的均值作为指标时, Spearman相关系数值总体较高, 即隐蔽性受指标影响较大, 这样的指标用于载体选择更能有效地优选难检测的载体.

为比较本文方法与已有方法的有效性, 实验随机选取了BOSS v1.01图像库及其对应隐写图像分别提取了信息熵(标记为Ent.)、LPE 1、LPE 2和LV指标.实验同时计算了Matlab中常见的几种小波, 检验其他小波特征也具有类似的效果.结果见表 2, 其中, 第4列~第8列列举出不同指标下的载体选择指标与隐蔽性相关系数.从表中可以看出, 本文方法指标值在相关性方面普遍高于同比的指标.实验统计了BOSS v0.92和BOSS v1.01图像库下, 对nsF5 0.05~0.20 bpac和SI-UNIWARD 0.70~0.90 bpac的情况, 本文方法比信息熵、LPE 1、LPE 2、LV方法的相关系数平均高约0.032, 比已有方法中最优的LPE1高约0.021.

Table 2 Spearman correlation coefficients of different indicators under differentJPEG steganography algorithms (BOSSv1.01 image database) 表 2 在不同JPEG隐写下, 不同指标的Spearman相关系数(BOSSv1.01图像库)

实验还测评了当前较难检测的空域隐写算法及其参数下的Spearman秩相关系数.实验随机选取了BOSSv0.92图像库, 分别提取了与表 2实验同样的指标.唯一不同的是空域情形下, 通过遍历得出在k=1, r=1时指标的有效性较好, 因而空域实验选取该组参数.实验结果见表 3.对比表 2表 3可以看出, 空域隐写算法对不同纹理复杂度的图像表现不同, 其与JPEG隐写算法相比更依赖于图像的纹理复杂度, 即主要表现为相关系数明显增大.从表 3可以看出, 空域隐写下, 小波域系数在大多数情况下略高于已有指标.可以得出结论, 本文指标载体优选方法对提高空域隐写算法隐蔽性有一定的作用, 但提高的效果不如JPEG算法.

Table 3 Absolute value of Spearman correlation coefficients of different indicators under differentspatial steganography algorithms (BOSSv0.92 image database) 表 3 在空域隐写算法下不同指标的Spearman相关系数绝对值(BOSSv0.92图像库)

5.3 不同小波算法下的相关性检验

为了测试不同小波算法的有效性, 实验还在Matlab中比较不同小波基的情况下, 指标值与隐写分析检测率的Spearman相关性情况.如表 2表 3所示, 选用的小波包括Haar小波(标记为HAAR)、双正交小波(低通滤波器、重建滤波器阶数为4, 标记为BIOR 4.4)、Coiflets小波(3阶, 标记为COIF 3)、反正交小波(低通滤波器、重建滤波器阶数为4, 标记为RBIO 4.4)、Daubechies小波(8阶, 标记为DB 8)、Symlets小波(8阶, 标记为SYM 8).表 2最右6列列举了不同隐写算法和嵌入率下的结果.实验结果表明, 同等情况下, Harr小波的相关系数与表中其他小波基相近.但Haar小波实现方法简单, 更具优势.在空域隐写方面, 如表 3所示, Harr小波的表现也相近.

5.4 载体选择效果对照

实验还从隐蔽性指标方面比较了本文方法与同类方法在载体选择上的有效性.先对1 000幅待测图像按给定统计指标排序, 选择指标最小(当指标与隐写隐蔽性呈负相关时)或最大(当指标与隐写隐蔽性呈正相关时)的前N幅图像, 统计隐写分析对该部分载体图像及其对应隐写图像的准确率.图 3展示了使用BOSS v1.01图库在nsF5 0.05 bpac和SIUW 0.90 bpac隐写时, 随机选择N幅图、根据图像熵(Ent)、LPE1、LV和本文方法等准则优选N幅图时, N随隐蔽性变化情况.此时, 使用的是CCJRM特征.相应地, 图 4展示了使用BOSS v0.92图库在nsF5 0.20 bpac和SIUW 0.80 bpac隐写时, N随隐蔽性变化情况.此时, 使用的是DCTR特征.

Fig. 3 Comparison of the relations of the selected image amount and steganalysis error rate using different JPEG steganography cover selection indicators (nsF5 0.05 bpac, SIUW 0.90 bpac) 图 3 不同指标进行JPEG隐写载体选择数量与隐写分析错误率关系比较(nsF5 0.05 bpac, SIUW 0.90 bpac)

Fig. 4 Comparison of the relations of the selected image amount and steganalysis error rate using different JPEG steganography cover selection indicators (nsF5 0.20 bpac, SIUW 0.80 bpac) 图 4 不同指标进行JPEG隐写载体选择数量与隐写分析错误率关系比较(nsF5 0.20 bpac, SIUW 0.80 bpac)

图 3图 4中可以看出, 大多数情况下, 本文方法指标优选出的图像隐蔽性较高, 而且本文指标优选的优势较为稳定.以图 4N=60处为例, 在SIUW隐写嵌入率0.80 bpac的情况下, 从给定的测试图像集中选择60幅图像用于隐写, 隐写分析的平均错误率约为5.1%.使用载体选择的隐写方法可以提升这一指标, 信息熵、LV和LPE1方法提高至10.9%~12.4%, 而本文Haar小波域指标将隐蔽性提升至15.9%.这一优势总体存在, 直至N已接近样本总量的一半.除了在优选载体数量N较小时统计不够稳定之外, 在相同数量下, 本文方法优选的图像隐蔽性优于已有算法.而且, 本文指标的曲线与其他指标的曲线相比, 下降趋势更稳定, 抖动较少.相反地, 抖动较多的曲线即使在个别区域得到较高的隐蔽性, 但下降过程不稳定, 实用中很难准确地把握优选载体的数量.

从图中还可看出, 随着N增大, 隐蔽性越来越高, 本文方法与隐蔽性间的递增关系相对明显.这与Spearman相关系数指标相印证, 即相关系数高的方法在载体选择上表现更好.实验统计了BOSS v0.92和BOSS v1.01图像库下, 对nsF5 0.05~0.20 bpac和SI-UNIWARD 0.70~0.90 bpac优选50~100幅图像的载体选择效果, 本文方法比信息熵、LPE 1、LPE 2和LV方法的隐蔽性平均低约2.4%, 比已有方法中最优者(LV)低约1.7%, 比随机选择(即不进行优选)平均低约7.8%.可以认为, 本文选择载体的方法进一步提高了现有高隐蔽性隐写算法的隐蔽性.

6 总结

本文提出了一种基于Haar小波域指标自适应选择载体的JPEG隐写.该指标通过计算图像在Haar小波域的高频成分分解图像的高阶范数, 用以优选JPEG隐写的载体图像.隐写者可以在隐写之前利用该指标预先筛选出难以检测的图像, 在一定程度上增加了隐写分析者的困难, 即提高了隐写行为的隐蔽性.实验结果表明, 本文方法提高了隐写行为的隐蔽性, 效果比现有的基于图像纹理评价的载体选择指标更优.我们基本达到了研究目的, 但仍存在着一些不足, 如所选用的指标模型较为简单, 在Spearman相关系数或载体选择的效果等方面都低于空域隐写, 尚有提升空间, 以及本文的结论是否对构造隐写分析的训练集有所帮助, 这些都是下一步研究需要解决的问题.

参考文献
[1]
Cachin C. An information-theoretic model for steganography. In: Aucsmith D, ed. Proc. of the 2nd Int'l Workshop on Information Hiding (IH'98). Berlin, Heidelberg: Springer-Verlag, 1998. 306-318.http://link.springer.com/chapter/10.1007%252F3-540-49380-8_21
[2]
Fridrich J, Kodovský J. Rich models for steganalysis of digital images. IEEE Trans on Information Forensics and Security, 2012, 7(3): 868–882. [doi:10.1109/TIFS.2012.2190402]
[3]
Pevný T, Fridrich J. Benchmarking for steganography. In: Solanki K, Sullivan K, Madhow U, eds. Proc. of the 10th Int'l Workshop on Information Hiding (IH 2008). Berlin, Heidelberg: Springer-Verlag, 2008. 251-267.http://www.springerlink.com/content/6t7350h332825m4h
[4]
Ker AD, Bas P, Böhme R, Congranne R, Craver S, Filler T, Fridrich J, Pevný T. Moving steganography and steganalysis from the laboratory into the real world. In: Proc. of the 1st ACM Workshop on Information Hiding and Multimedia Security. 2013. 45-58.http://dl.acm.org/citation.cfm?id=2482513.2482965
[5]
Kim Y, Duric Z, Richards D: Modified matrix encoding technique for minimal distortion steganography. In: Camenisch JL, Collberg CS, Johnson NF, Sallee P, eds. Proc. of the 8th Int'l Workshop on Information Hiding (IH 2006). Berlin, Heidelberg: Springer-Verlag, 2007. 314-327.http://dl.acm.org/citation.cfm?id=1759071
[6]
Fridrich J, Pevný T, Kodovský J. Statistically undetectable JPEG steganography: Dead ends challenges, and opportunities. In: Proc. of the 9th Workshop on Multimedia & Security. 2007. 3-14.http://dl.acm.org/citation.cfm?id=1288872
[7]
Filler T, Judas J, Fridrich J. Minimizing additive distortion in steganography using syndrome-trellis codes. IEEE Trans. on Information Forensics and Security, 2011, 6(3): 920–935. [doi:10.1109/TIFS.2011.2134094]
[8]
Holub V, Fridrich J, Denemark T. Universal distortion function for steganography in an arbitrary domain. EURASIP Journal on Information Security, 2014, 2014(1): 1–13. https://www.researchgate.net/publication/259639875_Universal_Distortion_Function_for_Steganography_in_an_Arbitrary_Domain
[9]
Sedighi V, Cogranne R, Fridrich J. Content-Adaptive steganography by minimizing statistical detectability. IEEE Trans. on Information Forensics and Security, 2016, 11(2): 221–234. [doi:10.1109/TIFS.2015.2486744]
[10]
Kodovský J, Fridrich J. Steganalysis of JPEG images using rich models. In: Proc. of the SPIE 8303, Media Watermarking, Security, and Forensics 2012. 2012. No. 83030A.http://adsabs.harvard.edu/abs/2012SPIE.8303E...7K
[11]
Pevný T, Fridrich J. Merging Markov and DCT features for multi-class JPEG steganalysis. In: Proc. of the SPIE 6505, Security, Steganography, and Watermarking of Multimedia Contents IX. 2007. No. 650503.http://www.researchgate.net/publication/228821328_Merging_Markov_and_DCT_Features_for_Multi-Class_JPEG_Steganalysis
[12]
Böhme R. Assessment of steganalytic methods using multiple regression models. In: Barni M, Herrera-Joancomartí J, Katzenbeisser S, Pérez-González F, eds. Proc. of the 7th Int'l Workshop on Information Hiding (IH 2005). Berlin, Heidelberg: Springer-Verlag, 2005. 278-295.http://dl.acm.org/citation.cfm?id=2146154
[13]
Kharrazi M, Sencar HT, Memon N. Cover selection for steganographic embedding. In: Proc. of the Int'l Conf. on Image Processing 2006. IEEE, 2006. 117-120.http://ieeexplore.ieee.org/document/4106480/
[14]
Gul G, Kurugollu F: A new methodology in steganalysis: breaking highly undetectable steganograpy (HUGO). In: Filler T, Pevný T, Craver S, Ker A, eds. Proc. of the 13th Int'l Conf. on Information Hiding (IH 2011). Berlin, Heidelberg: Springer-Verlag, 2011. 71-84.http://dl.acm.org/citation.cfm?id=2042453
[15]
Huang W, Zhao X. Novel cover selection criterion for spatial steganography using linear pixel prediction error. Sciece China Information Sciences, 2016, 59(5): No.059103. http://kns.cnki.net/KCMS/detail/detail.aspx?filename=jfxg201605028&dbname=CJFD&dbcode=CJFQ
[16]
Huang W, Zhao X. Reliable pooled steganalysis using fine-grained parameter estimation and hypothesis testing. In: Shi YQ, Kim HJ, Perez-Gonzalez F, Liu F, eds. Proc. of the 15th Int'l Workshop on Digital Forensics and Watermarking (IWDW 2016). Cham: Springer-Verlag, 2017. 550-563.https://link.springer.com/chapter/10.1007%2F978-3-319-53465-7_41
[17]
Kouider S, Chaumont M, Puech W. Technical points about adaptive steganography by oracle (ASO). In: Proc. of the 20th European Signal Processing Conf. (EUSIPCO). 2012. 1703-1707.http://www.researchgate.net/publication/261121346_Technical_Points_About_Adaptive_Steganography_by_Oracle_ASO
[18]
Sajedi H, Jamzad M. Secure cover selection steganography. In: Park JH, Chen HH, Atiquzzaman M, Lee C, Kim TH, Yeo SS, eds. Proc. of the 3rd Int'l Conf. and Workshops on Advances in Information Security and Assurance (ISA 2009). Berlin, Heidelberg: Springer-Verlag, 2009. 317-326.
[19]
Sajedi H, Jamzad M. Using contourlet transform and cover selection for secure steganography. Int'l Journal of Information Security, 2010, 9(5): 337–352. [doi:10.1007/s10207-010-0112-3]
[20]
Holub V, Fridrich J. Low-Complexity features for JPEG steganalysis using undecimated DCT. IEEE Trans. on Information Forensics and Security, 2015, 10(2): 219–228. [doi:10.1109/TIFS.2014.2364918]
[21]
Denemark T, Sedighi V, Holub V, et al. Selection-Channel-Aware rich model for steganalysis of digital images. In: Proc. of the 2014 IEEE Int'l Workshop on Information Forensics and Security (WIFS). 2014. 48-53.http://www.researchgate.net/publication/274075271_Selection-Channel-Aware_Rich_Model_for_Steganalysis_of_Digital_Images