秦川(1980-), 男, 博士, 教授, 博士生导师, CCF高级会员, 主要研究领域为多媒体信息安全, AI安全, 数字图像处理
董腾林(1994-), 男, 硕士, 主要研究领域为多媒体信息隐藏
姚恒(1982-), 男, 博士, 副教授, CCF专业会员, 主要研究领域为数字图像取证, 多媒体信息隐藏, 模式识别
传统的信息隐藏算法大都通过修改载体达到隐藏秘密信息的目的, 但不可避免地会在载体数据中留下修改痕迹, 故常难以抵抗隐写分析技术的检测, 为此无载体信息隐藏应运而生. 无载体信息隐藏并非不使用载体, 而是不对载体数据进行修改. 为了提高无载体信息隐藏算法的隐藏容量和鲁棒性, 提出了一种基于风格迁移纹理合成与识别的构造式信息隐藏算法. 该算法首先选取不同类别的自然图像和纹理图像分别建立内容图像库和纹理风格图像库, 并根据内容图像库中自然图像的类别构建二进制码的映射字典; 其次为了接收方能够从含密图像中提取出秘密信息, 需要构建带标签的纹理图像库, 并将其作为训练集输入到卷积神经网络中, 通过迭代训练获得纹理图像识别模型. 在秘密信息隐藏时, 根据秘密信息片段选择对应类别的自然图像, 并按照一定的顺序组合成含密拼接图像, 随后从纹理图像库中随机选择一张纹理图像, 通过风格迁移的方法将含密拼接图像转换成含密纹理图像, 从而完成秘密信息隐藏过程. 在信息提取过程中, 通过纹理图像识别模型可准确识别出含密纹理图像原本对应的图像类别, 再对照映射字典即可提取出秘密信息. 实验结果表明, 所提算法生成的含密纹理图像具有良好的视觉效果, 秘密信息隐藏容量较高, 且对JPEG压缩、高斯噪声等攻击具有较强的鲁棒性.
Most traditional information hiding methods embed secret data by modifying cover data, which inevitably leaves traces of modification in cover data, and hence, it is difficult to resist the detection of the existing steganalysis algorithms. Consequently, the technique of coverless information hiding emerges, which hides secret data without modifying cover data. To improve the hiding capacity and robustness of coverless information hiding, this study proposes a constructive data hiding method based on texture synthesis and recognition with image style transfer. Firstly, natural images and texture images of different categories are used to construct the content image database and the textural style image database, respectively. A mapping dictionary of binary codes is established according to the categories of natural images in the content image database. Secondly, the labeled textural image database should be constructed and input into the convolutional neural network as a training dataset, and the texture image recognition model can be obtained by iterative training. In this way, the secret data can be extracted from stego images at the receiving end. During secret data hiding, natural images are selected from the content image database according to to-be-embedded secret data fragments, which are synthesized to form a stego mosaic image. Then, a texture image is randomly selected from the textural style image database, and the stego texture image can be generated by the selected texture image and the stego mosaic image with the strategy of style transfer to achieve secret data hiding. During secret data extraction, the obtained texture image recognition model can accurately identify the original categories of stego texture images corresponding to natural images, and secret data can be finally extracted by reference to the mapping dictionary. The experimental results demonstrate that the proposed method can achieve the stego texture image with a satisfactory visual effect and a high hiding capacity, and it illustrates strong robustness to attacks such as JPEG compression and Gaussian noise.
信息隐藏技术是将秘密信息嵌入至公开的载体数据中, 进而完成信息的隐蔽传输[
基于载体选择的信息隐藏算法大多是通过提取载体图像特征, 并与秘密信息建立一定的映射关系, 来完成信息隐藏. 文献[
在基于载体构造的信息隐藏算法中, 由于纹理图像作为一种图像处理和计算机图形学应用中常见的图像类型在互联网上广泛存在且其视觉内容具有一定的规律性, 故构造生成含密的纹理图像是最具代表性的工作. 该类算法对应的应用协议为: 发送方首先基于秘密信息的驱动生成含密图像(生成过程中的初始条件可为预定的生成图像的类型, 如纹理图像等), 再将生成的含密图像通过公用信道传输给接收方(在传输过程中含密图像可能会遭受到攻击); 接收方收到含密图像后进行信息提取得到秘密信息; 设计的含密图像生成和信息提取算法需保证: 信息的隐藏容量尽可能的大, 提取出的信息要与隐藏的信息尽可能的相同, 且含密图像在视觉上要尽可能的自然, 三者分别对应隐藏容量、鲁棒性和隐蔽性这3个主要的性能指标. Ototi等人[
综上所述, 基于载体选择的无载体信息隐藏算法多存在隐藏容量小、需要构建大规模图像库等问题; 而基于载体构造的无载体信息隐藏算法多存在鲁棒性不理想的问题. 因此, 本文为了进一步提高无载体信息隐藏算法的隐藏容量及鲁棒性, 提出一种基于风格迁移(image style transfer, IST)纹理合成与识别的构造式信息隐藏算法, 可在提高隐藏容量和保证生成含密纹理图像视觉质量的同时, 仍具有较高的鲁棒性. 本文工作的主要创新点包括: 1)通过建立映射关系将内容图像库中的图像拼接为含密载体, 提高了秘密信息的隐藏容量; 2)基于IST模型和纹理风格图像库中的图像将含密拼接图像生成为含密纹理图像, 且具有良好的视觉效果, 减小了被攻击的风险; 3)通过构建带标签的纹理图像样本库训练获得纹理图像识别模型, 并将其应用于秘密信息提取过程中, 有效提高算法的鲁棒性.
本文第1节分别介绍本文算法的整体框架、纹理图像的合成与识别过程、秘密信息隐藏及提取过程; 第2节为实验结果的分析与比较; 第3节为全文总结及将来的工作方向.
本文提出的基于IST的无载体信息隐藏算法框架如
Framework of the proposed algorithm
本文算法总体框架
为了能够从含密纹理图像中正确地提取秘密信息, 本文算法需要在发送方和接收方的隐蔽通信过程前训练得到纹理图像识别模型. 在训练纹理图像识别模型过程中, 首先需要构建带类别标签的纹理图像样本库; 然后将带类别标签的纹理图像样本库输入到待训练的纹理图像识别模型中, 通过多轮的迭代训练最后生成能够识别含密纹理图像类别的模型, 并将模型的相关参数发送给接收方. 本文算法的秘密信息提取过程, 即为纹理图像识别模型对含密纹理图像的识别过程. 当接收方接收到含密纹理图像后, 首先按照双方事先约定的分块大小对含密纹理图像进行分块操作; 然后将分块后的含密纹理图像块输入到训练好的纹理图像识别模型中, 从而得到每一个含密纹理图像块对应的原始自然图像的类别, 最后根据映射字典即可获得从含密纹理图像中提取的秘密信息.
本文所提出的构造式信息隐藏算法在进行秘密信息隐藏时, 需要根据秘密信息从内容图像库Φ中选取不同类别的自然图像生成含密的拼接图像, 因此需构建内容图像库Φ中图像类别与二进制码的映射关系字典. 设内容图像库Φ中有
Mapping dictionary construction
构建映射字典
类别 |
二进制码 ( |
Bird | 0 0 … 0 |
Bus | 0 0 … 1 |
… | … |
Plant | 1 1 … 0 |
Airplane | 1 1 … 1 |
由
卷积神经网络(convolutional neural networks, CNN)具有强大的图像特征提取能力, 浅层网络提取的卷积特征保留了原始图像中物体形状、位置、纹理、颜色等信息, 深层网络提取的卷积特征则仅保留原始图像中物体的大致形状和位置. 本文算法在秘密信息隐藏过程中, 利用基于CNN的IST技术来学习选定纹理图像的风格[
基于风格迁移的纹理图像合成主要分为3个步骤: 图像内容表示、图像风格表示、IST. 设原始待合成的图像为
其中,
在图像风格特征表示时, 可以利用卷积神经网络不同卷积核的之间的相互关系来表达, 且这种相互关系可基于
其中,
其中,
其中,
当完成上述步骤后, 可得到原始图像
其中,
本文算法中秘密信息隐藏的核心思想是发送方基于秘密信息生成含密纹理图像, 并将生成的含密纹理图像发送给接收方. 为了确保接收方能够从含密纹理图像中准确提取出秘密信息, 本文算法在发送方引入卷积神经网络对构建的带类别标签的纹理图像库进行训练和类别识别, 并在秘密通信前将训练得到的纹理图像识别模型相关参数共享给接收方. 纹理图像识别模型的训练过程如下: 首先根据随机生成的大量二进制信息片段和映射字典(见第1.1节)从内容图像库Φ中选择对应类别的自然图像(该类别信息即为标签), 然后按照Zig-Zag的顺序将选择的自然图像拼接成一系列拼接图像, 并利用第1.2.1节中基于IST的纹理图像合成方法将拼接图像转换成视觉效果良好的纹理图像; 接下来对生成的纹理图像进行分块处理, 从而构建了含类别标签的纹理图像库, 最后将此纹理图像库作为纹理图像识别模型的训练集, 输入到纹理图像识别模型的卷积神经网络中, 通过迭代训练进而生成纹理图像识别模型, 具体的模型的训练流程如
Flowchart of model generation for textural image recognition
纹理图像识别模型训练流程图
该基于CNN的纹理图像识别模型可准确识别出含密纹理图像中各分块的类别, 模型的网络结构如
其中,
纹理图像识别模型中池化层的主要作用是对卷积层提取的深度特征进行降维处理, 减少神经网络的计算量. 池化层通过降低特征图的分辨率来获得具有空间不变性的特征[
其中,
Trend of loss value for textural image recognition model
纹理图像识别模型的损失值变化趋势
本文算法信息隐藏过程的主要步骤是首先根据秘密信息片段选取对应的一系列自然图像, 并将选取的自然图像按照Zig-Zag顺序组合成一幅拼接图像, 再通过基于IST的纹理合成方法获得风格迁移后的含密纹理图像, 流程如
Procedure of secret data hiding
秘密信息的隐藏过程
步骤1. 发送方首先将待隐藏的二进制秘密信息
步骤2. 对每个长度为
步骤3. 在得到含密拼接图像后, 从纹理风格图像库Ψ中随机选择一幅纹理图像, 利用第1.2.1节中给出的基于风格迁移的纹理图像合成方法, 让含密拼接图像学习被选择的纹理图像的风格特征, 生成视觉效果良好的纹理图像, 最后将生成的含密纹理图像发送给接收方, 从而完成秘密信息的隐藏过程.
在进行秘密信息提取时, 接收方首先需要对接收到的含密纹理图像进行分块处理, 之后利用纹理图像识别模型识别出每个含密纹理图像块的类别. 因此接收方需要与发送方共享内容图像库Φ中自然图像的尺寸、内容图像库Φ中自然图像的类别
Procedure of secret data extraction
秘密信息的提取过程
步骤1. 接收方收到含密纹理图像后, 首先根据内容图像库Φ中自然图像的尺寸对含密纹理图像进行分块处理, 得到
步骤2. 将
步骤3. 根据获得的
步骤4. 将
本文实验是在Windows 10操作系统、Python 3.6编程语言以及深度学习框架TensorFlow-GPU v1.10环境下完成的. 实验中, 首先建立内容图像库Φ和纹理风格图像库Ψ, 其中内容图像库Φ中包含16种不同类别的自然图像(即
为了验证本文算法的有效性, 在实验中随机生成了1 024 bit的二进制数据作为待隐藏的秘密信息, 并将其等分成256段, 即每段为4 bit二进制数据. 根据
Result 1 of stego texture image generation
含密纹理图像生成结果图示例1
通过选取不同的纹理风格图像, 会生成不同视觉效果的含密纹理图像,
Result 2 of stego texture image generation
含密纹理图像生成结果图示例2
在进行秘密信息传输前, 接收方已获得了纹理图像识别模型的参数, 同时与发送方约定了内容图像库Φ中自然图像的尺寸(即32×32). 因此在接收方收到512×512的含密纹理图像后, 将含密纹理图像分割成256个含密纹理图像块; 再通过调用纹理图像识别模型, 分别识别出这256个含密纹理图像块的类别, 根据映射字典获得256段秘密信息片段
本文算法和文献[
Comparison of stego texture images for the proposed algorithm and Ref. [
本文算法与文献[
由于本文算法是通过对内容图像库Φ中不同类别的自然图像组合生成含密拼接图像, 并利用纹理风格学习最终生成含密纹理图像, 因此本文算法的隐藏容量与内容图像库Φ中自然图像的类别数和尺寸、最终含密纹理图像的尺寸有关. 实际应用中可通过调节这些参数, 从而实现隐藏任意长度的秘密信息. 故本文算法的隐藏容量
其中,
为了分析本文算法的隐藏容量, 我们首先将本文算法与几种典型的同样基于载体构造的信息隐藏算法[
Comparisons of hiding capacity with cover-construction based algorithms [
与基于载体构造算法[
方法 | 单张图像隐藏容量 (bit) |
文献[ |
432 |
文献[ |
800–3750 (稀疏比: 0.03–1) |
文献[ |
832 |
本文算法 ( |
1 250 |
本文算法 ( |
2 500 |
另外, 我们还将本文算法与基于载体选择的信息隐藏算法[
Comparisons of hiding capacity with cover-selection based algorithms [
与基于载体选择算法[
方法 | 单张图像隐藏容量 (bit) |
文献[ |
8 |
文献[ |
8 |
文献[ |
|
文献[ |
18 |
本文算法 | log2 |
在本文算法中, 发送方将生成的含密纹理图像通过公共信道传输给接收方的过程中, 可能会受到攻击, 从而对信息提取造成影响, 因此鲁棒性是衡量算法性能的一个重要指标. 为验证算法的鲁棒性, 我们在实验中采取了一系列图像攻击方式, 如
Results and comparisons of data-extraction accuracy
信息提取正确率实验结果与比较
攻击 | 参数名称 | 参数值 | 本文方法
|
本文方法
|
文献[ |
中值滤波 | 模板大小 | 3×3 | 100 | 100 | 99.31 |
5×5 | 100 | 100 | 95.84 | ||
7×7 | 100 | 100 | 94.11 | ||
均值滤波 | 模板大小 | 3×3 | 100 | 100 | 96.53 |
5×5 | 100 | 100 | 94.80 | ||
7×7 | 100 | 100 | 94.63 | ||
JPEG压缩 | 质量因子 | 10 | 100 | 100 | 89.77 |
30 | 100 | 100 | 96.80 | ||
50 | 100 | 100 | 97.92 | ||
70 | 100 | 100 | 98.27 | ||
90 | 100 | 100 | 99.48 | ||
散斑噪声 | 噪声方差 | 0.01 | 100 | 100 | 90.00 |
0.05 | 100 | 100 | 88.30 | ||
0.1 | 100 | 100 | 83.80 | ||
高斯噪声 | 噪声方差 | 0.001 | 100 | 100 | 93.41 |
0.005 | 100 | 100 | 89.25 | ||
0.01 | 99.43 | 99.78 | 86.32 | ||
0.1 | 71.84 | 71.78 | 83.19 | ||
椒盐噪声 | 噪声方差 | 0.001 | 100 | 100 | 99.31 |
0.005 | 100 | 99.73 | 97.75 | ||
0.01 | 100 | 99.73 | 94.69 | ||
0.1 | 99.87 | 99.73 | 90.99 |
其中,
Attacked versions of stego texture images
针对含密纹理图像的攻击结果图
为了进一步验证本文算法的鲁棒性, 我们还与文献[
本文提出的构造式信息隐藏算法在进行秘密信息隐藏时, 首先将秘密信息通过映射字典映射成一张由若干自然图像组成的拼接图像, 并通过风格迁移模型将其生成为一张视觉效果良好的纹理图像, 相比于传统的基于载体修改的信息隐藏算法, 本文算法能够更加隐蔽地进行秘密信息的通信. 另一方面, 在发送方隐藏秘密信息时, 首先需要将内容图像库Φ中自然图像的全部类别
本文提出了一种新的构造式无载体信息隐藏算法, 与当前已有的无载体信息隐藏算法不同, 本文算法通过IST模型学习生成含密纹理图像来实现秘密信息的隐藏, 并基于纹理图像识别模型来实现秘密信息的提取. 算法首先将二进制数据片段与自然图像块类别建立映射关系, 从内容图像库中选择一系列与待隐藏的秘密信息片段对应类别的自然图像块来生成含密拼接图像, 再通过对选定的纹理图像进行风格迁移学习, 将含密拼接图像转换成一张视觉效果良好的含密纹理图像, 接收方可通过训练好的纹理识别模型准确识别含密纹理图像分块的类别从而提取秘密信息. 大量实验结果表明, 与已报道的代表性算法相比, 本文提出的算法具有较大的隐藏容量和良好的鲁棒性, 在一定程度上解决了无载体信息隐藏算法隐藏容量与鲁棒性无法很好兼顾的问题.
沈昌祥, 张焕国, 冯登国, 曹珍富, 黄继武. 信息安全综述. 中国科学 E辑: 信息科学, 2007, 37(2): 129–150. [doi: 10.3969/j.issn.1674-7259.2007.02.001]
Shen CX, Zhang HG, Feng DG, Cao ZF, Huang JW. A survey of information security. Science China, 2007, 37(2): 129–150 (in Chinese with English abstract). [doi: 10.3969/j.issn.1674-7259.2007.02.001]
Khosravi B, Khosravi B, Khosravi B, Nazarkardeh K. A new method for pdf steganography in justified texts. Journal of Information Security and Applications, 2019, 45: 61–70. [doi: 10.1016/j.jisa.2019.01.003]
Yang YY, Li ZH, Xie WC, Zhang ZZ. High capacity and multilevel information hiding algorithm based on pu partition modes for HEVC videos. Multimedia Tools and Applications, 2019, 78(7): 8423–8446. [doi: 10.1007/s11042-018-6859-7]
Soliman NF, Khalil MI, Algarni AD, Ismail S, Marzouk R, El-Shafai W. Efficient HEVC steganography approach based on audio compression and encryption in QFFT domain for secure multimedia communication. Multimedia Tools and Applications, 2021, 80(3): 4789–4823. [doi: 10.1007/s11042-020-09881-8]
http://www.jos.org.cn/1000-9825/6135.htm]]>
http://www.jos.org.cn/1000-9825/6135.htm]]>
Yang CH, Weng CY, Wang SJ, Sun HM. Adaptive data hiding in edge areas of images with spatial LSB domain systems. IEEE Transactions on Information Forensics and Security, 2008, 3(3): 488–497. [doi: 10.1109/TIFS.2008.926097]
Song XF, Liu FL, Zhang ZG, Yang CF, Luo XY, Chen LJ. 2D Gabor filters-based steganalysis of content-adaptive JPEG steganography. Multimedia Tools and Applications, 2017, 76(24): 26391–26419. [doi: 10.1007/s11042-016-4157-9]
Chen WY. Color image steganography scheme using DFT, SPIHT codec, and modified differential phase-shift keying techniques. Applied Mathematics and Computation, 2008, 196(1): 40–54. [doi: 10.1016/j.amc.2007.05.063]
Thanki R, Borra S. A color image steganography in hybrid FRT-DWT domain. Journal of Information Security and Applications, 2018, 40: 92–102. [doi: 10.1016/j.jisa.2018.03.004]
Huang FJ, Huang JW, Shi YQ. New channel selection rule for JPEG steganography. IEEE Transactions on Information Forensics and Security, 2012, 7(4): 1181–1191. [doi: 10.1109/TIFS.2012.2198213]
周志立, 曹燚, 孙星明. 基于图像Bag-of-Words模型的无载体信息隐藏. 应用科学学报, 2016, 34(5): 527–536. [doi: 10.3969/j.issn.0255-8297.2016.05.005]
Zhou ZL, Cao Y, Sun XM. Coverless information hiding based on bag-of-words model of image. Journal of Applied Sciences, 2016, 34(5): 527–536 (in Chinese with English abstract). [doi: 10.3969/j.issn.0255-8297.2016.05.005]
Yuan CS, Xia ZH, Sun XM. Coverless image steganography based on SIFT and BOF. Journal of Internet Technology, 2017, 18(2): 435–442. [doi: 10.6138/JIT.2017.18.2.20160624c]
Zhou ZL, Cao Y, Wang MM, Fan EM, Wu QMJ. Faster-RCNN based robust coverless information hiding system in cloud environment. IEEE Access, 2019, 7: 179891–179897. [doi: 10.1109/ACCESS.2019.2955990]
Otori H, Kuriyama S. Texture synthesis for mobile data communications. IEEE Computer Graphics and Applications, 2009, 29(6): 74–81. [doi: 10.1109/MCG.2009.127]
Xu JY, Mao XY, Jin XG, Jaffer A, Lu SF, Li L, Toyoura M. Hidden message in a deformation-based texture. The Visual Computer, 2015, 31(12): 1653–1669. [doi: 10.1007/s00371-014-1045-z]
潘琳, 钱振兴, 张新鹏. 基于构造纹理图像的数字隐写. 应用科学学报, 2016, 34(5): 625–632. [doi: 10.3969/j.issn.0255-8297.2016.05.015]
Pan L, Qian ZX, Zhang XP. Steganography by constructing texture images. Journal of Applied Sciences, 2016, 34(5): 625–632 (in Chinese with English abstract). [doi: 10.3969/j.issn.0255-8297.2016.05.015]
司广文, 秦川, 姚恒, 韩彦芳, 张志超. 基于纹理特征分类与合成的鲁棒无载体信息隐藏. 应用科学学报, 2020, 38(3): 441–454. [doi: 10.3969/j.issn.0255-8297.2020.03.010]
Si GW, Qin C, Yao H, Han YF, Zhang ZC. Robust coverless data hiding based on texture classification and synthesis. Journal of Applied Sciences, 2020, 38(3): 441–454 (in Chinese with English abstract). [doi: 10.3969/j.issn.0255-8297.2020.03.010]
Gu JX, Wang ZH, Kuen J, Ma LY, Shahroudy A, Shuai B, Liu T, Wang XX, Wang G, Cai JF, Chen T. Recent advances in convolutional neural networks. Pattern Recognition, 2018, 77: 354–377. [doi: 10.1016/j.patcog.2017.10.013]
Zhang X, Peng F, Long M. Robust coverless image steganography based on DCT and LDA topic classification. IEEE Transactions on Multimedia, 2018, 20(12): 3223–3238. [doi: 10.1109/TMM.2018.2838334]