当前位置：首页 > 论文 > 计算机 > 计算机应用

基于HAS特性的语音信息隐藏算法

来源：岁月联盟作者：徐骏何松俞一时间：2010-08-30

摘要为了改善LSB方法的稳健性和透明性，本文利用人类听觉系统的掩蔽效应来确定秘密信息的嵌入位置。实验表明，该算法隐藏数据量大、透明性好，且该算法可以用于在语音信号中隐藏文本、图像等信息数据。关键词 信息隐藏，LSB，掩蔽阈值，语音信号引言作为一种最基本的通讯手段，语音通信系统已经得到了广泛的研究，研究发现，语音信号本身存在着一定的冗余信息，而且，对人耳听觉模型HAS的研究可知，人耳的听觉对语音信号很小的扰动（尤其是在语音信号本身存在较大噪声的情况下）不敏感，在时间和频率上也都有屏蔽特性，HAS的这些特性为语音中隐藏信息提供了可能。一个安全的在语音信号中进行隐藏信息隐藏的系统应该具备以下特性：透明性、稳健性、自恢复性。本文提出的算法，就是利用了心理声学模型精确地得到可利用的频率位置，并应用LSB方法，实现以语音为载体的信息嵌入。该算法也可以在语音中嵌入文本、图像等信息数据，本文采用的是在语音中嵌入语音指令。1 心理声学特性人的听觉系统具有复杂的功能。人类听觉系统的模型是非线性且复杂的，这涉及到有关心理声学和生理声学方面的问题。掩蔽效应是由于听觉的非线性所引起的一种常见的心理声学现象。声音听得见的最低声压叫做听阈。当人们同时听到两个声音时，对其中一个声音的感觉会因为另一个声音的干扰使该声音的听阈提高，这种现象称为掩蔽效应。本文根据Johnston掩蔽模型^[3]，用一种简便的频率掩蔽门限方法来确定嵌入位置。定义噪声掩蔽阈为人耳能够忍受的附加噪声的能量最大值，那么，第i个临界频带内的掩蔽阈定义为：

2 基于听觉掩蔽门限的语音信息隐藏心理声学中的听觉掩蔽效应是指，在一个强信号附近，若信号将变得不可闻，被掩蔽掉了。被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值（Masking Threshold），在这个掩蔽阈值以下的声音将被掩蔽掉。由于语音信号具有短视平稳性，我们对其进行分帧处理，由上面的方法计算出每一帧信号的听觉阈值，在每个选定的帧中仅对掩蔽门限以下的频率分量实行LSB替换。2.1 嵌入信息

2.2 提取信息在提取过程中，把嵌入信息的点用LSB方法提取出二进制码流，即

用相应的编码恢复成密写信息（语音指令、二值图像）即可。3 仿真试验及结果本文采用一段长度2.716s，采样频率11025Hz，量化级16bit，内容为“苏州大学信息学院”的语音进行试验。载体语音分帧时，每帧信号长度取为512个样点，嵌入的语音指令内容为数字“0”。3.1 仿真结果
本文用Matlab编制了整个的语音信息隐藏算法。原始语音波形和嵌入语音指令后的语音波形如图1所示，其中，(a)是嵌入的语音“0”的波形图，采样频率为8kHz，8bit量化；(b)是原始载体语音，采样频率为11025Hz，16bit量化；(c)是经恢复的语音指令；(d)是隐藏秘密信息后的载体语音；

图1 嵌入语音“0 - ling”结果3.2 验证算法的抗干扰能力在密写嵌入时，如果不考虑HAS的特性，滤波、重采样、重量化、噪声干扰等都可以破坏秘密信息。本文考虑了HAS的掩蔽效应，使得LSB嵌入法的稳健性有了改善。在安静实验室环境下，采用主观评价MOS(mean opinion score)方法，将原始语音和隐藏有语音指令的语音放音试听，参与测试的人一致认为没有差别；将原始语音指令和恢复的语音指令进行放音试听，虽然带有一些噪音，但对理解不会产生太大的影响。当嵌入二值图像时，也基本可以分辨出恢复的图像。4 结论最低比特位法实现简单，嵌入和提取的速度快。但是，稳健性很差。为了提高稳健性，可以将秘密信息嵌入到音频信号的较高位，但这样带来的结果是大大降低了水印信息的隐蔽性。为了改善这一点，可以在嵌入过程中根据音频信号的能量进行数据嵌入位的选择，然而这种方法更适合平均能量比较高的音频样本。本方案结合时域和频域的听觉掩蔽效应，在特定信号帧的特定频段嵌入信号，在保证了信息隐藏的隐蔽性基础上，稳健性也有所改善。：[1] KATZENBEISSER S, PETITCOLAS FAP．信息隐藏技术--隐写术与数字水印．人民邮电出版社，2001[2] 刘振华，尹萍．信息隐藏技术及其应用．出版社，2002[3] Johnston J D． Transform Coding of Audio Signal Using Perceptual Noise Criteria． IEEE Select Areas Communication, 1988,6(2)[4] Ted Pa inter, Andree Spanias． Perceptual Coding of Digital Audio． Proceedings of the IEEE, 2000,　8(4)[5] 朱丽，沈从良．心理声学模型在数字音频中的应用．，电声技术，2002（8）[6] 江虹，韦岗．心理声学在宽带音频压缩编码中的应用．广东通信技术，2001（2）[7] 贾骏，王朔中，张新鹏．一种基于人耳听觉特性的数字音频水印方案．西安电子科技大学学报，2004（8）[8] 赵力．语音信号处理．机械出版社，2003

上一篇：数据仓库技术在数据服务平台中的应用

下一篇：轻量级TCP/IP协议中缓冲区与内存管理技术的研究与实现

当前位置：首页 > 论文 > 计算机 > 计算机应用

基于HAS特性的语音信息隐藏算法

图片内容

最近更新

推荐浏览