基于HAS特性的语音信息隐藏算法
来源:岁月联盟
时间:2010-08-30

2 基于听觉掩蔽门限的语音信息隐藏心理声学中的听觉掩蔽效应是指,在一个强信号附近,若信号将变得不可闻,被掩蔽掉了。被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值(Masking Threshold),在这个掩蔽阈值以下的声音将被掩蔽掉。由于语音信号具有短视平稳性,我们对其进行分帧处理,由上面的方法计算出每一帧信号的听觉阈值,在每个选定的帧中仅对掩蔽门限以下的频率分量实行LSB替换。2.1 嵌入信息
2.2 提取信息在提取过程中,把嵌入信息的点用LSB方法提取出二进制码流,即
用相应的编码恢复成密写信息(语音指令、二值图像)即可。3 仿真试验及结果本文采用一段长度2.716s,采样频率11025Hz,量化级16bit,内容为“苏州大学信息学院”的语音进行试验。载体语音分帧时,每帧信号长度取为512个样点,嵌入的语音指令内容为数字“0”。3.1 仿真结果本文用Matlab编制了整个的语音信息隐藏算法。原始语音波形和嵌入语音指令后的语音波形如图1所示,其中,(a)是嵌入的语音“0”的波形图,采样频率为8kHz,8bit量化;(b)是原始载体语音,采样频率为11025Hz,16bit量化;(c)是经恢复的语音指令;(d)是隐藏秘密信息后的载体语音;
图1 嵌入语音“0 - ling”结果3.2 验证算法的抗干扰能力在密写嵌入时,如果不考虑HAS的特性,滤波、重采样、重量化、噪声干扰等都可以破坏秘密信息。本文考虑了HAS的掩蔽效应,使得LSB嵌入法的稳健性有了改善。在安静实验室环境下,采用主观评价MOS(mean opinion score)方法,将原始语音和隐藏有语音指令的语音放音试听,参与测试的人一致认为没有差别;将原始语音指令和恢复的语音指令进行放音试听,虽然带有一些噪音,但对理解不会产生太大的影响。当嵌入二值图像时,也基本可以分辨出恢复的图像。4 结论最低比特位法实现简单,嵌入和提取的速度快。但是,稳健性很差。为了提高稳健性,可以将秘密信息嵌入到音频信号的较高位,但这样带来的结果是大大降低了水印信息的隐蔽性。为了改善这一点,可以在嵌入过程中根据音频信号的能量进行数据嵌入位的选择,然而这种方法更适合平均能量比较高的音频样本。本方案结合时域和频域的听觉掩蔽效应,在特定信号帧的特定频段嵌入信号,在保证了信息隐藏的隐蔽性基础上,稳健性也有所改善。 :[1] KATZENBEISSER S, PETITCOLAS FAP.信息隐藏技术--隐写术与数字水印.人民邮电出版社,2001[2] 刘振华,尹萍.信息隐藏技术及其应用.出版社,2002[3] Johnston J D. Transform Coding of Audio Signal Using Perceptual Noise Criteria. IEEE Select Areas Communication, 1988,6(2)[4] Ted Pa inter, Andree Spanias. Perceptual Coding of Digital Audio. Proceedings of the IEEE, 2000, 8(4)[5] 朱丽,沈从良.心理声学模型在数字音频中的应用.,电声技术,2002(8)[6] 江虹,韦岗.心理声学在宽带音频压缩编码中的应用.广东通信技术,2001(2)[7] 贾骏,王朔中,张新鹏.一种基于人耳听觉特性的数字音频水印方案.西安电子科技大学学报,2004(8)[8] 赵力.语音信号处理.机械出版社,2003