浅析数字图书馆中基于内容的多媒体检索技术研究

来源:岁月联盟 作者:贺斌 胡红宇 时间:2014-06-25
  2.2.2 基于纹理特征的图像检索 
  纹理描述了图像或图像区域所对应的景物的表面性质。包括表面结构组织及其与周围环境关系的许多重要信息,纹理特征是一种统计特征,具有旋转不变性,并具有较强的抗噪音能力。一般地,体现图像纹理特征的具体指标有均匀度、对比度、方向,其中均匀度反映纹理的尺寸,对比度反映纹理清晰度,方向反映实体是否有规则的方向性。 
  2.2.3 基于形状特征的图像检索 
  基于形状检索基本上是从形状的轮廓特征和形状的区域特征来建立图像的索引,主要有形状轮廓特征和形状区域特征两重描述。形状轮廓特征主要包括:直线段描述、样条拟合曲线、傅立叶描述子、内角直方图、高斯参数曲线等。而形状区域特征主要包括:形状的无关矩、区域的面积、形状的纵横比等。 
  2.3 视频检索 
   视频检索实际上属于图像的检索。视频除了具有一般静态图像的特征外,还具有动态性,如镜头运动的变化、运动目标的大小变化、视频目标的运动轨迹等,所以视频又称动态图像,是一组图像按时间的有序连续表现,它的表示与图像序列、时间关系有关。视频数据可用幕、场景、镜头、帧等描述。视频序列主要有镜头组成;镜头由一系列连续的帧组成;帧是一幅静态的图像,是组成视频的最小单位;场景含有多个镜头;幕是由一系列的相关场景组成,表示以完整的事件。视频检索的前提是需要利用可视化特征视频数据建立有效的索引。 
  2.4 音频检索 
   音频就是对声音数字化后得到的结果。音频一般采用音量、音调、音强、带宽、音长和音色等属性来描述。其中音量、音调、音强、带宽和音长等属性易于通过技术手段进行量化建模,而对音色的处理却相对复杂,对其进行分析和捕捉较为困难。音频检索同视频检索相类似,音频特征随时间而动态变化,分析时计算不同时间段的声波信号的波形,并将波形的均值、方差和自相关系数等记录在波形数据库中。对音频数据进行采样、帧抽取后,运用方差分析等统计方法对音调、音量、音强等音频特征进行量化,并在音频数据库中记录这些量化值,形成索引树,在检索时可以利用这些特征进行示例和指定特征查询。 
  参考文献: 
  [1] 黄如花,王梅,黄晓斌.数字图书馆原理与技术[M].武汉:武汉大学出版社,2005.
  [2] 吴玉萍.基于文本的多媒体检索与基于内容的多媒体检索的比较[J].信息科学.2007(5). 
  [3] 管计锁,梁胜利.数字图书馆的信息检索技术[J].图书馆理论与实践.2001(4). 
  [4] 翟中文.基于内容的多媒体信息检索技术研究[J].河南图书馆学刊.2005(25). 
  [5] 罗德勇,明海.数字图书馆中基于内容的多媒体检索研究[J].情报检索.2003(1). 
  [6] 徐建华.一种新型的多媒体检索技术—基于内容的检索[J].情报学报.2000(19). 
  [7] 黄蕾.多媒体数据基于内容检索综述[J].情报探索.2000(4). 
  [8] 李敏.论数字图书馆的信息检索技术[J].津图学刊.2003(3). 
  [9] 徐建华.一种新型的多媒体检索技术——基于内容的检索[J].情报学报.2000(19). 
  [10] 杨慕莲,张芳芳.论数字图书馆中的多媒体信息系统的构建[J].咸宁学院学报.2004(5). 
  [11] 黄蕾.多媒体数据基于内容检索综述[J].情报探索.2000(4). 

图片内容