探析改进大专院校图书馆书目数据库质量之我见

来源:岁月联盟 作者:周青玲 时间:2014-06-25
  论文关键词:大专院校 图书馆 书目数据库 
  论文摘 要:文献资源共享是图书情报界多年来的追求,而书目数据库质量的高低影响着文献资源共享的可实现性和有效性。本文就大专院校图书馆书目数据库存在的质量问题进行了探讨,并分析了影响大专院校图书馆书目数据库质量的内外因素,最后提出了改进大专院校图书馆书目数据库质量的几点措施。 
   
  1 大专院校图书馆书目数据库存在的问题 
  尽管整个图书馆界已基本上实现了自动化、网络化管理,书目数据库建设也取得了不小的成就,但仍存在着不尽人意的地方。就大专院校图书馆来说,其书目数据库的质量普遍不太高,存在大量的不完备著录和错误著录等问题。 
  1.1 不完备著录 
  不完备著录主要体现在对某些必备字段、有则必备字段或其子字段不予著录。具体情况如下: 
  1.1.1 编码信息块(Coded information block)中,100、102字段及101字段中的$b、$c子字段常被编目人员所忽视。实际上100、101对所有的在编文献来说,均为必备字段,而101的$b、$c子字段则为“有则必备”,102字段也是体现文献重要著录内容的字段,不能随便省略。 
  1.1.2 著录信息块(Descriptive information block)中,缺少著录比较频繁的有:200字段中的$f、$z等子字段,205字段中的$a和$b子字段,225字段中的$f子字段等。200字段中,漏著最频繁的是$f子字段中有关外国责任者的国别或中国古代著者的朝代;205字段中,多数记录中只著录文献的版次,对于修订本、增订本、重印本以及手抄本、刻本、影印本等附加版本说明则未予著录;而225字段中$f著录内容在各馆书目数据库中很难找到。 
  1.1.3 附注块(Note Block)中,由于大专院校图书馆一般对此块中的有关字段未作具体的硬性规定,编目人员几乎很少进行相关著录。而实际上,诸如300一般附注、305版本与书目沿革附注、330提要或文摘附注等字段非常重要,都不同程度地对文献的有关信息进行揭示,最好予以著录。 
  1.1.4 知识责任块(Intellectual Responsibility Block)中,701字段中的子字段通常只著$a、$4,而无$c(国别、朝代)、$f(年代)等相关内容的著录,702字段也是如此。此外701、702均可重复,但编目人员经常没有进行重复著录,这使得第三责任者之后的其他责任者未能得到体现。 
  1.2 错误著录 
  1.2.1 著录格式方面的错误 
  (1)数字、字母、符号等字符的输入状态错误。如205字段中的版次应著录为“2版”“3版”“4版”等形式,却被著录为“二版”、“三版”、“四版”。在数据录入时,对于书名号、双引号、分号等符号,则不太注意区分半角与全角。 
  (2)数据的著录形式不一致。如010中的子字段$d,有的数据中著录到元,有的则著到角如CNY12.5,还有的著到分如CNY39.00等;210中的子字段$d,有的数据中著录到年如$d1987,有的则著录到月如$d1999.4。 
  (3)语言的繁简著录不一。对于含有繁体或异体字的文献,有的馆采用简化字著录,有的馆采用繁体字著录,还有的馆在实际操作中繁简兼用,致使同书异名,不便于用户的检索与利用。 
  1.2.2 著录内容的错误 
  (1)责任方式著录错误。如“编著”著录为“著”、“主编”著录为“编”、“主译”著录为“译”,更有甚者,把第一责任者与其他责任者相混,这种错误常出现在中译本中,具体表现为将译者著录于200字段的$f子字段,而原著作者却不予著录。 
  (2)205版本项著录错误。主要出现在中译本的版本著录上。比如有许多中译本图书是根据原版图书的第二版翻译过来的,但却是中译本的第一版,这种情况下,205字段不能著录为2版。 
  (3)606主题和690分类标引错误。主题标引错误主要包括主题词错误、不规范、子字段的指示符使用错误等,而分类标引错误主要体现为分类不到位、仿分复分错误等。 
  2 大专院校图书馆书目数据库质量问题的影响因素 
  2.1 内部影响因素 
  影响大专院校图书馆书目库数据质量的内部因素主要包括馆内的人员因素、标准因素、系统因素和管理因素。 
  2.1.1 人员因素 
  人员因素,是影响书目数据质量的最主要因素。笔者所说的人员因素主要包括人才结构和人员素质两个方面。 
  人才结构主要是指构成人才整体的各要素之间的组合联系方式。包括要素的数量、配置以及在整体中的地位等。人才结构的合理与否,将影响人才整体功能的发挥。人才结构是否合理,主要取决于“量”和“质”两个方面。人才结构的“量”主要指人才的数量,“质”主要指人才的配置。要使人才整体功能达到最大值,既要保证人才的充足,又要达到人才的合理配置,二者相辅相成,互相制约,缺一不可。对于图书馆来说,要想保证书目数据库的高质量,首先必须保证一定数量的编目人员,不能因为人数的不足而降低书目数据制作的质量;另外,还应该做到编目人员的合理配置,各馆应根据各自的购书情况、学科特点等,将不同层次不同专业的人员有效配置,发挥人才的最大效能。 
  人员素质包括思想素质和业务素质,作为书目数据的生产者,编目人员素质的高低直接决定着书目数据库的质量高低。编目人员能否自觉地提高建库质量,与其思想素质密切相关。举个简单的例子,在进行主题标引时,如果编目人员思想上不重视,就很容易仅从标题入手进行浅标引,影响主题标引的深度。而编目人员的业务素质是影响书目数据质量的关键因素,编目人员对文献著录标准与原则的把握程度、对机读目录格式的熟悉程度、对分类法和主题词表的掌握程度、对标引方法和规则的熟练运用程度、以及相关学科知识的具备程度等都将直接影响到在编书目数据的质量高低。 
  2.1.2 标准因素 
  标准因素主要指书目数据著录的标准化、规范化问题。目前我国高校主要以《中国文献编目规则》或《CALIS联机合作编目手册》为著录规则,以《中国机读目录通讯格式》(CNMARC)为数据著录格式进行书目数据的著录。但由于各馆对著录标准、规则的理解有所不同,致使各馆的文献著录细则有不少出入甚至存在一些错误规定,直接影响书目数据著录的规范化和一致性。例如我馆的中文图书著录规则中,对200字段是这样规定的:“$a正题名原则上按照规定信息源所载题名著录……图书的上下册、卷数、戏曲的幕数都是书名的一部分,与正题名之间用“.#”连接,有分卷(册)次的分卷(册)书名前用“,#”连接。如:20010$a世界史#第一卷,#亚洲$f……”很显眼,这一规定混淆了文献著录规则与著录格式的区别,在一定程度上误导了编目人员,造成同书异号、一书多条记录现象的普遍存在,从而影响了书目数据的标准与规范、交换与共享。 
  2.1.3 系统因素 
  大专院校图书馆多使用中小型的图书馆自动化管理系统(金盘、妙思、金蝶、金思维、索菲特等),这些系统比较简单易用,费用也比较低,但其系统自身却存在不少问题,成为影响书目数据库质量的因素之一。如我馆使用的“图腾”系统就存在不少问题:在采访、编目子系统中,无法串查各个数据库的数据,容易产生漏查、重购、重编现象,影响采编工作的效率与书目数据的质量;系统的自动生成,种次号功能程序不太稳定,常常存在跳号重号现象,容易导致索书号重复问题的出现;系统为了简化书目数据的著录过程,提高工作效率,对CNMARC中指示符的规定不予采纳,致使书目数据交换格式不一致,不利于书目数据资源的共享等。
  2.1.4 管理因素 
  影响书目数据库质量的因素除了人员因素、标准因素、系统因素,还包括管理因素,即对编目流程的控制管理。一般来说,一个完整的书目数据生产流程包括数据查重、制作工作单、核对、计算录入机、校对、数据形成并交送中央数据库,但在实际的工作中各馆的编目流程多有不同。以我馆为例,对到馆图书校对、基本加工(夹磁条、贴财产号、盖馆藏章、抽取样本)之后,才真正进入书目数据加工生产阶段,主要包括五个环节:书目查重——文献标引——数据著录——数据审核——送交中央数据库。这五个环节环环相扣,只要忽略某一环节的控制管理,就会产生一系列的问题,从而影响书目数据的质量。 
  2.2 外部影响因素 
  2.2.1 著录规则变化因素 
  数据库中的文献著录是根据一定的编目规则及格式(统称规则)进行的,规则由于修订或改版所引起的内容变化,势必会引起数据库中数据标准化和规范化的相应变化。而规则的修订和变化是客观存在的现实情况,从这个角度来看,数据库质量存在一定的问题也是在所难免的。以我国实行标准化著录以来常见的欧美国家的个人责任者著录为例,就经历了由著录中文姓氏,或依据相关工具书将姓氏原文翻译为中文,修改为按文献实际情况客观著录的变化过程。规则中的类似变化还有很多。因此,规则的变化是影响数据库质量的重要因素之一。 

图片内容