浅谈套录中文图书数据存在的问题及对策

来源:岁月联盟 作者:张洪铭 时间:2014-06-25
  图书馆界(LibraryWorld)2009年第4期(No.4,2009)张洪铭:浅谈套录中文图书数据存在的问题及对策[摘要]本文结合广西壮族自治区图书馆编目工作的实际情况,着重分析了现阶段套录中文图书数据编目过程中存在的问题,并提出了提高图书编目数据质量的建议。
  [关键词]套录;中文编目;数据
  
  套录编目是指编目员为一种图书编目之前,先对从外部获取的编目数据进行必要的编辑加工,从而转换为本馆数据库记录的过程。中文图书数据套录可以提高分编工作的效率及编目质量,减轻分编人员的工作压力,但由于我国制作编目数据的单位很多,采用的标准也不一致,使得中文图书编目套录数据时遇到了不少问题。本文就目前中文图书编目套录中存在的问题进行分析,并提出相应的对策。
  
  1 图书馆中文图书套录数据的来源
  
  1.1权威情报机构的数据
  国家图书馆联合编目中心和深圳图书馆联合编目中心提供的编目数据,其数据质量和可信度在国内的声誉比较好,也是国内各大省市图书馆目前使用率最高的数据来源。高校图书馆则更多采用的是CALIS联合目录中心数据库提供的编目数据。
  1.2书商的数据
  一些书商往往为客户购买的图书提供编目数据,保证了图书和数据的集中性和及时性,但是此类数据大多为字段不完整的采访数据,基本内容不够完整且主题分析不准确,因此仅做参考。
  1.3自编的数据
  对于查重后无数据的新书,馆多采取自编的方式著录。比如多卷书或丛书的著录,套用馆同类书的数据是较为方便的方式。
  
  2 套录数据存在的问题及对策
  
  编目数据的套录一般是从查重数据开始到存盘入库结束,其过程为:查重—确定—检查修改—存盘。将本馆编目系统中的数据与手中编目实体所反映的信息内容逐一对照检查,两者若有不符,则以实体内容为依据进行数据的修改、补充,并加上本馆馆藏信息项,完整的书目数据即可完成。在实际的套录工作中,常常发现来源于外部的编目数据总会有与本馆的编目细则存在着许多不一致的地方,一般多见于书名、外国责任者项、出版发行项和丛书项等项。
  2.1国际标准书号(ISBN)项的著录
  该字段除国际标准书号(ISBN)外,还包含有著作的装订形式、价格及错误的ISBN号。在010字段的@d价格的著录就因为规则不同表现为CNY、RMB,目前《中国文献编目规则(第二版)》明确规定@d价格的著录采用CNY,这就要求数据提供商按照要求著录。由于数据的来源不同,在套用数据中常发现随书光盘的著录格式不一样,有的将光盘的ISBN号著在“010”字段,例:010##@a7-900110-62-3@b光盘;有的将光盘的ISBN号放”307”字段,例307##@a附光盘:ISBN7-900110-62-3。
  2.2题名项的著录
  该字段包括题名、其他题名信息与题名相关的责任说明,以及出现在题名页上的用其他语言重复的并列信息(并列题名、并列责任说明等)。副题名的著录,要分清楚题名和副题名的关系,一般情况下“:”后面的内容作副题名处理,但不能一概而论,要根据具体的情况进行著录[1]。例如:1)2001#@a中国:经济转型与经济政策,在本例中“:”后面的内容起到了并列修饰的作用,因此共同作为正题名才合适;2)2001#@a古庙探幽:西安名庙,在本例中“:”后面的内容同样是起了修饰前面的内容,所以应该作为正题名。
  2.3外国责任者的著录
  在著录外国责任者时,是按照规范汉译姓著录还是完全按照题名页上的责任者信息来著录,这种矛盾时常困扰这编目人员。CNMARC中有关责任者的著录主要集中在200、304、7xx字段中。而有关外国责任者的著录又多了一项:314字段,314字段主要是对提供检索点的7xx字段中外国责任者的补充说明。目前CALIS对外国责任者的著录方式主要有两种:701字段按照规范汉译姓著录或完全按照题名页上的责任者信息来著录。为了综合以上两种著录情况各自不同的优缺点,笔者建议再加一个703字段,著录题名页上标非规范汉译姓的外国责任者,而编目员取著者号码则按照701字段的规范汉译姓来取。例如:
  2001#@a诱拐@f(英)罗•路•斯蒂文森著@g张建平译
  314##@a责任者Stevenson的规范汉译姓为:史蒂文森
  701#1@a史蒂文森@g(Stevenson,RobertLouis)@4著
  703##@a斯蒂文森@g(Stevenson,RobertLouis)@4著
  其中703字段有检索意义,这样的话可能看上去有点多余,但是弥补了以往著录方法的缺点,既解决了读者利用题名页上的外国责任者汉译姓检索的问题,不会造成图书漏检,提高了馆藏图书资源的利用率;又解决了编目员取责任者号码的问题,避免了同一责任者取不同著者号的问题,也解决了排架问题,给读者查找图书带来了方便。
  2.4附注项的著录
  附注项是对题名与责任说明、版本、出版发行信息、载体形态、丛编等信息内容的附注与补充说明[2]。在CNMARC中本信息块有30个字段,对该项的著录,各馆的要求有所不同,一般只是选择较为重要的项目进行著录。为了有利于不同编目人员统一套录工作以及图书馆工作的延续性和一致性,我馆对这一字段都有着较明确的规定。例如,为了说明教材性质以及读者对象,会看到“高等学校教材”字样出现在题名页上,许多外部数据放入“225丛书项字段”,我们套录数据时往往应书而异,对于该类型的图书,如属丛书的性质才入225丛书项,否则入“300一般附注字段”即可。
  2.5丛书、多卷书的著录
  对丛书的著录,从理论上讲,可分为按整套集中著录和按册分散著录两种方式。图书馆界对于丛书用何种方法著录,到目前为止也没有取得一致意见,但总的倾向多为分散著录。因为计算机进行编目工作,书目数据库中每条记录都是检索点,读者使用起来非常方便,而读者通常习惯是书名检索,因此应该进行分散著录。丛书中的每一分册都是可以单独存在的完整著作,以分册为主体进行分散著录,一个分册对应一条书目记录,能更全面更好地揭示与反映实际库存情况。多卷书的著录也可以采用分卷著录,克服集中著录书目数据不够明确的缺点,充分记录它们的内容特征,使所编数据具有一定内在联系,相互字段呼应,整体关系匹配,成为最详细的完整著录,达到书目数据的标准规范化,以实现信息的增值利用[3]
  2.6主题分析的著录
  主题词内涵的揭示与主题词使用的规范是为了描述、查找、存储、检索文献的主题,从而建立的一个具有检索工具意义的规范化词表。主题词在书目数据中占有非常重要的地位,以至于成为CNMARC中缺一不可的必备字段。在锁定主题之前,首先要根据文献检索存贮的要求,对文献内容进行分析,从中提炼主题的概念。主题分析包括文献的审读、概念的提炼,隐含概念的分析、主题类型的确定、主题结构分析5个环节,其中隐含概念的分析是较为重要的一环,关系到主题标引、文献归类是否准确的实质性问题[4]。如:《敲醒心灵的能量——迅速平衡情绪的思维场疗法》一书是部翻译作品,从题名表述上似乎是心理学的情绪与情感类,因此有人给出的主题词是:“情绪”“心理学”。经过仔细分析、翻阅书中的序和译序后,我们给出的主题词是“按摩疗法”,鉴于该书涉及心理方面的活动,为了充分揭示该书所涉及的其他相关内容,我们又给出“医学心理”这一主题词。随着科技的迅猛发展,高新技术领域和其他行业里派生出大量的专业的、时尚的新词汇,如:网页制作、数码技术、项目管理、物业管理、知识管理等,这些词汇的大量涌现,为我们给书目数据标引提出了新的课题。为了更好地提高文献的检索效率,在这些新词没有被收入主题词表之前,我们只能将这些新词当作自由词处理,在610字段予以揭示。

图片内容