语词推理测验的词性、词类和词频对项目难度和反应时间的效应

来源:岁月联盟 作者: 时间:2010-07-12
                                           作者:武圣君,苗丹民,肖玮,刘旭峰,王建智

【关键词】  反应时间

  Effects of part of speech, word category and word frequency on difficulty and reaction time of Chinese Words Reasoning Test
 
  【Abstract】 AIM: To study the effects of part of speech, word category and word frequency on the difficulty and reaction time of Chinese Words Reasoning Test. METHODS:  The subjects scores were ranked respectively in the order of college group>senior high school group>junior high school group>elementary school group, the Han nationality group>minority group, and city group>country group. Part of speech, word category and word frequency of confusion options and target option were classified and the reaction time of class was recorded to calculate the difficulty of items. RESULTS:  The difficulty of the items in the same word category of confusion options and target option was significantly higher than those of their counterparts(P<0.001). The reaction time of the items of the same part of speech, word category or word frequency was significantly longer than that of their counterparts, respectively(P<0.05). CONCLUSION:  In Chinese Words Reasoning Test, the word category of confusion options and goal option has the main effect on the difficulty of the items and part of speech, word category and word frequency of confusion options and target option can also affect the reaction time. When the 3 indexes of confusion options and target option are the same, the reaction time will be prolonged.

  【Keywords】 Chinese words reasoning test; part of speech; word category; word frequency; difficulty; reaction time

  【摘要】 目的: 研究语词推理测验的词性、词类和词频对项目难度和反应时间的作用. 方法: 对语词推理测验选项之间的不同词性、词类和词频关系进行分类,记录不同分类下的被试反应时间,并题目难度. 结果: 被试的测验成绩分别为大学组>高中组(含中专)>初中组(含技校)>小学组,汉族组>少数民族组,城市组>乡村组;干扰项和目标项的词类相同的题目难度要大于词类不同的题目(P<0.001),被试对干扰项和目标项词性相同的题目的反应时间要长于词性不同的题目(P<0.05),对干扰项和目标项词类相同的题目的反应时间要长于词类不同的题目(P<0.05),对干扰项和目标项词频类相同的题目的反应时间要长于词频类不同的题目(P<0.01). 结论: 对于语词推理测验而言,题目难度主要是由题目中干扰项和目标项的词类决定的,词类相同时题目难度较大,题目干扰项和目标项的词性、词类和词频类都会对反应时间产生影响,3种指标相同时的反应时间均分别长于不同时的反应时间.
 
  【关键词】 汉语语词推理测验;词性;词类;词频;难度;反应时间

  0引言
 
  语言文字作为智力测验的一项基本内容,在许多经典的智力测验中均有体现,其测验类型有多种,其中求异题反映的是被试的语言推理能力,体现在对语词的准确分类上,关于此类测验的应用国内已有报道[1],但对于测验的难度、编制方法和测验所用时间未作深入研究. 语词推理测验的目的是探索一种可以用于大规模筛查的简便可行的语言能力测验,目前已取得了初步成效[2]. 但是由于词汇存在词性、词类和词频等固有指标,对测验的难度和时间,将会产生一定的影响,所以需要进一步探讨. 本研究采用对语词进行词性、词类和词频分类的方法,分别探讨这些因素对题目难度和测验时间的影响,同时提出编制该类测验时应该遵循的原则,为下一步计算机自适应测验(computerized adaptive testing, CAT)题库的建设工作提供必要的理论基础.

  1对象和方法

  1.1对象

  采用两阶段随机抽样,首先在全国各省市自治区(除西藏、香港、澳门和外)抽取45个试点单位,然后再从这些单位中随机抽取男性适龄青年4584名,年龄16~24(平均18.5)岁. 所有被试按受程度分组: 小学(n=5)、初中(含技校)(n=2193)、高中(含中专)(n=2134)和大学(含大专)(n=252)4个组;按民族分组: 汉族组(n=4341)和少数民族组(n=243)2个组;按城乡分组: 城市组(n=3731)和乡村组(n=853)2个组.

  1.2方法

  1.2.1语词推理计算机辅助测验采用计算机辅助测验的形式,每次每台计算机只有一名被试进行操作. 屏幕每次呈现1组(一题)词或词组,每组均有4个选项,每组词或词组前标有相应的数字键;被试判断后按相应的数字键;67组题测验结束后计算机自动判别结果. 本测验包括3套试题,每名被试每次随机接受其中的1套;统计分析发现,3套试题间相关均达非常显著水平(试题1~2, r=0.916;试题1~3,  r=0.917;试题2~3, r=0.919),构成良好的复本信度;为了便于描述和分析,本研究随机抽取其中1套.
 
  1.2.2语词分类按语词作用分类,可将题目中的选项分为2类,干扰项和目标项(干扰项指1个题目中的3个错误选项,目标项则指正确答案);根据汉语语法学,可将语词按照不同性质分类,即词性分类,可分为3种,即名词,动词,形容词;按语词现实内容分类,即词类分类,可将其分为25类,如植物,动物,工具等;按语词使用频率分类,即词频分类,可将其分为2类,高频词和低频词(高频词是指词频≥8/100万,低频词是指词频<8/100万).
 
  1.2.3语词组别代号词性: 干扰项和目标项词性相同时记为组a1,词性不同时记为组a2;词类:干扰项和目标项词类相同时记为组b1,不同时记为组b2;词频:干扰项和目标项均为高频词时记为组c1,有高有低时记为组c2(所有题目中没有干扰项和目标项同为低频词的情况). 干扰项词频以3条干扰项的平均词频记,平均词频是指题目全部4个选项的词频的均数.

  统计学处理: 全部数据采用SPSS11.0软件进行统计分析,统计方法包括: 频数统计,方差分析,t检验和相关分析.

  2结果

  2.1被试基本情况分析

  2.1.1对不同受程度被试的测验成绩进行方差分析不同受教育程度被试的测验成绩经LSDt多重比较检验结果显示: 测验成绩在各组之间均有显著性差异,分别为大学组>高中组(含中专)>初中组(含技校)>小学组(表1). 表1不同受教育程度组的测验成绩比较(略)

  2.1.2对不同民族和城乡被试的测验成绩进行t检验结果显示: 不同民族组和城乡组被试的测验成绩均存在显著差异,分别为汉族组>少数民族组,城市组>乡村组(表2).表2不同民族组和城乡组的测验成绩比较(略)

  2.2词性、词类、词频类、平均词频与反应时间、语词难度的比较根据统计变量的代号分组,对试卷中的67个题目在词性、词类和词频3个维度的组间差异进行t检验;并对平均词频和难度以及反应时间作Spearman相关. 结果显示:反应时间分别在词性、词类和词频各组间比较中有显著性差异,分别为组a1>组a2 ,组b1>组b2,组c1>组c2;难度在词类组间有显著性差异,组b1<组b2,在词性和词频组间未见显著性差异. 反应时与难度的关系: 二者相关为-0.751, P<0.001. 二者呈现负相关,说明题目难度越大,被试在作答时所耗费的时间越多(表3). 表3各指标与反应时间和难度的关系(略)

  目标项词频、干扰项词频和平均词频与反应时间和难度之间均未发现显著性相关.

  3讨论

  有研究提示反应时间和智力之间存在一定的相关,证实了智力的心理速率理论[3],智力低下者的反应时间和言语智力呈显著负相关[4]. 所以本测验就是在4 min限定时间内,通过记录语词推理测验的正确完成数来对言语智力和文化程度进行鉴别和区分.

  结果显示,在不同受教育程度、民族和城乡之间存在显著性差异,说明可能由于不同教育以及文化背景导致了成绩的差异,支持了该测验可以对文化程度作出鉴别,淘汰文盲和半文盲人群.
 研究结果显示:  对于题目难度而言,干扰项和目标项只是在词类这一项指标上有显著性差异,词类相同的题目难度要大于词类不同的题目难度,这与国外的相关研究结果一致,而在词性、词频类和平均词频上未见显著性差异;反应时间分别在词性、词类以及词频类3种指标内部组间存在显著性差异,被试对干扰项和目标项词性相同题目的反应时间要长于词性不同的题目,对干扰项和目标项词类相同的题目的反应时间要长于词类不同的题目,对干扰项和目标项词频类相同的题目的反应时间要长于词频类不同的题目,这与国外的有关报道并不一致.

  这提示我们: 在今后的扩展题目的工作中,对于难度较大题目的编制,应该优先考虑目标项和干扰项的类别,干扰项和目标项词类相同时题目的难度最大,因为二者此时的逻辑关系最为接近,区分特征最为缺乏,对被试言语推理和辨别能力的要求也就最高,这也体现了语词推理测验的编制初衷和测验目的. 对于反应时间而言,由于本测验是机辅助测验,考虑到大规模实施时对场地和计算机数的要求,所以需要对单机的测验时间进行必要限制,测验时间不能过长,所以在满足题目难度范围要求的情况下,可以适当考虑编制一些干扰项和目标项的词性和词频类不同的题目.

  通过对国外有关词频与反应时的研究不难发现,由于单词是拼音文字,因此反应时和难度还可能受到单词长短的影响. 中文是形象文字,所以反应时和难度可能会受到字数、笔画数和偏旁部首的影响. 尽管本测验在编制的过程中已经尽量对上述因素进行了控制和匹配,但是还可能存在一些影响,这是我们下一步需要深入讨论的问题,为此类测验的编制原则提供更加充足的证据.

  【】

  [1] 杨长虹,王永斌,朱玉萍,等. 200名中小学生团体智力筛选测验调查报告[J]. 行为医学,1999,8(4):305.

  [2] 武圣君,苗丹民. 全国征兵汉语语词推理测验的初步编制[J]. 科学研究月刊,2005,1(5):70-74.

  [3] Bates T, Stough C. Improved reaction time method, information processing speed, and intelligence [J]. Intelligence, 1998,1:53-62.

  [4] Luciano M, Posthuma D, Wright MJ, et al. Perceptual speed does not cause intelligence, and intelligence does not cause perceptual speed [J]. Biol Psychol,2005,70(1):1-8.