我国人才测评技术的引进和开发在信度和效度方面反映出的问题,概括起来大致有以下几个方面:一是信度、效度理论与有效应用问题主要涉及公务员录用考试测验的信度、效度指标、测评目标的模糊性和效度的解释等问题;二是信度、效度的先导性与可操作性问题,涉及信度、效度与量表编制的关系,效度的可操作性等问题;三是效标效度的时效性问题,主要涉及预测度的准确性、同时效度的功能,预测效度与同时效度的分离状况等问题。
信度(credibility)是指测验结果的可靠性、稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。这种可靠性体现在:
测验结果跨时间的一致性――被测者在不同时间所测结果一致;
测验内容的一致性――同一测验内的各部分题目所测的是同一种行为或行为特征;
不同评分者之间的一致性――不同评分者对同一测验结果的评分一致。一项成熟的心理测验都具有比较理想的信度。信度较低的测验其测验分数的稳定性较差,往往不能反映被测者的真实水平。
计算信度系数的公式和方法很多,通常有这么几种:
(1)折半法。将测验的项目分为两部分,分别计算这两部分的分数,以这两部分分数的相关系数作为折半信度系数。这种方法简单易行,省时省力。在把测验的项目进行折半时,可以按奇项--偶项划分,也可以按其它的标准折半。由这种方法得出的数值仅计算了测验一半项目的信度系数,还要进行修正才能得出整个测验的信度系数。
(2)复本法。复本是指研究人员同时编制两份量表,它们在内容、形式、难度等方面等同,请被试分别接受两次测验,一次做一份,然后把被试的两次测验得分的相关系数作为复本信度系数。如果两次测验几乎在同一个时间内完成,则该系数为复本系数,如果间隔的时间较长,则得出的相关系数为稳定或等值系数。这种方法得出的结果比较能说明问题,但是要编制两份等同的量表殊非易事,因此在实践中的应用受到一定的限制。
(3)重测法。若编制两个量表有困难,可以用一个量表对同一个样本实测两次,由之得出两组分数的相关系数可以作为重测信度系数。这种方法往往容易引起被试的反感,觉得乏味,不愿意配合;此外样本的构成,两次测量的间隔,欲测构念的稳定程度也会影响到测量结果。
(4)内部一致性考验法。这种方法近来很为流行,它可以从信度和效度两方面说明问题。这种方法从信度与效度的关系角度提出了对测验量表内部一致性考验的思路,如果一个测量量表是有效的,这个量表就必须是前后一致的。每个量表的不同层次都应该指向构念的方向,不同的测量项目应该涵盖所欲测量的构念的一部分,为测量作出各自的贡献。如果一个量表中的所有项目都是高度内部一致性的话,那么整个量表仅能测量构念的某个部分,而不是其全部。用这种方法不仅可以衡量整个量表的信度系数,而且可以从项目的水平分析其作出的贡献。
效度是另一个衡量心理测量质量的指标。效度(validity)是指所测量到的结果反映所想要考察内容的程度。信度是效度的必要条件,但并不充分,效度要进一步解释经验水平的指标与理论构念的联系。测量结果与要考察的内容越吻合则效度越高;反之,则效度越低。总之,某些测试对所要测量的行为具有更明显的代表性;而有些则相反。正因为如此,我们很难证明一项测试测量到了希望测量的东西,即证明这项测试是有效的。可以把效度大体上分为两大类:一类是经验效度,这是比较普遍的一类,它们主要表征一些可观测变量间的关联程度,因此,这类效度通过分析两个或两个以上变量间的关系,可以用一些观测变量预测另外一些观测变量;另一类效度是理论效度,它主要表征观测变量与理论构念间的关系,这些理论构念往往是潜在变量,不可直接观测。
上一篇: 人才心理测评有什么用处? | |
下一篇: 人机对话测评:理论、方法及其问题 |