效度是指评估的有效性,即运用量表或其他评估方法所获得的结果达到期望目标的程度。效度按不同的侧重一般分为内容效度、效表关联度和结构效度。但它们不是指三个不同的效度,而是指效度的不同方面,我们只是为了介绍的方便对其进行了分类。
1.内容效度
内容效度用来分析评估表中阐述的要素以及个体各要素的评估成绩反映其绩效的程度,评估表内容效度反映了评估表的内部一致性,显示同一量表里的所有项目是否在测评同一维度。它提供了检查评估表在何种程度上避免了内容失误的一种方法。比如,评估表是设计来测量员工工作能力的,那么工作行为就与工作能力无关,应该删除。
常用的内容效度检验法就是请人力资源管理专家按照一定的标准评价某评估是否具有代表性,例如运用评估表对员工进行评估时,为了分析内容效度,请10-20名专家对如下问题按“合理”与“不合理”的是非法进行判断:
评估要素与评估表结构的归属关系是否合理?
要素名称与定义内涵的吻合程度是否合理?
评估等级与各等级标准的相关程度是否合理?
评估表的总体与评估期望达到的目标的一致性程度是否合理?
各要素之间关系的协调性是否合理?
然后,综合专家们对这些问题进行的选择回答,按公式计算出评估的内容效度:
CVR=(Ne-N/2)/N/2
式中
CVR——内容效度
Ne——判断某项目具有代表性的人数
N——参加判断的人数
的值在-1.00-+1.00之间,值越大效度越高。但是在实际工作中,由于内容效度判断的有关问题涉及范围较宽,常常很难用简单的“合理”或“不合理”进行判断,因此难以通过上述的公式进行数量化分析,更多的是采用专家分析、集体推断的描述形式进行内容效度的检验。
2.效标关联效度
效标关联效度就是通过寻求员工绩效评估成绩与某效标的相关程度来度量的效度。这里的效标是指假定的客观标准,它作为评判评估手段的有效性的指标。根据效标关联效度与评估成绩的时间关系不同,可分为同时效度和预测效度两类,同时效度指效标是与评估时间一致的,预测效度指效标与评估时间有一定的时间差。效标关联效度因易于理解和判断等优点,成为目前国内运用最为广泛的检验效度的方法。
同时效度是检验评估所获得的结果符合同时存在的特定标准——效标的程度指标。同时效度的效标可以从工作实绩、自我评估、企业评估、他人评估等方面获取。工作实绩是运用得最为广泛的效标,运用这个效标需要分析个体前阶段的工作状况,根据工作效率、社会贡献、创造成就等指标来确定工作实绩。在实际工作中,有些实绩是硬指标,如产量、质量等;有些则是软指标,如提高企业声誉等,在进行工作实绩评估时,一定要把两者结合起来。
预测效度是检验评估所获得的结果符合未来产生的特定标准的程度指标。如果评估工作的目的是为了预测员工做不同时期的工作的预期绩效,就必须对预测效度进行分析,在实际的工作中常用评估半年后的工作实绩作为效标,通过对个体目前的绩效评估成绩与效标的相关性分析,来度量评估的预测效度。
3.结构效度
结构效度反映的是评估所得结果同期望评估内容的同构程度,它表明了在多大程度上实际评估体系的结构能够被看作为所期望评估内容在结构上的替代物。它被用来推测被评估者拥有的一些素质或结构的程度,如员工对组织的价值等,这里假定素质或结构在该绩效评估方法中是可以反映出来的。确定结构效度的大致程序是先收集几个不同的在逻辑上能够测量同一结构(如管理技巧)的绩效评估方法,然后观察这些方法之间的关系,高度相关则表示有结构效度。
不同的观察者也经常会被要求在多个特性或多个测量者的框架下来分析评估的结构效度。使用“特性”这个词,仅仅是指使用标准的多个维度(如技能、人际关系技巧、管理能力等),“多个测量者”是指由不同的评估者,如上级、同事和下属来评估员工的绩效,如有结构效度,那么这些非常了解工作的观察者就每个具体的标准对该员工的评估应该是一致的。然而,测量该员工的一个标准(如技能)的方式与测量它的另一标准(如人际关系技巧)的方式并不一定相关。不同标准之间的高度相关经常被作为哈罗错误(Halo error)的证据,也就是说评估者通常做出对被评估者的综合的整体评价,而没有考虑每个人在工作的不同方面或不同维度的真实情况。事实上,认为每一个人在某一方面优秀就是在所有方面都优秀是不切实际的,以为每个人都有不同的优缺点,好的具有结构效度的评估方法应该反映出这些不同的优缺点。
结构效度与互测效度的是有区别的,前者要求绩效的不同方面低度相关,而后者要求高度相关。然而,在实践中如果说不同绩效标准的相关就是哈罗效应也是不对的。大多数企业,总是力图一致,对其中某一方面绩效不佳者会予以开除,而且评估绩效的尺度经常有逻辑的联系。
最后,需要特别说明的是信度极大的影响着效度,因为如果评估尺度极端不可信的话,也就不可能有效。例如,如果上级管理人员仅根据某一天员工的情绪来对其打分,也许就不如一段时间内对其打的分数可信,另外,该绩效评估测量的不是员工的绩效而是其情绪的波动,因此测量是无效的。有效的测量应该是不管何时由何人来进行测量,都会得出一致的(即可信的)数据。