人才测评(测量、评鉴、评价)是指在一定的目标驱动下,通过一系列手段和方法对人的属性进行衡量的活动 。在由人组成的社会中,对人进行测评的重要性是毋庸置疑的,许多决策都需要人才测评予以支持 。
测评不是目的,而只是达到目的的工具 。
在需要人来完成的宏伟目标中 , 测评从远古传说开始,就已经在发挥效用了 。据记载,尧在选择舜作为自己接班人时 , “以二女妻舜以观其内,使九男与处以观其外”,最后选定了舜来治理国家,政绩卓著 。《周书·立政》记载商汤“克用三宅三俊”的标准来“擢士”,这样才有后来《诗经· 商颂· 殷武》中记载的“昔有成汤,自彼氐羌,莫敢不来享,莫敢不来王,曰商是常” 。
在人力资源领域 , 测评一直就存在 , 并且越来越为企业所重视 。即便如此,测评也从来都不是目的,过去不是、现在不是、将来也不是 。这一点是没有争议的,任何组织进行测评的目的都不会停留在增加对个人的了解上,了解个人是为了能够预测个人的行为,而预测行为是为了保证某个结果的出现 。
特质和行为是一体的两个层次
在达成目标的各种因素中,在排除了外在环境(包括资源与条件等)以外,人的行为几乎是唯一可控的因素 。由于导致目标达成的行为,是受特质(指个人所具有的内在属性的总和)支配而表现出来的外表活动,因此对人的测量就主要关注特质和行为两个方面,这是一体的两个层次 。
对某个事件的分析,除了其所处的大环境之外,也会涉及到的也是两个部分,第一部分是个体所采取的行动,第二部分就是其动机等内在特质状态 。对行为和特质的关注是如此休戚与共,以至于在研究过去行为的历史学科中,心理学也正在扮演越来越为重要的角色,因为这门学科能对个体内在的特质进行研究 , 能够更有助于了解历史行为的原因及结果 。
了解外在的行为相对容易 , 而了解内在的特质相对困难 , 这是为什么俗语说“画龙画虎难画骨 , 知人知面不知心” 。外在行为始终只是表象,是相对不稳定的,容易受到环境因素的影响 。比如一个人搀扶着老太太过马路,我们不能据此判断这个人乐于助人,因为有可能是老太太主动请求帮助,虽极不情愿但在众目睽睽之下此人也难以拒绝 。同样是捐助行为,那些出于帮助他人意图的人比那些寻求名声的,更有可能在今后表现出更多慈善行为 。行为虽然容易被观察,但却难以一贯表现 。相反,内在特质虽较难知晓,但却有较好的一致性和预测性 。
总之,行为难以预测,除非这种行为能表现出特质 。因此几乎所有的心理学流派,都想要了解人最为本质的属性,这些属性能帮助我们推断个人在不同情境下的行为 。只是由于对是否能真正的了解到这一属性持有不同的看法 , 行为主义和认知主义等心理学流派才表现出了区别 , 有的更加关注外在行为,有的更加关注内在特质,但不论如何 , 都是想要得到预测未来行为的指标 。
心理测量与人才测评
虽然内在特质相对行为具有较好的预测性 , 但是特质的测量不像测量长度可以用尺子,测量重量可以用天平一样简单 。它必须借助于一些手段或中介的因素,这些手段或中介因素设置了一种刺激,通过对个体就这些刺激做出的反应进行解析,来测量出个体相应的内在特质 。
采用一些手段和方法对人的属性进行衡量即心理测量 , 心理测量不仅包括以心理测验为工具的测量,也包括用观察法、访谈法、问卷法、实验法、心理物理法等方法进行的测量 。因此,心理测量涵盖了在教育、咨询、医疗等范畴的多种应用,而将心理测量应用于组织内对人的属性进行测量即人才测评,人才测评包含于心理测量之中 。
对于具有五千年历史的中国来讲,虽然人才测评并不乏很多记载 , 但是这些操作基本不符合以下由Kevin R.Murphy(2006)等对现代心理测量的要求,这些要求是保证个体特质测量准确性的最基本要求,也是科学的人才测评所必须遵守的原则:
- 明确的目标行为样本,即事先要有明确的测量目标;
- 这个样本是在标准条件下获得的 , 即在控制条件下进行;
- 在记分或从行为样本中获得量化信息方面有既定的规则 , 强调有量化的结果 。
各类测量工具的区分
凯锐优才从心理测验的三大种类型出发,对各种科学的人才测评工具进行了总结,并结合“科学”这一原则,对各类测评工具和方法的特点及适用情景进行了分析:
最佳表现类:
最佳表现类测验会给参与者一定的任务情景,让他们尽自己最大的努力成功地完成任务 。对肢体平衡、手眼协调、声音颜色区分、机械操作、岗位知识等能力的测验均属此类 。由于最佳表现类测验所关注的是对能力的测量,因此参与者在作答过程中不会由于“伪装”等因素的影响而得到较高的分值,即这类测验是有难度的 。最佳表现测验在企业的招聘和选拔晋升中应用非常广泛:招聘中使用的各类能力测验,晋升中使用的资格认证考试等都是最佳表现测验的具体应用 。
以认知能力为例,在一项总结过去85年研究的论文中,有三种选拔组合方法被证实是最为有效的,这三种组合方法是认知能力(General Mental Ability)+工作样本测试(Work Sample Test);认知能力+正直测验(Integrity Test);认知能力+结构化访谈(Structured Interview) 。在这三种组合方法中,有一个共同的要素,即认知能力测验 。世界范围内的认知能力测验非常多 , 这些测验还有另外一个名字:智商(IQ)测验,虽然不同测验的关注点和维度有所不同,但总体属于一类 。
认知能力并不能预测最好的绩效表现,但是卓越的绩效表现一定是以满足一定的认知能力要求为基础的 。所以,认知能力能较好地预测差的绩效表现,因此可以作为一种劣汰的工具 。但需要警醒的是 , 很多以最佳表现作为测量目标的测评工具,并非真正意义上的最佳表现类测验,很多就素质所开发的测验仅仅是主观评价类测验,使用这一类测验所得到的结果 , 并不能作为单一的测评依据 。
行为观察类:
在一个特定的情境下观察参与者的行为和反应,属于行为观察类测验 。这其中包括两大类:即情景观察和访谈,其中情景观察包括控制的情景模拟和自然的现场观察 , 访谈总体可分为结构化和非结构化两类 。
控制的情景模拟包括角色扮演、案例分析、管理游戏、小组讨论等 。这些方法都符合上述的三个原则:有明确的测量的目标、实施过程标准化、评价结果数量化 。相比于情景模拟,自然的现场观察具有更好的生态性 。但是在非控制的环境下,行为表现同测量的目标之间没有相关性,也就是行为的表现具有随意性:比如参与者没有表现某个行为特质 , 并不是由于不具有该能力,而是由于没有表现这一能力的机会,因此相对而言科学性较低 。
访谈是应用最为广泛的一种人才测评方法,结构化的访谈规定了提问的顺序与评分的标准,因而是较为准确的一种测评方法 , 而非结构化的访谈受测评师个人因素影响较大,不同的测评师会存在关注点的不同和能力的高低,在这种不受控制的过程下,评价结果往往也是随意或不一致的 。
以上四类工具均有较好的信度和效度 , 特别是控制的情景模拟和结构化访谈,完全符合科学测量的三个原则,可以用以在招聘选拔中择优 。比如结构化即时计分(Structured Immediately Rated Interview),将情景融于访谈之中,对特质的测量具有较好的信度和效度,是一种非常方便使用的工具 。
主观评价类:
主观评价即让参与者自己或了解参与者的他人 , 在某个标准下对参与者进行评价,即自评和他评 。自评也叫自陈 , 即自己在某个标准下对自己进行评价,比如个性测验、心理健康测验、职业倾向、价值观测验等均属此类 。自陈测验容易受到个人印象管理或作假等因素的影响,因而其信度和效度存在一定的不确定 。但是,一些自陈工具在设计时能将这一因素考虑在内 , 因而其结果也具有较高的信度和效度,比如看图说话类的投射测验 。
好的自陈测验能够帮助测评师更好地了解参与者,但是应当注意的是单独用自陈式的测验,比如MBTI、DISC、PDP甚至九型人格等来做招聘选拔的决策是很危险的!但是在发展人的项目中,良好的自陈式测验的作用是巨大的 , 通过自己对自己的评估,最后得到自身特质的反馈 , 对几乎所有人来讲,都是一件有吸引力的事情 。
另一种主观评价的方式是他评,包括360评估、推荐信、证明信等 。他评的一个挑战是如何保证评价者对题目或问题的理解,以及其评价的公正客观性 。满足这两个要求的他评方式是可信的,通过设置没有歧义的客观的题目、说明客观评价的重要性、选取适当的样本均能在一定程度上提高这种方法的可信度 。
评价中心
鉴于以上三类工具各有的特点,一种组合的方式被创造出来并广泛应用在组织中,这种方法就是评价中心(评鉴中心) 。评价中心是以情景模拟为主,辅以各类测验的综合评价方法 , 一个典型的评价中心几乎涵盖了上述三类测量工具:角色扮演、案例分析、小组讨论、文件筐、能力测验、个性测验、360度评估等 。
由于评价中心是对多种工具的组合,因此严格地讲它并不是一种测量工具 。但正是由于采用了多种工具,评价中心才能对人做出更为准确的测量 。
没有100%精确的人才测评工具
对物理量的测评可以有很高的精确程度 , 但是还没有谁敢声称能做到100%的准确 。对人的测量比对物理的测量要困难得多,因此不确定性也要大得多,因此没有完全准确的测量工具 。即使是像评价中心这样集合了多种工具的方法,也仅能保证70%的准确性 。
【科学的人才测评方法】就如同在文章开头所讨论的那样,对特质的测量要通过行为,而行为是容易变化的 , 这种不确定性导致了人才测评不能像物理测评那样具有很高的准确性 。但是即便是这70%的准确性,对于组织而言 , 作用已是非常卓著了 。在不同的目标和条件下,对工具的选用也应当不同:选择以选拔为目标的测评工具时 , 与选择以增加培训课程参与热情的测评工具相比,就要更加注重工具的准确性 。