從姜太公選將說(shuō)人員測(cè)評(píng)
測(cè)評(píng)是判斷,是根據(jù)行為樣本(特定場(chǎng)合下的特定行為)對(duì)行為總體(類似場(chǎng)合下的一貫行為)的判斷。由于語(yǔ)言和語(yǔ)言所反映的文化差異,使得外國(guó)的測(cè)評(píng)再好,也無(wú)法簡(jiǎn)單翻譯過(guò)來(lái)在中國(guó)使用。而且也沒(méi)有必要,因?yàn)橹袊?guó)測(cè)評(píng)的傳統(tǒng)足以讓我們繼承并發(fā)揚(yáng)光大。
早在十幾年前,我就聽(tīng)我的導(dǎo)師楊中芳博士談心理學(xué)的本土化,現(xiàn)在離開(kāi)學(xué)術(shù)界,更加從實(shí)用的角度體會(huì)到本土化的必要。
所以,本文以中國(guó)測(cè)評(píng)傳統(tǒng)為正宗,并且一反傳統(tǒng)做法,以行為觀察法為主流,以心理測(cè)驗(yàn)法為旁支,討論我所了解的古今中外測(cè)評(píng)的理論和實(shí)踐,不求全面,但求獨(dú)到和深入淺出。
行為觀察法和心理測(cè)驗(yàn)法是我對(duì)人力資源測(cè)評(píng)的二分法。我不想為行為觀察法和心理測(cè)驗(yàn)法下定義,我相信例子比定義更能說(shuō)明問(wèn)題。比如測(cè)量一個(gè)人的口頭溝通能力,行為觀察的做法可能是:讓測(cè)評(píng)對(duì)象參加一個(gè)討論,然后專家觀察、記錄測(cè)評(píng)對(duì)象在討論中的行為,并根據(jù)一定的標(biāo)準(zhǔn)打分。心理測(cè)驗(yàn)的做法可能是:呈現(xiàn)一段對(duì)話的文字描述(或錄音、錄像),然后讓測(cè)評(píng)對(duì)象做多項(xiàng)選擇題。
貼士:行為觀察法記錄和評(píng)估的內(nèi)容包括:領(lǐng)導(dǎo)行為、說(shuō)服行為、人際交往行為、解決問(wèn)題過(guò)程、書(shū)面計(jì)劃、對(duì)話等任何現(xiàn)實(shí)生活中有目的的社會(huì)和個(gè)人行為。心理測(cè)驗(yàn)法記錄和評(píng)估的內(nèi)容包括:選擇題答案、反應(yīng)時(shí)、回憶或再認(rèn)的準(zhǔn)確率和數(shù)量、生理反應(yīng)(如心率、皮膚電阻、心/腦電反應(yīng)),自我評(píng)估的分?jǐn)?shù)等可以數(shù)量化的指標(biāo)。投射測(cè)驗(yàn)不在本文所稱心理測(cè)驗(yàn)法范圍之內(nèi)。
中國(guó)的測(cè)評(píng)重視行為觀察
一般中國(guó)人談人力資源測(cè)評(píng),都把西方(西歐和北美)的人事心理學(xué)(personnel psychology)或產(chǎn)業(yè)與組織心理學(xué)(industrial/organizational psychology)作為正宗。其實(shí),西方研究測(cè)評(píng)歷史的學(xué)者,卻是言必稱中國(guó)。他們書(shū)寫(xiě)的測(cè)評(píng)史往往以中國(guó)的科舉開(kāi)始。中國(guó)的科舉制度是大規(guī)模應(yīng)用測(cè)評(píng)最早的、也是對(duì)社會(huì)發(fā)展有長(zhǎng)遠(yuǎn)重大影響的測(cè)評(píng)實(shí)踐?婆e制度使得農(nóng)民天資聰穎的子孫們可以通過(guò)寒窗苦讀而考取功名、走上仕途、甚至與皇室攀親。比起古代印度的種姓制度,古代中國(guó)的科舉對(duì)于社會(huì)發(fā)展的促進(jìn)作用不言而喻。
可惜,當(dāng)代中國(guó)人很少想起中國(guó)測(cè)評(píng)的輝煌。中國(guó)測(cè)評(píng)專業(yè)人員的精力,主要用在學(xué)習(xí)西方的心理學(xué),特別是心理計(jì)量學(xué)上了。更可悲的是,許多專業(yè)造詣?shì)^淺的人力資源從業(yè)人員熱衷于測(cè)評(píng)軟件。普通中國(guó)人所接觸到的測(cè)評(píng),大多是以多項(xiàng)選擇題和自我評(píng)估量表為特征的標(biāo)準(zhǔn)化心理測(cè)驗(yàn),主要分認(rèn)知能力測(cè)驗(yàn)和自我報(bào)告的人格問(wèn)卷兩大類。像卡特爾16因素人格測(cè)驗(yàn)、MBTI等著名的心理測(cè)驗(yàn),許多中國(guó)人力資源管理從業(yè)人員都叫得出名字。
中國(guó)自古崇尚行為觀察,孔子說(shuō),“始吾于人也,聽(tīng)其言而信其行;今吾于人也,聽(tīng)其言而觀其行!甭(tīng)其言而信其行,是自我報(bào)告的人格測(cè)驗(yàn)(self-reported personality tests)和情境或行為訪談(situation- or behavior-based interviews)的理念。聽(tīng)其言而觀其行,則是工作樣本(work samples)、情境模擬(simulations)和評(píng)鑒中心(assessment centers)的理念。
《莊子·列御寇》中的9種知人之法,屬于行為觀察法:
“故君子遠(yuǎn)使之而觀其忠,近使之而觀其敬,煩使之而觀其能,卒然問(wèn)焉而觀其知,急與之期而觀其信,委之以財(cái)而觀其仁,告之以危而觀其節(jié),醉之以酒而觀其則,雜之以處而觀其色。九征至,不肖人得矣!
先秦時(shí)代《呂氏春秋》所載的“八觀六驗(yàn)”,漢魏時(shí)期的劉劭在《人物志》中提出的“八觀五視”等等知人方法,都是行為觀察法。
科舉考試用的是多種測(cè)評(píng)方式,需要訓(xùn)練有素的測(cè)評(píng)師評(píng)分。當(dāng)今中國(guó)人以為科舉考試就是八股文章,這是誤解。其實(shí),科舉的考試方法很像現(xiàn)在的評(píng)鑒中心。
據(jù)陳社育的說(shuō)法,中國(guó)測(cè)評(píng)的傳統(tǒng)是方法多元化,并大量使用情境模擬。以科舉考試為例,在測(cè)評(píng)指標(biāo)上,科舉考試可謂全面:政治見(jiàn)解、行政工作能力和體現(xiàn)在文學(xué)藝術(shù)上的獨(dú)創(chuàng)能力。陳社育列舉了科舉考試綜合使用的幾種方法:
1. 貼經(jīng):主考官任取經(jīng)書(shū)的一頁(yè),將左右兩邊遮蓋,中間只露出一行,另一紙貼3―5字不等,要被試者將所貼的字填出來(lái)。
2. 墨義:由考官出30條、50條或100條問(wèn)題,讓被試回答,既可筆試,也可口試。
3. 策問(wèn):要求被試者對(duì)現(xiàn)實(shí)問(wèn)題(如政治、吏治、教化、生產(chǎn)等)提出建議。
4. 詩(shī)賦:要求被試者當(dāng)場(chǎng)撰寫(xiě)詩(shī)詞,以考察其思想品德、文化修養(yǎng)和文學(xué)才能。
陳社育總結(jié)科舉中的口試的3種形式:
1. 主考詢問(wèn)。
2. 根據(jù)命題準(zhǔn)備好答案提綱, 再逐個(gè)口答問(wèn)題。
3. 考生講演,主考和聽(tīng)眾進(jìn)行評(píng)議(古稱“試誦說(shuō)”)。
(關(guān)于中國(guó)科舉中的測(cè)評(píng),詳見(jiàn)陳社育《我國(guó)古代心理測(cè)量思想述評(píng)》江蘇教育學(xué)院學(xué)報(bào):社科版1999.04)
心理測(cè)驗(yàn)是人力資源測(cè)評(píng)的歧途
上個(gè)世紀(jì)是西方心理學(xué)長(zhǎng)足發(fā)展的一個(gè)世紀(jì)。同時(shí),西方測(cè)評(píng)師在做測(cè)評(píng)時(shí),往往以心理測(cè)驗(yàn)法為主,而以行為觀察法為輔。根據(jù)Susan E. Embretson的預(yù)測(cè),這個(gè)趨勢(shì)會(huì)在二十一世紀(jì)的美國(guó)得到延續(xù)。
貼士:從實(shí)際效用的角度看,心理測(cè)驗(yàn)和其所依據(jù)的心理計(jì)量學(xué)實(shí)際上是對(duì)人力資源管理的誤導(dǎo),因?yàn)樾睦頊y(cè)驗(yàn)所測(cè)量的認(rèn)知能力和人格與實(shí)際生活中的能力和成就尚有一臂之距。換言之,心理測(cè)驗(yàn)所測(cè)量的能力局限于學(xué)業(yè)能力。按照后來(lái)的智力理論家(例如R. J. Sternberg和H. Gardner)的觀點(diǎn),智力并不是單一的能力。例如,智力至少包含個(gè)人智力(personal intelligence)、自知力(intrapersonal intelligence)、以及人際智力(interpersonal intelligence)。其中,正統(tǒng)心理測(cè)驗(yàn)?zāi)軌驕?zhǔn)確測(cè)量的,頂多是個(gè)人智力中的學(xué)業(yè)智力(academic intelligence)。
美國(guó)軍隊(duì)曾經(jīng)大規(guī)模應(yīng)用心理測(cè)驗(yàn)。例如,第一次世界大戰(zhàn)中美國(guó)心理學(xué)家用智力測(cè)驗(yàn)作為從近二百萬(wàn)應(yīng)征者中征兵的篩選工具,當(dāng)時(shí)有α和β兩套測(cè)驗(yàn),α用于有閱讀能力的人,β用于不懂英語(yǔ)的人或文盲半文盲。心理學(xué)界認(rèn)為這是成功應(yīng)用心理測(cè)驗(yàn)的典范,可是根據(jù)美國(guó)暢銷書(shū)Storming Heaven: LSD and the American Dream,
“……結(jié)果令人失望。測(cè)驗(yàn)淘汰了八千六百四十八個(gè)智力低下者,同時(shí)得出結(jié)論:這些人以及他們所代表的全體美國(guó)人的平均智力年齡只相當(dāng)于13歲零一個(gè)月。換句話說(shuō),一般美國(guó)人的聰明程度與十幾歲少年相仿。
一戰(zhàn)中心理學(xué)家們還用了人格測(cè)驗(yàn)預(yù)測(cè)一個(gè)人在戰(zhàn)場(chǎng)上的表現(xiàn),結(jié)果并不成功。Storming Heaven一書(shū)中這樣寫(xiě)道:
武德沃茲設(shè)計(jì)了一套125題的問(wèn)卷用于測(cè)量哪些人格在作戰(zhàn)時(shí)會(huì)崩潰。不幸的是,這個(gè)工具在實(shí)用性上是一個(gè)失敗。
即使在重視學(xué)業(yè)智力的教育測(cè)驗(yàn)領(lǐng)域,心理測(cè)驗(yàn)法的有效性也受到挑戰(zhàn)。二十世紀(jì)末,美國(guó)有人開(kāi)始提倡所謂真實(shí)測(cè)評(píng)(authentic assessment),或稱作業(yè)測(cè)評(píng)(performance assessment),看重開(kāi)放式問(wèn)答(open-endedresponses)、論述題(essays),以及學(xué)生作品。值得一提的是,歐洲的教育考試,一直沒(méi)有像美國(guó)那樣依賴多項(xiàng)選擇題。
以行為觀察為主流,以心理測(cè)驗(yàn)為旁支來(lái)看人力資源測(cè)評(píng)的發(fā)展,對(duì)于一般心理學(xué)出身的人來(lái)說(shuō),不是一件容易事。據(jù)中國(guó)評(píng)鑒中心的先行者陸紅軍講,80年代他在國(guó)內(nèi)推廣評(píng)鑒中心時(shí),許多中國(guó)心理學(xué)界的人認(rèn)為是旁門(mén)左道。其實(shí),對(duì)于綜合、實(shí)用能力的測(cè)評(píng),最有效的方法不是心理測(cè)驗(yàn),而是行為觀察。
觀察法的外在效度高,成本也高,適用于重要崗位的選拔
戰(zhàn)爭(zhēng)比商業(yè)競(jìng)爭(zhēng)更殘酷。戰(zhàn)爭(zhēng)中,國(guó)家主權(quán)和成千上萬(wàn)的人命都掌握在將帥手上,所以選將是所有人事選拔中最重要的事。這種場(chǎng)合,沒(méi)有人敢用心理測(cè)驗(yàn)決定由誰(shuí)帶兵打仗。戰(zhàn)國(guó)時(shí)代的《六韜》一書(shū)中的《龍韜》,其中有一篇文章題為《選將》,記載姜太公所倡導(dǎo)的結(jié)構(gòu)化的行為觀察的方法選拔將領(lǐng):
武王曰:何以知之?太公曰:知之有八征:一曰問(wèn)之以言,以觀其辭。二曰窮之以辭,以觀其變。三曰與之問(wèn)諜,以觀其誠(chéng)。四曰明白顯問(wèn),以觀其德。五曰使之以財(cái),以觀其廉。六曰試之以色,以觀其貞。七曰告之以難,以觀其勇。八曰醉之以酒,以觀其態(tài)。八征皆備,則賢不肖別矣。
中國(guó)古代軍事家關(guān)于選將的模型很多,相當(dāng)于現(xiàn)在所說(shuō)的資質(zhì)模型(competency model)。例如,孫子就提出“將者,智、信、仁、勇、嚴(yán)也”。中國(guó)古代軍事家們大概都有自己的資質(zhì)模型。后來(lái),科舉制度衍生出的武舉制度,考試內(nèi)容有長(zhǎng)垛、騎射、步射、馬槍、舉重、言語(yǔ)、材貌等,都屬于行為觀察。據(jù)說(shuō),騎射這一項(xiàng),應(yīng)試者射向人形靶三箭,三箭皆中為優(yōu),二箭中為良,一箭中為及格。筆試作為補(bǔ)充,例如論述戰(zhàn)略及默寫(xiě)《孫》、《吳》 等兵書(shū)的內(nèi)容。但是,這些行為觀察只限于軍事技術(shù)技能,而領(lǐng)導(dǎo)能力,決策能力,信、仁、勇、嚴(yán)等品質(zhì)似乎沒(méi)有在武舉考試中得到考察。
德國(guó)人在第一次世界大戰(zhàn)中,使用了評(píng)鑒中心(assessment center,或譯成評(píng)價(jià)中心)這一術(shù)語(yǔ),并用此法選拔軍官。美國(guó)人在第二次世界大戰(zhàn)中選拔間諜,用到了評(píng)鑒中心方法。二戰(zhàn)過(guò)后英國(guó)軍隊(duì)一直沿用評(píng)鑒中心為陸軍學(xué)院招生。
嗚呼!姜太公選將之法并不是由中國(guó)人,而是由德國(guó)人、美國(guó)人、以及英國(guó)人發(fā)揚(yáng)光大。這對(duì)中國(guó)人來(lái)說(shuō)是一個(gè)遺憾!曾經(jīng)分別在J. C. Penny和AT&T兩家公司使用評(píng)鑒中心的兩位美國(guó)心理學(xué)家William Byham 和Douglas Bray在1970年創(chuàng)立的DDI,是最早把評(píng)鑒中心商業(yè)化的人力資源管理咨詢公司。評(píng)鑒中心無(wú)疑是姜太公選將法的技術(shù)體現(xiàn)。從姜太公選將到評(píng)鑒中心在軍事和商業(yè)上的廣泛應(yīng)用,我們看到不同于心理測(cè)驗(yàn)法的行為觀察法的發(fā)展軌跡。評(píng)鑒中心代表最有效的行為觀察法,其它行為觀察法包括工作樣本、單一情境模擬、可計(jì)分行為訪談等。
這里,我把評(píng)鑒中心的特點(diǎn)概括為“二高四多!倍撸焊咝Ф取⒏叱杀。四多:使用多種測(cè)評(píng)方法(包括心理測(cè)驗(yàn)法)、多個(gè)測(cè)評(píng)師,多個(gè)對(duì)象同時(shí)被測(cè)評(píng),多個(gè)測(cè)評(píng)指標(biāo)。
關(guān)于評(píng)鑒中心效度高。有人會(huì)問(wèn):效度有多高?國(guó)內(nèi)外的研究證明,評(píng)鑒中心的效度遠(yuǎn)遠(yuǎn)高于心理測(cè)驗(yàn)。根據(jù)我在應(yīng)用評(píng)鑒中心過(guò)程中所得到的客戶反饋,這種方法屢試不爽。
上文還說(shuō)到評(píng)鑒中心成本高,那么高到什么程度呢?美國(guó)評(píng)鑒中心的價(jià)格是幾百到幾千美元一個(gè)人,中國(guó)的評(píng)鑒中心也不會(huì)便宜到哪里去。雖然成本高,但是從投資回報(bào)和風(fēng)險(xiǎn)管理來(lái)講,一個(gè)字:值。我的忠告是:對(duì)于重要崗位(指的是管理、銷售、以及客戶服務(wù)),要么不做測(cè)評(píng),要做就做評(píng)鑒中心。