GE 的 Jack Welch 發明了強制排名制度(Stack Ranking):每年把員工分成前 20%(獎勵)、中間 70%(保留)、後 10%(淘汰)。
這個制度被全球企業膜拜了三十年。
幾十年後,GE 自己廢棄了它。Microsoft 用了它十年,內部人員公開說它「殺死了部門間的合作」。Adobe、Gap、Medtronic、Accenture,一個接一個放棄。
問題不是 Welch 錯了。Welch 在特定時空背景下,一個臃腫的大型工業集團需要快速淘汰冗員,這個制度可能是對的。問題是這個制度的設計本身有結構性缺陷,而結構性缺陷不會因為執行更「到位」就消失。
我把它叫做「考核悖論」(Review Paradox)。年度績效考核的每一個核心設計元素,年度頻率、數字評分、強制排名、回顧導向,都在破壞它聲稱要達成的目標。
用過去 12 個月的表現預測未來 12 個月?用一個數字概括一整年的貢獻?用排名鼓勵合作?
每一個都是自相矛盾。
一、時間扭曲:你考核的不是全年,是最後兩個月
心理學的「近因效應」(Recency Bias):人對最近發生的事記憶最清楚,權重最高。
一個員工前十個月表現卓越,最後兩個月因為家庭原因略有下滑。年終考核的結果?「表現不穩定。」
另一個員工前十個月平平,最後兩個月臨時抱佛腳突擊表現。年終考核的結果?「進步明顯。」
年度考核不是衡量全年表現。是衡量「管理者記得的最後 2 個月」。
更隱蔽的是,聰明的員工已經學會了這個遊戲規則。有經驗的人知道:前三個季度穩穩做,第四季度加速衝刺,在考核前做出「明顯進步」的印象。這不是績效管理,這是印象管理。
解決方案很簡單:提高頻率。從一年一次變成一個月一次,近因效應就被稀釋了。績效對話(Performance Conversation)的每月節奏,天然地修正了時間扭曲的問題,因為你每個月都在校準,沒有人需要等到年底才知道自己的表現如何。
二、數字暴政:4.2 跟 4.3 的差別是什麼?
把一個人一整年的工作,幾百個決策、幾千個小時、無數次的合作和貢獻,壓縮成一個 1-5 的數字。
4.2 和 4.3 的差別是什麼?
沒有人能回答這個問題。但在很多公司裡,這 0.1 的差距決定了獎金差一個等級、升遷排序差一位。
數字的暴政不只在於精度的虛假。更深層的問題是:數字製造了「可比性」的幻覺。
一個銷售冠軍的 4.5 和一個後勤主管的 4.5,是同一種表現嗎?一個帶著團隊從零建立新市場拿到 4.0 的人,和一個在成熟市場守住份額拿到 4.0 的人,是同一種表現嗎?
當然不是。但數字說它們一樣。因為數字抹殺了語境(Context)。
更糟的是,為了讓數字「公平」,組織會發明越來越精細的評分標準。溝通能力:4 分的定義是…5 分的定義是…最終你有一份 20 頁的評分手冊,管理者花三天時間填表格,但那些精確到小數點後一位的數字,跟真實的人類貢獻之間的關聯,薄得可以透光。
這些時間本來可以花在一場 30 分鐘的真實對話上。對話能捕捉語境,數字不能。
三、排名內耗:你在用排名鼓勵合作?
強制排名的邏輯前提是:績效是常態分佈的(Bell Curve),任何團隊都有前 20%、中間 70%、後 10%。
這個前提就有問題。
一個精心挑選的小型團隊,比如你花了一年從一百個候選人裡選出來的五個人,很可能五個人的表現都在「優秀」以上。強制把其中一個排到「待改進」,不是績效管理,是數學暴力。
但排名更致命的破壞在別處:它把隊友變成了對手。
Microsoft 前員工在接受 Vanity Fair 採訪時說得很直白:「在 Stack Ranking 制度下,團隊裡每個人都知道,幫助同事可能意味著降低自己的排名。」
結果是什麼?
- 資深員工不願意帶新人,帶出一個高手,自己排名可能下降
- 跨部門協作變少,幫別的部門成功對我的排名沒有好處
- 知識囤積取代知識分享,我知道的東西是我的競爭優勢,為什麼要教你
- 團隊開始爭搶容易出成績的專案,避開高風險的探索性工作
你設計了一個獎勵「個人排名第一」的制度,然後奇怪為什麼團隊不合作。
這就像你在足球場上宣布「今天根據個人跑動距離排名發獎金」,然後奇怪為什麼沒有人傳球。
制度的激勵方向決定了行為方向。如果排名的價值大於合作的價值,理性的人會選擇排名。不是人性有問題,是制度在懲罰合作、獎勵內耗。
這跟當責悖論(Accountability Paradox)的結構完全一樣:你以為你在驅動高績效,實際上你在系統性地摧毀高績效所需要的合作基礎。
四、回顧偏誤:用過去預測未來的根本性錯誤
年度考核的隱含假設是:一個人過去 12 個月的表現,能準確預測他未來 12 個月的表現。
這個假設有多不可靠?
想想:一年前的你跟現在的你有多像?你的能力結構、關注領域、協作模式、甚至工作動機,有多少變了?
人不是靜態的系統。人會成長、會轉變、會在新環境裡展現完全不同的面貌。
一個在前一家公司被評為「缺乏領導力」的人,換到一個信任他的團隊裡,可能展現出驚人的領導力。差的不是他的能力,是前一個環境壓抑了他的能力。
更重要的是,商業環境本身在劇烈變化。一年前最需要的技能和一年後最需要的技能可能完全不同。用去年的績效指標評量今年的貢獻,就像用去年的地圖導航今年的路,路變了,地圖沒跟上。
回顧偏誤讓績效考核成了一個永遠對著後照鏡開車的制度。你看到的都是已經過去的風景,而前方的路你完全沒在看。
五、那不考核用什麼?
先說一件事:完全不考核也是幻想。
人需要回饋。組織需要標準。沒有任何形式的績效評估,你會得到一個更差的結果,所有人都不知道自己做得怎麼樣,好的人得不到認可離開,差的人沒有壓力留下。
挑戰不是「要不要考核」,是「怎麼考核不破壞動力」。
三種替代模型,每一種都在解決傳統考核的某個結構性缺陷:
替代模型一:持續回饋(Continuous Feedback)
解決的問題:時間扭曲 + 數字暴政。
核心做法:用每月一次的績效對話取代年度打分。不給數字,給語境。不打分,做校準。
這不是「換一個頻率做同樣的事」。年度考核是法官判決,一年一次、最終裁定、不可上訴。績效對話是教練指導,持續、雙向、迭代。
當回饋是持續的,近因效應就沒有空間運作。當校準是對話而非打分,數字暴政就失去了載體。
替代模型二:同儕認可(Peer Recognition)
解決的問題:排名內耗。
核心做法:讓最了解工作品質的人,同事,來評價貢獻。不是 360 度評估那種「打分」模式,是「提名制」,每個月每個人可以提名一位「對我幫助最大的同事」,並說明原因。
提名是質化的(具體事例)而非量化的(1-5 分)。它獎勵的不是「個人排名高」,而是「對團隊有貢獻」。
當「幫助別人」會被別人看到並認可,合作就變成了理性選擇。不是因為制度強迫,是因為制度讓合作的價值被看見了。
注意:同儕認可不能取代管理者的判斷。它是補充,不是替代。管理者看到的是全局和長期,同儕看到的是日常和協作。兩者結合才是完整的圖像。
替代模型三:成長軌跡(Growth Trajectory)
解決的問題:回顧偏誤。
核心做法:不衡量「你現在在什麼水平」,衡量「你進步的速度和方向」。
一個人從 60 分進步到 80 分,跟一個人從 90 分原地踏步,前者在多數傳統考核裡排名更低(因為 80 < 90),但在成長軌跡模型裡,前者才是更有價值的投資。這個思維的轉換是根本性的。傳統考核問的是「你現在值多少」,這是一個靜態的估值。成長軌跡問的是「你正在往哪裡走,走得多快」,這是一個動態的導航。績效對話的每月記錄,天然地產生成長軌跡數據。半年回看,你看到的不是一個數字,是一條線,它告訴你比任何 4.2 或 4.3 都多的東西。
六、真正的挑戰
三種替代模型聽起來都合理。但讓我誠實:它們都比傳統考核更難執行。
傳統考核的隱藏優勢是:它簡單。填表、打分、排名、決定薪酬。HR 能標準化。管理者不需要太多技能。CEO 看到的是整齊的報表。
持續回饋需要管理者具備對話能力。同儕認可需要足夠的心理安全感。成長軌跡需要長期的記錄和耐心。
簡單的制度解決不了複雜的人性問題。但複雜的解法不代表它是好解法,好解法是最簡單的有效解法。
如果讓我只選一個起點,我選績效對話。
因為它是最小可行單元:每月 30 分鐘、一個管理者和一個部屬、三段式結構。不需要 HR 重新設計整個體系、不需要買新的績效管理軟體、不需要全公司培訓。
先跑起來。從一個人開始。做三個月。看看有什麼不同。
這比花六個月設計一個「完美的績效管理體系」然後在第一個月就變形、第三個月就形式化、第六個月就被放棄,有效得多。
給 CEO 的行動指引
一、做一次考核悖論自診。問自己四個問題:你的考核有近因效應問題嗎?你用數字概括人的貢獻嗎?你的排名制度在獎勵合作還是內耗?你在用過去預測未來嗎?如果有三個以上是肯定的,你的績效制度可能正在傷害你的團隊。
二、如果你還在用強制排名,認真考慮廢棄它。GE、Microsoft、Adobe 都走過這條路了。你不需要重複他們的學費。排名不是在選拔人才,是在製造恐懼和內耗。
三、在下一次薪酬決策中,試試「成長軌跡」的視角。不只看「他今年表現如何」,也看「他從去年到今年進步了多少、方向是否正確」。一個正在快速成長的人,即使當前水平不是最高的,可能是你最值得投資的人。
四、跟 HR 討論一個問題。「如果我們把花在填寫年度考核表格的時間,全部拿來做一對一的績效對話,我們的績效管理會更好還是更差?」答案幾乎肯定是更好。然後問:「那我們為什麼還在填表?」
考核制度存在了一百年。存在不代表有效。很多時候它只是慣性,「我們一直這樣做」是組織裡最危險的理由。
績效管理的目標不是給人打分。是讓人成長。任何不服務於這個目標的設計,都是成本。
