NO.1215 你被困在奖励里了吗?


你好,这里是罗胖精选。

今天推荐给你的内容,是来自于万维钢老师的《精英日课》第四季。最近《精英日课》里面有两节课,给我的启发特别大。我准备今明两天分享给你。

今天先来说一个话题,就是奖励机制。如果你有一份工作,规则设计得非常棒,既符合科学原理,也洞察了人性,多劳多得,非常公平。那这是一份好工作吗?

先别急着得出结论。我们来听听万维钢老师是怎么说的。

现在有两个工作,收入相差不多,你看看你喜欢哪个 ——

第一个工作有绝对明确的目标和达成目标的手段。任何时候你都知道应该做什么,而且只要做了就有奖励,不做、或者做错了就没有奖励。你的付出和回报紧密相连,你和同事们每个人的绩效都一目了然,绝对公平。

第二个工作虽然也有目标,但是目标很含糊,好像几个方向都有道理。遇到一件事到底应该怎么办,似乎可以有几个选择。有时候你明明很努力,却没看到什么成果。有一阵你有点懈怠了没好好干,收入也没减少。同事们有的干得好有的一般,可是领导好像根本看不出来,你偶尔感到不公平。

第二个工作中的情况是比较常见的,这样的工作场所经常受到谴责,而第一个工作有点像打游戏。所以你更喜欢第一个工作,是吗?

不是。你不喜欢第一个工作。你喜欢第二个工作。

第一个工作是外卖骑手,第二个工作是中学老师。现实是做外卖骑手的门槛很低,做老师的门槛很高。老师的收入并不高,有的可能低于骑手,但是哪怕再低一点,他们也不会去做骑手的。

这几天有一篇《人物》杂志的文章刷了屏,叫《外卖骑手,困在系统里》,作者是赖祐萱。送外卖的工作既辛苦又不安全。辛苦和不安全不是因为“送货”这件事的工作性质就是如此 —— 其实中国的交通还是比较安全的 —— 而是因为骑手们必须争分夺秒地、不惜违章去完成任务。骑手争分夺秒不是因为“系统”逼着他们这么干,而是因为系统“奖励”他们这么干:他们的业绩和收入紧密相连。

赖祐萱介绍,美团和饿了么都给骑手弄了个像打游戏一样的升级系统。你的收入不是跟劳动成正比:而是每周完成的订单数越多,每单的收入就越高 —— 这是一个能让人发挥出最后一丝力气的系统,干得越多越有意义,干得少就实在太不值得了。

这个系统使我想起了一个盒子。

1930 年,哈佛大学心理学家伯尔赫斯·斯金纳(Burrhus Skinner)发明了一个盒子,被后世称为“斯金纳的盒子(Skinner Box)”。盒子里装着一个小动物,比如说一只老鼠或者一只鸽子。盒子的墙上有个控制杆,动物一推动控制杆就会得到食物。

食物是对动物推动控制杆的奖励。斯金纳发现,起初动物会不断地推动控制杆去拿奖励,但是一段时间之后,它们似乎觉得这个游戏没意思了,就只在饿了的时候才去推控制杆。于是斯金纳改进了盒子的设定,把奖励改成了随机的,有时候怎么推控制杆都没有食物,有时候推一下能得到好几份食物。这一下子动物们就上瘾了,会不停地推控制杆,就好像玩老虎机的赌徒一样。

斯金纳把这个机制叫做“强化”。只要设计合理的奖励制度,你就能强化一个动物 —— 或者一个人 —— 的某个行为。如果你希望他多做这个动作,你要做的就是用奖励去强化他这个动作。

其实人们早就知道奖励的道理。工人有计件工资、高管有绩效奖金。有的老师会用读一本书奖励一个比萨饼的方法鼓励学生读书,有的家长会让孩子做家务挣取工资。但是以斯金纳为开山鼻祖的“行为学”的贡献在于你光给奖励不行,你的奖励必须给得巧妙才行:你需要一个能让人上瘾的奖励制度。

这门学问叫“行为设计学” [1]。现在行为设计学已经非常成熟了,不但美团和饿了么在用,国外的 Uber 和 Lyft 也在用 [2]。游戏公司更是在用。行为设计学能让奖励的效用最大化,不用给太多奖励就能最大限度地激励行为。其实美团饿了么还算够意思的,毕竟外卖骑手的收入远高于中国城市最低收入。在美国,Uber 司机累死累活地玩这个开车游戏,到手的收入却是常常低于最低收入标准 —— 而因为 Uber 跟司机之间没有正式的雇佣合同,这个低收入还是合法的:毕竟这只是一个游戏。

好,现在请你离开游戏设计者的视角。你能不能用外卖骑手的视角想想,这个游戏好玩吗?然后你再用公司的视角想想,这个系统真的好吗?

答案是不好。我们有充分的证据。

早在 1993 年,美国学者艾尔菲·科恩(Alfie Kohn)就有一本书叫《奖励的恶果》(Punished by Rewards,最新的中文版 2016 年出版,得到电子书有),论述了为什么用奖励强化行为不是个好制度。

从上世纪六十年代开始,就不断地有各种研究证明所谓计件工资、绩效奖金不但没好处,而且有坏处。科恩书里列举的证据就有 ——

* 管理层工资和奖金刺激,和公司利润之间的关系很微弱,而且常常是负相关;

* 绩效工资没有提高教师和社保局官员的工作质量;

* 在有的研究中,计件工资甚至让产量下降了;

* 日本和德国的工人效率最高,但是恰恰没有使用行为主义的物质刺激。

那什么情况下绩效工资有用呢?书中引用一个报告分析,这样的工作有三个特点 ——

1. 测试都是短期的,长期有没有影响不知道;

2. 工作任务是简单的,比如体力活或者分发卡片之类的事情;

3. 工作表现能直接量化,要么就是比谁做得多,要么比谁做得快。

你看后面两个特点,这不就是外卖骑手的工作吗?而这些研究表明,只要这个工作比较复杂,讲究一些难以量化的质量,直接的金钱刺激就完全没有好效果。

如果奖励对工人都没用,对学生就更没用。我在《万万没想到》这本书里就说过几个新研究,经济学家拿着几百万美元做实验,用发奖金的方法鼓励学生学习,结果是短期可能有效,长期一定无效。

有时候我们做事就是因为喜欢做这件事,比如踢足球或者做数学题,这叫“内在动力”。为了获得奖励而做一件事,则是“外在动力”。所有研究都表明,让人长期做一件事、能做好一件事、甚至主动做一件事的,必须是内在动力。

而科恩的洞见在于,奖励不但提供了一个无效的外在动力,而且还伤害了内在动力。奖励其实是对人的操纵:拿不到奖励就等于惩罚,奖励跟惩罚其实是一个意思。奖励会破坏团队合作。奖励鼓励了简单行动,让人不愿意深入理解工作中的问题,让人回避探索。奖励还能迅速降低人们对工作的兴趣。

以前经济学家泰勒·科文也说过这个问题:本来孩子做家务是在为家庭做贡献,这是一个充满温情的行为,现在你一谈钱,这还有意思吗?

说白了,奖励制度异化了行为。

我们直觉上认为奖励有效,但是心里想的都是奖励对“别人”有效:我工作主要是为了享受工作,我是内在动力驱动的,不过奖励制度还是必不可少的,毕竟别人都是为了钱工作……殊不知“别人”也是这么想你的。

那好,如果不谈钱,难道让大家都为了“情怀”而工作吗?那当然不行。这里面有个非常微妙的基本原则。

科恩提出的原则是,你应该「慷慨而公平地支付报酬,尽量确保不要让人们觉得受到了剥削,然后竭尽全力地帮助他们忘记金钱。」

一方给足钱一方挣够钱,但是双方平时工作的时候默契地不谈钱。

你看这个原则是不是恰恰是现代企业的工资制度。根据员工的水平、层级和资历给一个比较固定的工资,双方谈判达成一致,完了工作的时候该怎么工作怎么工作,忘记金钱。

有时候你帮老同事打个下手,有时候你带一带新同事,有时候你家里有事请几天假,有时候你主动加个班,没人会算计这些事儿值多少钱。因为你的一个决定,公司一下子赚了几百万,也不会直接分给你;因为你的一个错误,公司损失几百万,也不会让你赔偿。你的表现会默默地转化为升职加薪,但是每个行动都不直接跟金钱挂钩。

只有这样,大家合作才能愉快,你想要弄个什么事儿也能理直气壮。老师完全可以说我上班是为了教学生,公务员完全可以说我上班是为了国家,每个人都可以说我的收入只是工作的副产品。要是一举一动都涉及到钱,那实在太可怕了。

所以“奖勤罚懒”是一种非常土的管理方式。美团和饿了么现在能这么做,是因为现在是个极为特殊的时期:人们正在学着适应算法。现在骑手们的收入还比较高,愿意就业的骑手比较多,骑手的谈判能力比较低,骑手们还很年轻,对升级算法还感到很值得。可是这个工作能长期做下去吗?我们不知道。

常理来说,频繁的奖励和频繁的惩罚一样,是对人的侮辱,是把人当成工具。我们做事最好是享受做这件事本身,而不是把它当做达成别的目的的手段。

而这就要求工作具有一定的模糊性。模糊不但给了人探索的空间,也给了人自由。

一个妈妈对孩子说:“你看人家小明学习多好,你为什么不努力学习呢?”

孩子说:“努力学习也不一定能学习好啊,再说学习好也不一定工作就好啊,工作好也不一定就生活好,生活好也不一定就孝顺你啊。你喜欢我,我多花时间陪你玩不是更好吗?”

这就对了。正因为有这么多不一定,我们才有一点自由。如果一切都是一定的,如果人人必须按照算法行事,那样的日子还有什么意思呢?

好,内容听完了,我是罗胖。

这节课程听了是不是很有启发?我再重复一遍那句科恩的原则:你应该“慷慨而公平地支付报酬,尽量确保不要让人们觉得受到了剥削,然后竭尽全力地帮助他们忘记金钱。”这才是对待团队的合理方法。

《精英日课》是万维钢老师在得到App上开设的一档年度日更课程,每天一节高质量内容,让你换一个更高级的视角来看待各种现象。你值得加入学习。

来,到得到首页,搜索精英日课吧。仅仅第四季,已经有将近8万人在那里学习了,你还不来吗?

明天继续推荐精英日课里面给我启发的另一篇文章。罗胖精选,明天见。