孩子的奖励式教育与公司的奖励式管理

事情的由来：

前几天放假，孩子想出去玩，而他妈要让他练琴，并且说：练好了这段琴才能出去玩。孩子听到这段话后立刻放声大哭。他妈妈说这个条件的目的，明显是想敦促孩子练好琴。练好琴就给你奖励，让你出去玩。不练好琴，就不能出去玩。但问题是，孩子感受到了什么？他好像感到了痛苦：放声大哭。显然，孩子在这里的直觉感受不是什么奖励、鼓励的感觉，也不是什么对得到奖励的期待，而应该是感觉到了痛苦，认为自己受到了惩罚。否则他也不会立刻就哭了（这里我们采用了孩子的第一反应，我也相信孩子是自然反应的，没有做出过多的思考）。

那问题来了：为什么会这样？

孩子显然认为，本来是可以出去玩的，但现在不能去了。所以，他感受到了惩罚。孩子关注的是能否出去玩，任何对出去玩设置的附加条件都会让出去玩变得困难。而家长关注的是练好琴。为了让孩子练好琴，家长给予孩子一个有条件的奖励，让孩子把练好琴与出去玩联系起来。希望孩子能先好好练琴。这里我们不再讨论孩子视角，毕竟孩子都是本能的反应。我们主要讨论一下家长的视角。家长为什么愿意用一种所谓奖励的手段去教育孩子？

我在旁边看到了整个过程，我知道这中间牵扯了很多认知方面的问题，没有办法在三言两语的情况下就说清楚。那我们就来好好讨论一下：这种以奖励为手段，对孩子的教育方法是有效？还是无效？对孩子的练琴有正面作用、还是有负面作用呢？

如果站在他妈妈的角度上，他妈妈这么做的目的是为了让孩子能更好的弹琴，给予了孩子一个奖励的措施。可以出去玩明显就是一种奖励方法，前提是只要孩子能练好琴，我就给予你这个奖励，这个奖励措施肯定是可以兑现的。在练琴前，我先给你一个可以得到的奖励，目的是激励你好好的练。这样的方法有什么不对吗？这不是我们国内家长管理孩子所常用的一种方式吗？

这是个很有意思的问题（虽然我没法通过对话来影响孩子他妈，但我可以写篇文章来论述一下这个复杂的事情）。这里就得说一下他妈妈的这个教育方法，这个方法有一个很深的核心思想，牵扯到了文化，哲学，心理学等等方面。我们简单点说，就是：人可以被故意设定的奖励所驱动。要说明这个核心思想，我们先来看看这个思想是如何在历史中产生的。

那个著名的心理学实验：巴普洛夫的狗。这个实验是每次给狗送食物以前打开红灯、响起铃声。这样经过一段时间以后，铃声一响或红灯一亮，狗就开始分泌唾液，很明显狗让自己使铃声与食物之间产生了一个关联。这就是巴普洛夫发现的著名的条件反射现象。
这个实验后来启发了美国心理学家华生，把这个条件反射现象纳入了他的心理学著作中创造了行为心理学理论。这样，条件反射就不再仅限于动物，而扩展到了人的身上。
而后，华生的后继者，美国心理学家斯金纳又创造了新行为心理学，他的强化学习理论（斯金纳箱），把条件反射更加细化为奖励式的学习加强与惩罚式的行为减弱，这样就给整个理论提供了可以实践的方法。再加上他著名的行为心理学乌托邦小说：《瓦尔登第二》，彻底让这门理论被大众熟知。

这门行为心理学让人们意识到很多时候，我们是可以训练动物的行为。推而广之，人也是动物。我们也是可以训练人的行为。虽然很久以前，人们就掌握了训练动物的一些方法，但行为心理学理论给人们带来了一个更广泛的理论基础。这仿佛像是给了人们一把锤子，现在所有人都开始拿着这个锤子去解决问题。其中一个：就是通过某种奖励，从而影响人的行为。孩子他妈的教育方法：奖励式教育的出处应该就是在此。

在当时，还有一种理论就是：白板说。认为人生来就是一张白板，至于未来人能长成什么样子，完全看后天如何在这个白板上表达。那如果认为孩子本身是一块白板，那么孩子能学习到的知识完全取决于后天教育。白板说加上行为心理学，就构成了我们现代教育的一套巨大的理论基础。上面说到的心理学家华生就曾经说过：给我一群健全的孩子，让他们在我设定的环境中成长，我可以把他们训练成任一类的专家。

然而到了 21 世纪，随着人们对自我的认识更加透彻，行为心理学渐渐走下了巅峰。虽然，行为心理学的时代已经过去了，但行为心理学的很多理论或者方法却遗留了下来。我们现在经常使用的通过奖励的方式来教育孩子就是其中之一。特别对于中国家长来说，似乎不做点什么，就不能叫做教育。而这样的奖励式教育模式，既简单，又看起来好像有用。

在巴普洛夫的狗的实验中，是让狗把响铃与食物马上到来联系起来。而在上面的孩子的教育中，孩子他妈是想把练好琴与可以出去玩联系起来。

那么人到底是否可以通过奖励而被驱动呢？只能说在一定程度上是可以的。通过条件反射，你确实可以把一些毫不相干的事情联系起来，从而达到你训练的目的。但这对于人这个生物而言，如果你训练的是一件复杂的事情，例如学会某项技能，那对人而言可能是痛苦的、意义不清的、混乱的。

你不能通过奖励来让孩子掌握某项技能。你只能通过奖励来让孩子开始某项练习。
奖励与孩子技能的提高没有因果关系。你不能通过加大奖励而让孩子在某项技能上变得更好。

我们具体分析一下：如果你在练琴，你能感受到随着练的越来越好而产生的一种正向心理回馈，一个不擅长的事情，后来慢慢熟悉擅长了，心理会变得愉悦，这就是一种原始的正向回馈。正是这种原始的正向回馈让人变得可以自我驱动，去慢慢的挑战更难的部分。练琴的正常正向回馈就是练的越来越好，而不是外部的奖励。我们可以把这个学习的过程想象成：推动一个巨大的轮胎。在一开始，推动这个轮胎无疑是困难的。只有突破了路面的摩擦阻力的阈值，轮胎才开始滚动起来。刚能推动的时候，轮胎的移动肯定是缓慢的。再往后，让轮胎继续运动不是一个难事，轮胎会在你持续施加力的情况下继续运动，甚至你不施加力的时候，轮胎也可以自己滚动。如果你能再提高你的力，那么轮胎的速度就会提高。当然，速度提高到了一定程度，你会发现再提高会变得非常困难，你要克服的不仅有地面的阻力，还有空气的阻力，还有你自身所面临的各种困难，这就是推动这个轮胎的极限。有的人先天条件好，可能会比别人提高到一个不一样的水平。但这些都是原始激励导致的。所有这一切原始的内在的激励方法，才是你能达到某些技能巅峰的唯一途径。

而在 20 世纪的行为心理学中，认为人是可以通过外因诱导，来达到一个很高的境地的，这完全没有道理。因为，人们要在大脑中对你的外因与事情本身产生联系，本身就需要一个学习的过程。这好比，原先这个事情是有它原始的第一推动力的，你非要再加一个推动力上去，搞不好这个外加的推动力有时甚至是要起反作用的。所以，这样的方法不是一个好方法。你可以拿这个奖励型的推动力，当做开始启动时痛苦的补偿，但你不能拿这个奖励推动力做为第一推动力，这太容易让生物的大脑混淆了。例如，你不给巴普洛夫的狗食物，但你一样亮起红灯，狗是很迷惑的。食物没有了，为什么红灯还亮？谁错了？狗想：我错了吗？明明是红灯亮了啊，我的口水都出来了。那人也一样。我明明把这一段弹好了，为什么奖励没有来？明明我自己知道，我已经进步了，为什么奖励没有来？（旁边他妈可能不会很快观察到孩子的进步，很多进步只有孩子自己最清楚，孩子自己的系统已经自我奖励他了）

还有，甚至很多人以为，提供一个更大的奖励就可以让孩子更加努力。抱歉，我们系统似乎没有这样的识别功能。奖励就是奖励，没有大与小之说。提供 1000 块的奖励，并不能比提供 10 块的奖励更能激励孩子。孩子钢琴考过 5 级，就给他 100 块奖励，并不代表给他 1000 块奖励，他就可以考过钢琴 10 级。任何学习的原始奖励是你对这个事情的更加擅长所带来的身心愉快感，而不是外加的奖励。

最后，问一下自己：你对于孩子的奖励，能否及时？能否依据他的提高程度给予不同等级的奖励？能否显著设置奖励的上限？能否让这个奖励及时作用于孩子，让他产生愉悦感？这些条件能否都及时满足呢？而这些就是孩子原始奖励的工作方式。如果不能满足，就会导致孩子内在系统的困惑，对这个奖励会产生怀疑。这个奖励所作为第二推动力的作用就会极大的降低。如果操作不好，是不是还会产生反作用力？例如该奖励的时候，没有奖励，是否会对孩子产生惩罚作用？从而让孩子对提高这个能力产生了负向的反馈，这样孩子如果在大脑中又训练出来提高能力会导致负向反馈的环路时，孩子还会去学习吗？

总之，整个行为心理学理论带来的额外奖励系统必须是个非常复杂、精密的系统才能有效的激励孩子。而一旦操作不好，就都会对孩子产生负面作用。而孩子本身就有一套自身的正向反馈系统。我们这个多余的额外奖励机制是不是没有什么作用！起码现在是的。要想起作用，其实应该比你理解的方法要复杂的多。在我观察来看，这似乎完全是一套多余的教育方法。除了在孩子刚开始学习的时候，对孩子坚持的行为（即使没有技能方面的正向反馈回来）来提供一点正向激励，让孩子能继续坚持，这是有益的。后面，孩子对于这个技能的提高，完全取决于他自身的天赋，以及教育（在这个学习的具体方法上进行教育）、环境（提供一个利于学习的环境，不让不好的环境带给孩子负面的影响）的帮助。与你奖励基本没有关系。你不会看到一个人弹琴弹的不好时，给予奖励就可以弹的好了。弹好琴的方法只有大量时间的勤于练习，还有一定的天赋。

所以，在孩子的成长中，无时无刻的设置各种奖励不是一种好的教育行为。孩子自身有支撑他学习与成长的因素。

延伸一下：与奖励相对的惩罚也是规范行为一种行之有效的方法。我们现在能看到的是：在孩子开始学习阶段，明显是最困难的时候。如果孩子无法坚持完成一定量的练习，就通过惩罚的方式（例如直接的训斥、体罚），让孩子能有所坚持。这也能帮助孩子。但惩罚的目标不是让他产生条件反射，而是帮助他让他度过启动期的困难。

上面讨论了奖励式教育，那我们再来探究一下产生这样教育行为背后的原因。人们总是喜欢把知道的理论使用起来简单化。就像我上面说的那样，你有了一把锤子，你看什么都是钉子。

当然，这样的行为本身其实是符合人类大脑的特性的。就是不愿意去思考复杂的事情，如果需要思考复杂的事情，就会尽量的把复杂的事情映射到一个简单的模型中去思考，从而快速得出结论。复杂的事情是没有办法快速得出结论的。现实中的很多事情都是复杂的事情，是无法快速得出结论的，然而我们又需要去思考这些事情，并要给出一个答案，那么大脑能做的就是把复杂的事情简单化、近似化，从而可以让大脑在短时间内对这个复杂的事情得出一个答案。当然，从这里就可以看出，这样的答案往往都是不正确的。

孩子的教育就是一个复杂的事情，你需要考虑多方面的问题。关于孩子的教育，已经争论了上千年的时间，到现在还是没有什么明确的、统一的教育方法。随着我们对人类自我认识的越来越完备，教育的方法也在不断的改进中。所以，这不是一个家长的大脑就可以思考出来的，就能知道当前应该做什么是对孩子最有帮助的。家长往往都是依靠文化与自己所知的某些理论，去做一些近似的思考，从而得出一个完全不正确的答案。这种复杂问题的正确解法首先不是一个单一的方案，例如：每天学习 3 个小时就好。或者必须要上大学、或者多读书等等。对于家长来说，能得出的答案往往都是一些单一答案。面对很多情况时，家长的选择是不再思考，就一个单一的方案去解决所有的问题（这样的行为模式符合人类大脑）。而这种复杂问题的正确解法是：根据不同情况，制定不同的解决方案。这样的解法，人脑是完全无法胜任的。输入参数极多。那问题是，怎么办？我也不清楚。也许可能的一种解法是：先排除掉肯定不好的方案就好。

下面我们来说一下公司管理中的奖励式管理。

对于很多的管理者来说，都希望管理能简单化，被管理的对象能简单化。KPI 考核制度正是这样一种简单明了的管理方法。它量化了工作的结果，让管理行为变得有数据依靠。在 KPI 考核制度中，有一个极为重要的方法，就是奖励式管理。对于利于公司的某些结果，一定要给予相应员工以奖励。这个方法的目的自然是想对公司好的结果施加一个正向回馈，从而让更多好的结果能够发生。从这里也可以看出，KPI 考核制度的设计，本身就受了行为心理学的启发。

KPI 从美国引入中国不过 20 年左右的时间，整个制度在国内生根发芽，也有所改变。我们看一下具体的情况：

1.我观察到的在销售型公司进行的 KPI 考核制度，这个制度一般是这样制定的：如果你不能完成之前定好的销售额任务，那只能发你 70%的工资，如果你能完成，就发你 100%的工资，如果你超额完成就会按照超额完成的值进行一定比例的奖励，一般不会超过工资值的 2 倍。

在老板这里，实行这个制度的初衷是：通过奖励的方式，激发员工的动力，让员工创造更多的销售额。

但实际在公司里，员工一旦开始工作就会发现，自己销售额的多少与自己的努力程度明显是不成正比的（实际上，这个销售额的多少更多依赖的是整体的市场环境，产品品牌的营销，产品能否触达到更多的用户），当这些先天条件都确定了以后，员工的一对一的销售能力才能有所体现。然而员工的销售天赋也不是人人都有的，需要后天培养。

所以，原本是想通过激励方式让员工给公司创造更多销售额，最后却变成了变相消减员工工资，减少公司的支出成本。一个想开源的计划，变成了节流计划。员工并不是无法感受到这样的变化，年轻员工一开始进入公司的时候，都是对于所谓高额销售的奖励抱有极大的期待。但到了一定时间，发现这个不可实现后，就变成了如何应对惩罚措施。从公司与员工两者的利益一致，变成了公司与员工之间的互相博弈。

这样的结果，公司获利了吗？应该没有。公司制定的 KPI 的目的不是消减公司的支出，而是要扩大收入。面对这样的一线销售岗位，消减支出可能会导致公司降低收入。

其实，在公司的销售岗位，总有销售的非常好的员工，你能认为他是因为被奖励才做的那么好的吗？不是。只是因为他天生擅长。在一群人里面，总有一定的几率有人是擅长销售的。例如，他的相貌，他的语言，他的说话习惯，他的知识储备，他的人脉关系都可能都利于他把某种商品销售出去。擅长的人不给予他额外的奖励，他也可以把事情做的很好。而对于大部分其他人来说，大家能做到的就是这个销售岗位的平均值。

所以，这里 KPI 里面的奖励式管理方法就没有起到任何作用。然而，国内老板还是愿意实行这个方法的一个重要原因是：在面对市场的不确定时，它可以帮助老板变相降低成本。KPI 奖励式的管理，变成了一个 KPI 惩罚式的管理。在一个人员快速流动的销售公司里，为了把擅长销售的人筛选出来，这是一个可以降低成本的方法。至于为什么要让人员快速流动，那也是为了降低培养成本，用大量的新进员工去筛选、去寻找合适的销售人才。但我相信，对于这个方法，具体的经济账是没有公司算过的。大量招聘，再大量淘汰，这会产生大量的招聘费用和其他潜在的对公司不利的影响。然而，国内的老板还是愿意实行这个模式，应该是出于对损失的恐惧吧。

关于销售，有一本叫做《华尔街之狼》的书，书的作者是乔丹贝尔福特（ 20 世纪的顶级销售天才，电影：华尔街之狼的原型。他本人就是依靠销售起家）。这本书就专门讲了如何让公司提高销售的问题。书里，他专门说了，销售的过程应该像是一个事先编写好的剧本。你把所有用户可以想到的对话都事先编写到这个脚本里，然后让自己的销售员工熟练掌握这个剧本，这样才能保障销售的顺利。这里没有什么奖励式的管理方法，而是通过销售的具体方法上入手，来提高员工的销售能力。他还说了销售的三个关键点是：

产品、想法、概念（消费者需要的）
消费者对你的信任以及与你产生共鸣
消费者对你背后公司的信任这三个关键点都有 1-10 分，每个关键点都可以打一个分。当从这三个关键点里，取得一个平均的好成绩时，就有可能把产品销售出去。从上面看出，第一点是要有一个产品，而某些用户对这个产品有需求。第二点要求的是个人销售能力。让用户对你产生信任，去销售这个产品。第三点要求的是公司能让消费者信任。让公司的品牌来为这个产品做信用背书，去销售这个产品。这些才是公司提高销售的关键。

2.另一个类型的奖励式 KPI：在工厂中，对于计件式的工作，采用 KPI 考核制度。工资的多少完全与你完成的工件数量挂钩。那这里，把 KPI 拿掉是否合适？不合适。虽然，通过上面的阐述，我们清楚了，工人能否做好这个工作，不取决于奖励。做的好的工人，只是他的自身条件可能很适于这个工作，从而可以完成比其他人数量更多的工件。但这里如果你拿掉 KPI 奖励，对于做的好的工人而言，做的越多，没有更多的奖励，他也不会发挥出自己的 100%的能力去完成工作。甚至，如果他了解了大家的工资基本相同，那在工厂环境中，他很轻松的就可以了解其他人的工作能力，那没有奖励可能会对他产生一种惩罚感。在相互的比较中，做的越多，没有拿的越多，会对做的多这种行为产生惩罚效应，从而抑制工作的积极性。在实践中，对于计件类的工作，做的越多，拿的越多，这样的模式对于老板而言是简单合理的，与其自身利益是一致的，没有理由去更改。所以，在这样的实例中，KPI 考核制度对于公司的管理是非常有用的、合理的。

3.网飞的管理模式。没有奖励式的 KPI，工资直接拉满到业界最高，招收最优秀的人。有一本书叫做：《不拘一格》，作者是网飞的 CEO，里德哈斯廷斯，就是讲的网飞的管理模式。这个模式对国内老板来说挺冲击的。毕竟，这个模式把老板的风险放大了。但这个模式经过网飞的运行，应该还是有一定说服力的。首先网飞认定了，高素质人才是公司成功的关键。所以，整个管理模式都是围绕着吸引高素质人才，创造更有利于这些人才的工作环境而打造。那奖励式管理对这些高素质人才有正面作用吗？书中说了，依照绩效制定的薪酬对日常工作有一定激励作用，但实际上也影响了创造力的发挥。美国杜克大学的道格·阿里尔教授做过一个实验，实验的结果是：我们发现，如果任务只依靠机械技能，那么奖金发挥的作用跟我们预想的是一样的：奖金越高，表现越好。但任务一旦需要某项认知技能，结果就跟我们在印度的研究结果是一样的：奖金越高，表现越差。也就是说，对于复杂的、创造性的工作，奖励式的管理模式会导致员工的表现变差。对于创造性的工作，需要的更多是自我激励模式，而不是外在的奖励模式。从这里我们可以看出，当你需要员工的自我创造力时，你需要给员工提供的是最佳的保障，而不是所谓的外部奖励。所以，网飞选择了高工资模式，这个模式有一个好处，就是对于员工而言，只要保持自己对公司工作的专注，专注于提升自我，就可以了。而且，由于业内没有其他公司采用这个模式，这也意味着失去网飞的工作，就要回到那种不确定性的奖励式的生活中。对人而言有一个心理现象，就是非常害怕不确定性，所以，这个惩罚模式也是对员工最大的威慑。

最后：

就像奖励不能让孩子学习更好一样，奖励也无法让销售额提升。奖励的最大作用是让人开始这个行为。在没有内在动机的时候，给人一个外加的动机。或者是当你成功以后，为了给其他人一个外在动机，给你一个奖励，来去刺激其他人，让其他人产生外在动机。正确认识奖励的作用，有助于我们对未来做出正确的判断。

主要参考书籍：

1.斯蒂芬·平克《白板》 2.马特·里德利《先天后天》 3.丹尼尔·卡尼曼《思考的快与慢》 4.乔丹·贝尔福特《华尔街之狼》 5.里德·哈斯廷斯《不拘一格》

微信原文链接： https://mp.weixin.qq.com/s/AyZTU_AdC0tE1x0z_WxLIw

孩子的奖励式教育 与 公司的奖励式管理

孩子的奖励式教育与公司的奖励式管理