有些事明显对自己有益,为什么却无法去做?

首先说结论,人为什么会拒绝对自己有益的行为呢?因为这些行为往往需要我们持续的投入时间和经历,而在这个过程中:

第一,我们对这件事情的意义的理解随着时间出现了偏差,换言之,我们的偏好改变了,我们之前认为有益的行动,我们自己不愿意去做了。

第二,我们没有足够的意志力控制自己实现之前设定的目标。熬夜复习是很累的,而人在疲劳的时候偏好当然和有精神的时候不一样,但有足够的意志力可以帮助我们克服这个困难。

首先上一个decision tree,图来自Hammond (1988),"期望效用的结果主义基础"(这个图首先见于Hammond (1976),不过那篇文章里面图太难看……):

这张图作者把它称作"potential addict",不过正好可以拿来说明我们的剁手问题。这里的空心节点叫做"决策节点",每个节点对应着一个决策,实心节点叫做"结果节点"。可以看到,这个tree里面有两个决策节点,和三个结果节点。这里,每个节点代表的含义如下:

:周一的陈茁,向左走表示先玩一局,向右走表示直接卸载扫雷; :周六的陈茁,向左走表示继续玩下去,向右走表示不玩了; :由于没玩到新版扫雷复习过程心不在焉以致于考试只考60分; :玩到了扫雷心满意足复习火力全开考100分; :过度沉迷扫雷导致错过考试。

从这些结果来看,是最好的结果,也就是"对自己最有益的事情",但是不幸的是,陈茁最后一步一步地走到了这个最差的结果。

为什么呢?因为他要实现这个最好的结果,需要做两次选择:一次是"要不要开始玩",一次是"要不要停止玩"。而且,为了实现这个结果,决策者必然要先放弃掉这个不是最好也不是最差的选择,把自己置于一个"best or never"的选择题当中。

在周一,决策者对这个游戏还没有"上瘾",他对考试结果还是在意的,否则也不会选择放弃掉。也就是说,如果不是他无比相信自己一定能在周六选择,就不会提前放弃。但是到了周六,面对已经上瘾了这个结局,他的偏好改变了,而且这种改变是没有被预料到的,他只能选择接着玩儿下去直到错过考试。

行为经济学有一篇很经典的文章:

里面的Projection Bias,说的就是人们有低估自己偏好改变的倾向。决策理论家将这类决策者叫做"naive decision maker",他们的特点是喜欢制定一些自己完不成的计划,马三立先生的《明天开始》说的就是这类人。这种谬误也被称作"planning fallacy",笔者就是一个深度患者。

有人会问,是不是偏好的改变被预见到了就完事大吉了呢?不是。在上面的potential addict中,如果决策者预见到了自己一旦开始玩就根本停不下来,也就是说,他知道一旦放弃,他将在未来选择。应用backward induction的思想,他会直接选择卸载扫雷,而这个结果也不是最优的。这样的决策者被称作sophisticated decision maker

行为经济学的另一篇经典文献讨论了两类"非理性"的决策者的福利问题,

他们研究了两类子情境,一类是"现在痛苦将来幸福",另一类是"现在幸福将来痛苦",作者证明,对于每一类决策者,分别有一个情境使他们的福利更低。

如果陈茁可以在决策节点处,直接从选择,那么这种事情不会出现。因为我们已经假设了。可能很多读者已经反应过来了,这其实就是博弈论嘛,而且是简单的完全信息静态博弈,解是子博弈完美纳什均衡。事实上,这个结论早在1973年就被证明了:利用泽莫罗公理,任何有限博弈树存在SPNE,所以,Sophisticated decision maker一定有均衡策略。Potential addict 与一个博弈的区别在于,这是现在的自己和未来的自己之间的博弈,是一个自我控制问题,然而因为在两个决策节点上偏好不同,我们无法把"他们"看作同一个人。Hammond (1988):

Rather,the potential addict is really two (potential) persons,before and after addiction,and the decision problem has to be analysed as a "game" between two "rational players".

陈茁首先向左走,先玩儿了一局,然后成功上瘾,错过考试,走到人生低谷。而爸妈口中的"别人家的孩子"们,那些不会犯错的神(jian)人们,究竟怎么做呢?第一步,他们从容不迫地选择向左走,大胆地玩儿了一局,然后意识到需要学习了,他们就不玩儿了

换言之,他们从一开始就有一个走到的计划,并且在后续过程中靠着完美的执行力从容地执行了这项计划。这些人代表了所谓的完美意志,无论偏好怎么改变都有严格的纪律性来实现之前订立的目标。

就此,Hammond 提出了"结果主义"的概念。结果主义,顾名思义,就是所有行为都对着一个结果去的。在博弈论里面,为什么normal form game不能分析动态博弈呢?因为无法剔除empty threat,妈妈对孩子说,你敢调皮我就打你,孩子预见到了妈妈其实舍不得打他,于是还是调皮。在normal form game中,威胁打小孩儿就不调皮是一个纳什均衡,但是在extensive game中就不是一个SPNE。

那么,在我们的例子里面,empty threat对应着什么呢?很明显,"剁手"就是对自己的,或者说现在的自己对未来的自己的空威胁。如果这个一人博弈树通过backward induction找到的均衡行为,与简单的静态选择一致,那么行为就是结果主义的。

显然,potential addict不满足结果主义,为什么呢,看这个decision tree,

和上面那个相比,这里多了一个,假设,和表示同样的结果,小玩儿辄止,不同之处在于给予了决策者事先规范自己行为的方式(比如把剁手的权力交给一个跟你有仇的人,再比如给信用卡设置一个上限等等)。我们可以看到,在这个tree当中,决策者会毫不犹豫地选择,既不是naive情况下的,也不是sophisticated情况下的。但是,上面两个decision tree,如果我们把它们拍扁成normal form game,它们是完全一样的。

对于别人家的孩子来说,结果主义一定是满足的,他们不受情绪的影响,不为诱惑所动,持续投入,最后做成了我们看来有益的事情。而对于我们一般人,上面的例子告诉我们,我们必须通过缩小自己未来的选择集来控制自己。Gul & Pesendorfer 2001年发表在Econometrica上的文章中举例说,人在早上励志要减肥,并且预见到了自己中午饿了的时候会狂吃,那么早上订餐的时候,就不要给自己留下吃肉的自由。所以,戒烟的人把打火机交给值得信任的朋友,存钱的人把信用卡交给值得信任的朋友,减肥的人把钱包交给值得信任的朋友,才是现实的。这种倾向,在决策理论中叫做preference for commitment。

扯远了,就酱。

-——————————————————————————————————————————————-

11.4 更新:

看评论大家好像有点儿云里雾里的,值此双十一即将到来之际,我突然找到了一个更好的例子,再跟诸位解释一下。

假如您是一个没有支付宝的人,面对即将到来的双十一,您要考虑的是,我要注册一个支付宝账号吗?这时候您在,往左走是注册,往右走是不注册。注册或不注册都有显而易见的坏处,不注册的话支付不方便(),注册的话容易管不住自己()。所以,如果您能保证有了支付宝之后还能管住自己不乱买东西乱花钱,那肯定是最好的()。但是如果您发现自己一旦有了支付宝就根本停不下来(您是sophisticated decision maker),那您最好是一开始就不要注册(选)。

这么简单的道理被我说成这么复杂……切腹去了。


另一人回答

作者:匿名用户 链接:https://www.zhihu.com/question/36529596/answer/69795873 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

这有很多种解释,其中我觉得最符合直觉也最浅显的一种,就是人在事前事后激励不一致。(这和陈茁所说的empty threat本质上算是一样的,但有所不同)我们设想一个这样的场景:你现在有一个小时的时间,你可以选择用来玩游戏,获得的快乐是10;你也可以选择用来学习,你将在下个月的考试中获得快乐20。我们需要注意的是,人对于快乐的感知是随时间有所变化的,因此我们会对一个月以后的快乐没有那么看重。假定一个月会使得人对快乐的感知衰减到40%,那么:在现在。玩游戏获得快乐10;学习获得快乐2040%=8(因为这个快乐距离此时此刻有1个月的时间)因此你会玩游戏;一个月后。此刻你回头看,你重新评估一下玩游戏和学习的快乐:玩游戏获得快乐1040%=4(因为这个快乐距离此时此刻已有1个月的时间)学习获得快乐20然后你跳起来了说:去你妈逼当初我为什么要玩游戏!(以上假设相当简单,只想说明一下直观,不要对数值较真)回到题主的问题。有些事明显对自己有益,为什么却无法去做?因为觉得有益,实际上是从长期来看的,是站在后一个时点看的。为什么普遍觉得看成人片不如学习专业知识有益?借用采铜老师的说法,其实就是专业知识的半衰期更长,能在更远的时刻还能对我们的快乐有所贡献。我们完全能够预期到,在那个时点上这一行为带了的快乐,因此我们渴望这一刻实施这一行为。但我们的优化决策,是站在现在这个时刻上做出的。在这一刻,我们虽然能够预期到未来时刻会认为这一行为很重要,但这一刻它的折现值甚小,因此我们会做出令自己在之后那个新的时点后悔的选择。而当我们站在一个新的时点重新审视过去的抉择时,会觉得过去那么好的事情为什么不做,觉得过去为什么那么不理性,其实问题的关键是:我们的优化函数根本就不一样了。我通常把这称为人的"金鱼思维",也就是我们对事情的评判随着距离此刻时间的远近而有所亲疏。这中思维使得我们往往在事后有强烈的后悔情绪,原因其实在于,已经实现的快乐/成就,对我们之后的快乐贡献甚小(只能留作回忆和谈资),因此我们会希冀将之前消耗的资源用于满足之后的快乐。但其实这种情绪,与其说是后悔,不如说是贪心。我们实际上是在快感这样无形的资源已经被享用之后,才觉得"要是用来……该多好",本质上不过是渴望在下一期还能取得快感,说到底,无非是决策这一刻获得更多的快感。就是吃掉了过冬的储备粮,到了冬天开始悔恨"要是当初没吃储备粮"就好了。但之所以会这样想,是因为夏天吃储备粮的快乐,已经享用过了。要让交出夏天储备粮的快乐,估计仍然是百般不愿。如果让交出那份先前的快感(如果真的有这么一种机制的话),用一种魔法让人们可以重新选择,相信我,绝大部分人最多会在魔法开始的几天觉醒不已(因为之前的恶果历历在目),隔了些日子,仍然会该玩耍玩耍,该带娃带娃。不信?你就想想啊,我们又不是头一次想做未做,都想做未做了千百万次了。