有些事明显对自己有益，为什么却无法去做？

首先说结论，人为什么会拒绝对自己有益的行为呢？因为这些行为往往需要我们持续的投入时间和经历，而在这个过程中：

第一，我们对这件事情的意义的理解随着时间出现了偏差，换言之，我们的偏好改变了，我们之前认为有益的行动，我们自己不愿意去做了。

第二，我们没有足够的意志力控制自己实现之前设定的目标。熬夜复习是很累的，而人在疲劳的时候偏好当然和有精神的时候不一样，但有足够的意志力可以帮助我们克服这个困难。

首先上一个decision tree，图来自Hammond (1988)，"期望效用的结果主义基础"（这个图首先见于Hammond (1976)，不过那篇文章里面图太难看……）：

这张图作者把它称作"potential addict"，不过正好可以拿来说明我们的剁手问题。这里的空心节点叫做"决策节点"，每个节点对应着一个决策，实心节点叫做"结果节点"。可以看到，这个tree里面有两个决策节点，和三个结果节点。这里，每个节点代表的含义如下：

：周一的陈茁，向左走表示先玩一局，向右走表示直接卸载扫雷；：周六的陈茁，向左走表示继续玩下去，向右走表示不玩了；：由于没玩到新版扫雷复习过程心不在焉以致于考试只考60分；：玩到了扫雷心满意足复习火力全开考100分；：过度沉迷扫雷导致错过考试。

从这些结果来看，是最好的结果，也就是"对自己最有益的事情"，但是不幸的是，陈茁最后一步一步地走到了这个最差的结果。

为什么呢？因为他要实现这个最好的结果，需要做两次选择：一次是"要不要开始玩"，一次是"要不要停止玩"。而且，为了实现这个结果，决策者必然要先放弃掉这个不是最好也不是最差的选择，把自己置于一个"best or never"的选择题当中。

在周一，决策者对这个游戏还没有"上瘾"，他对考试结果还是在意的，否则也不会选择放弃掉。也就是说，如果不是他无比相信自己一定能在周六选择，就不会提前放弃。但是到了周六，面对已经上瘾了这个结局，他的偏好改变了，而且这种改变是没有被预料到的，他只能选择接着玩儿下去直到错过考试。

行为经济学有一篇很经典的文章：

里面的Projection Bias，说的就是人们有低估自己偏好改变的倾向。决策理论家将这类决策者叫做"naive decision maker"，他们的特点是喜欢制定一些自己完不成的计划，马三立先生的《明天开始》说的就是这类人。这种谬误也被称作"planning fallacy"，笔者就是一个深度患者。

有人会问，是不是偏好的改变被预见到了就完事大吉了呢？不是。在上面的potential addict中，如果决策者预见到了自己一旦开始玩就根本停不下来，也就是说，他知道一旦放弃，他将在未来选择。应用backward induction的思想，他会直接选择卸载扫雷，而这个结果也不是最优的。这样的决策者被称作sophisticated decision maker。

行为经济学的另一篇经典文献讨论了两类"非理性"的决策者的福利问题，

他们研究了两类子情境，一类是"现在痛苦将来幸福"，另一类是"现在幸福将来痛苦"，作者证明，对于每一类决策者，分别有一个情境使他们的福利更低。

如果陈茁可以在决策节点处，直接从选择，那么这种事情不会出现。因为我们已经假设了。可能很多读者已经反应过来了，这其实就是博弈论嘛，而且是简单的完全信息静态博弈，解是子博弈完美纳什均衡。事实上，这个结论早在1973年就被证明了：利用泽莫罗公理，任何有限博弈树存在SPNE，所以，Sophisticated decision maker一定有均衡策略。Potential addict 与一个博弈的区别在于，这是现在的自己和未来的自己之间的博弈，是一个自我控制问题，然而因为在两个决策节点上偏好不同，我们无法把"他们"看作同一个人。Hammond (1988)：

Rather,the potential addict is really two (potential) persons,before and after addiction,and the decision problem has to be analysed as a "game" between two "rational players".

陈茁首先向左走，先玩儿了一局，然后成功上瘾，错过考试，走到人生低谷。而爸妈口中的"别人家的孩子"们，那些不会犯错的神（jian）人们，究竟怎么做呢？第一步，他们从容不迫地选择向左走，大胆地玩儿了一局，然后意识到需要学习了，他们就不玩儿了。

换言之，他们从一开始就有一个走到的计划，并且在后续过程中靠着完美的执行力从容地执行了这项计划。这些人代表了所谓的完美意志，无论偏好怎么改变都有严格的纪律性来实现之前订立的目标。

就此，Hammond 提出了"结果主义"的概念。结果主义，顾名思义，就是所有行为都对着一个结果去的。在博弈论里面，为什么normal form game不能分析动态博弈呢？因为无法剔除empty threat，妈妈对孩子说，你敢调皮我就打你，孩子预见到了妈妈其实舍不得打他，于是还是调皮。在normal form game中，威胁打小孩儿就不调皮是一个纳什均衡，但是在extensive game中就不是一个SPNE。

那么，在我们的例子里面，empty threat对应着什么呢？很明显，"剁手"就是对自己的，或者说现在的自己对未来的自己的空威胁。如果这个一人博弈树通过backward induction找到的均衡行为，与简单的静态选择一致，那么行为就是结果主义的。

显然，potential addict不满足结果主义，为什么呢，看这个decision tree，

和上面那个相比，这里多了一个，假设，和表示同样的结果，小玩儿辄止，不同之处在于给予了决策者事先规范自己行为的方式（比如把剁手的权力交给一个跟你有仇的人，再比如给信用卡设置一个上限等等）。我们可以看到，在这个tree当中，决策者会毫不犹豫地选择，既不是naive情况下的，也不是sophisticated情况下的。但是，上面两个decision tree，如果我们把它们拍扁成normal form game，它们是完全一样的。

对于别人家的孩子来说，结果主义一定是满足的，他们不受情绪的影响，不为诱惑所动，持续投入，最后做成了我们看来有益的事情。而对于我们一般人，上面的例子告诉我们，我们必须通过缩小自己未来的选择集来控制自己。Gul & Pesendorfer 2001年发表在Econometrica上的文章中举例说，人在早上励志要减肥，并且预见到了自己中午饿了的时候会狂吃，那么早上订餐的时候，就不要给自己留下吃肉的自由。所以，戒烟的人把打火机交给值得信任的朋友，存钱的人把信用卡交给值得信任的朋友，减肥的人把钱包交给值得信任的朋友，才是现实的。这种倾向，在决策理论中叫做preference for commitment。

扯远了，就酱。

-——————————————————————————————————————————————-

11.4 更新：

看评论大家好像有点儿云里雾里的，值此双十一即将到来之际，我突然找到了一个更好的例子，再跟诸位解释一下。

假如您是一个没有支付宝的人，面对即将到来的双十一，您要考虑的是，我要注册一个支付宝账号吗？这时候您在，往左走是注册，往右走是不注册。注册或不注册都有显而易见的坏处，不注册的话支付不方便()，注册的话容易管不住自己()。所以，如果您能保证有了支付宝之后还能管住自己不乱买东西乱花钱，那肯定是最好的()。但是如果您发现自己一旦有了支付宝就根本停不下来(您是sophisticated decision maker)，那您最好是一开始就不要注册(选)。

这么简单的道理被我说成这么复杂……切腹去了。

另一人回答

作者：匿名用户链接：https://www.zhihu.com/question/36529596/answer/69795873 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

这有很多种解释，其中我觉得最符合直觉也最浅显的一种，就是人在事前事后激励不一致。（这和陈茁所说的empty threat本质上算是一样的，但有所不同）我们设想一个这样的场景：你现在有一个小时的时间，你可以选择用来玩游戏，获得的快乐是10；你也可以选择用来学习，你将在下个月的考试中获得快乐20。我们需要注意的是，人对于快乐的感知是随时间有所变化的，因此我们会对一个月以后的快乐没有那么看重。假定一个月会使得人对快乐的感知衰减到40%，那么：在现在。玩游戏获得快乐10；学习获得快乐2040%=8（因为这个快乐距离此时此刻有1个月的时间）因此你会玩游戏；一个月后。此刻你回头看，你重新评估一下玩游戏和学习的快乐：玩游戏获得快乐1040%=4（因为这个快乐距离此时此刻已有1个月的时间）学习获得快乐20然后你跳起来了说：去你妈逼当初我为什么要玩游戏！（以上假设相当简单，只想说明一下直观，不要对数值较真）回到题主的问题。有些事明显对自己有益，为什么却无法去做？因为觉得有益，实际上是从长期来看的，是站在后一个时点看的。为什么普遍觉得看成人片不如学习专业知识有益？借用采铜老师的说法，其实就是专业知识的半衰期更长，能在更远的时刻还能对我们的快乐有所贡献。我们完全能够预期到，在那个时点上这一行为带了的快乐，因此我们渴望这一刻实施这一行为。但我们的优化决策，是站在现在这个时刻上做出的。在这一刻，我们虽然能够预期到未来时刻会认为这一行为很重要，但这一刻它的折现值甚小，因此我们会做出令自己在之后那个新的时点后悔的选择。而当我们站在一个新的时点重新审视过去的抉择时，会觉得过去那么好的事情为什么不做，觉得过去为什么那么不理性，其实问题的关键是：我们的优化函数根本就不一样了。我通常把这称为人的"金鱼思维"，也就是我们对事情的评判随着距离此刻时间的远近而有所亲疏。这中思维使得我们往往在事后有强烈的后悔情绪，原因其实在于，已经实现的快乐/成就，对我们之后的快乐贡献甚小（只能留作回忆和谈资），因此我们会希冀将之前消耗的资源用于满足之后的快乐。但其实这种情绪，与其说是后悔，不如说是贪心。我们实际上是在快感这样无形的资源已经被享用之后，才觉得"要是用来……该多好"，本质上不过是渴望在下一期还能取得快感，说到底，无非是决策这一刻获得更多的快感。就是吃掉了过冬的储备粮，到了冬天开始悔恨"要是当初没吃储备粮"就好了。但之所以会这样想，是因为夏天吃储备粮的快乐，已经享用过了。要让交出夏天储备粮的快乐，估计仍然是百般不愿。如果让交出那份先前的快感（如果真的有这么一种机制的话），用一种魔法让人们可以重新选择，相信我，绝大部分人最多会在魔法开始的几天觉醒不已（因为之前的恶果历历在目），隔了些日子，仍然会该玩耍玩耍，该带娃带娃。不信？你就想想啊，我们又不是头一次想做未做，都想做未做了千百万次了。