策略思维

主要内容

这本书的每个章节都讲述了以下内容:

  • 第一章:10个策略故事。这一章用10个简短的故事来介绍博弈论的基本思想和应用,例如领先优势、囚徒困境、可信承诺等。
  • 第二章:准备接招。这一章介绍了如何用决策树和博弈树来分析策略互动,以及如何用倒后推理来确定最佳策略。
  • 第三章:看穿对手的策略。这一章介绍了如何用优势策略、劣势策略和均衡策略来预测对手的行动,以及如何利用对手的弱点。
  • 第四章:走出囚徒困境。这一章介绍了如何在重复博弈中建立合作,以及如何用惩罚机制来防止作弊。
  • 第五章:策略行动。这一章介绍了如何用威胁、许诺、警告和保证等策略行动来影响对手的选择,以及如何判断这些行动的可信度。
  • 第六章:可信的承诺。这一章介绍了如何通过改变自己的收益、限制自己的选择或者公开自己的信息等方式来建立可信的承诺,以及如何应对不可信的承诺。
  • 第七章:不可预测性。这一章介绍了如何在不确定性和信息不完全的情况下做出策略选择,以及如何用混合策略和随机化来增加不可预测性。
  • 第八章:边缘政策。这一章介绍了如何在高风险和高回报的情况下做出策略选择,以及如何在边缘政策中平衡威慑和逃避。
  • 第九章:合作与协调。这一章介绍了如何在多人博弈中实现合作与协调,以及如何解决集体行动问题和社会困境问题。

内容解析--博弈论的基本思想

  • 博弈论是研究理性行为主体在相互影响的情况下如何做出最优选择的科学
  • 博弈论假设参与博弈的人都是理性自私的,即他们明白自己的目的和偏好,同时了解自己行动的限制和约束,以精心策划的方式选择自己的最佳行为
  • 博弈论要求参与者设身处地,仔细分析自己若处于对方的境地,思路会有什么变化,哪怕完全不能同意他们的见解。
  • 博弈论对理性行为赋予了新的含义,即与其他同样具有理性的决策者进行相互作用。
  • 博弈论基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等
领先优势、囚徒困境、可信承诺
  • 领先优势是指在一场竞争中,处于领先地位的一方可以利用自己的优势来影响或制约对手的行动,从而增加自己的胜算。
  • 囚徒困境是指在一种两人博弈的情形中,每个人都有两种选择:合作或背叛。如果两人都合作,他们都能得到较好的结果;如果两人都背叛,他们都会受到较大的损失;如果一方合作而另一方背叛,合作者会遭受最大的损失,而背叛者会获得最大的利益。由于每个人都不知道对方的选择,而且都想追求自己的最大利益,所以他们往往会选择背叛,导致双方都陷入最坏的结果。
  • 可信承诺是指在一场博弈中,一方事先做出某种承诺或威胁,以影响对方的期望和行为。但是,这种承诺或威胁必须是可信的,也就是说,在博弈进行时,执行它是符合承诺者或威胁者自身利益的。否则,对方可能会不相信或不理会这种承诺或威胁。
决策树、博弈树
  • 决策树是一种图形化的方法,用来表示不同情况下的决策规则和结果。决策树的每个节点代表一个属性或条件,每个分支代表一个可能的选择或结果,每个叶子节点代表一个最终的决策或分类。决策树可以用来分析项目的风险、预测数据的分类、归纳学习算法等。12

  • 博弈树是一种特殊的决策树,用来表示博弈论中的策略互动。博弈树的每个节点代表一个博弈者的选择,每个分支代表一个可能的行动,每个叶子节点代表一个博弈的结果或收益。博弈树可以用来分析博弈者的最优策略、预测博弈的均衡、解决博弈中的冲突和合作等

如何用倒后推理来确定最佳策略

根据网页内容和搜索结果,倒后推理是一种博弈论的方法,它要求你从最终的目标或结果开始,逐步回溯到当前的选择或行动,以确定最佳的策略。

举个例子,假如你在玩一个回合制的射击游戏,有三个玩家A、B、C,每个玩家有一定的生命值和武器。每个回合,每个玩家可以选择攻击另一个玩家或者防御。如果一个玩家被攻击,他的生命值会减少,如果生命值为零,他就被淘汰。游戏的目标是成为最后一个存活的玩家。

假设你是玩家A,你有50%的生命值和一把手枪,玩家B有80%的生命值和一把狙击枪,玩家C有20%的生命值和一把机枪。你想知道你在这个回合应该采取什么策略。

首先,你要想象游戏的最终结果,也就是只剩下一个玩家。然后,你要考虑每个可能的结果对应的前提条件。例如,如果最后剩下你和B,那么前提条件是C已经被淘汰,并且你在之前的回合中没有受到致命的伤害。如果最后剩下你和C,那么前提条件是B已经被淘汰,并且你在之前的回合中没有受到致命的伤害。如果最后剩下B和C,那么前提条件是你已经被淘汰。

接下来,你要评估每个可能的结果对你的利弊。例如,如果最后剩下你和B,那么你有一定的胜算,因为你的生命值比B高,并且手枪比狙击枪更灵活。如果最后剩下你和C,那么你有很大的胜算,因为你的生命值比C高得多,并且手枪比机枪更精准。如果最后剩下B和C,那么你就输了。

最后,你要根据每个可能的结果对应的前提条件来制定你当前回合的策略。例如,如果你想让最后剩下你和B或者你和C,那么你应该攻击C,因为这样可以消除一个竞争者,并且减少B对你的威胁。如果你想让最后剩下B和C,那么你应该防御或者攻击B,因为这样可以保护自己或者增加自己的生存机会。

总之,倒后推理是一种从目标到行动的思考过程,它可以帮助你在博弈中找出最佳策略。

如何用优势策略、劣势策略和均衡策略来预测对手的行动

  • 优势策略是指在博弈中,不管对手如何选择,都能使自己获得最大收益的策略。例如,在囚徒困境中,无论对方是否坦白,自己坦白都是最优的选择,因为这样可以避免最坏的结果。因此,坦白是优势策略。

  • 劣势策略是指在博弈中,不管对手如何选择,都能使自己获得最小收益的策略。例如,在囚徒困境中,无论对方是否坦白,自己不坦白都是最差的选择,因为这样可能会面临最重的惩罚。因此,不坦白是劣势策略。

  • 均衡策略是指在博弈中,每个玩家都选择了自己最优的策略,并且没有动机改变自己的选择。例如,在石头剪刀布的游戏中,如果每个玩家都随机地出拳,并且出石头、剪刀和布的概率都相等,那么这就是一个均衡策略,因为没有人可以通过改变自己的概率来提高自己的胜率。

要预测对手的行动,我们可以先分析自己和对手是否有优势或劣势策略。如果有,那么我们可以假设双方都会理性地选择优势策略或者避免劣势策略。如果没有,那么我们可以尝试寻找均衡策略,也就是双方都没有改变策略的动机的情况。如果存在多个均衡策略,那么我们可能需要考虑其他因素,比如对手的偏好、信念、信息等。

利用对手的弱点是一种常见的策略思维

利用对手的弱点是一种常见的策略思维,可以帮助我们在博弈中获得优势。对手的弱点可能有以下几种:

  • 对手没有优势策略或者有劣势策略,这意味着我们可以通过选择合适的策略来制造对手的困境或者诱导对手做出错误的选择。
  • 对手的信息不完全或者不准确,这意味着我们可以通过隐藏或者透露信息来影响对手的信念或者期望。
  • 对手的偏好不一致或者不稳定,这意味着我们可以通过威胁或者许诺来改变对手的行为或者动机。
  • 对手的执行能力不强或者不可靠,这意味着我们可以通过观察或者测试来判断对手的真实意图或者能力。

利用对手的弱点需要我们有敏锐的观察力和分析力,以及灵活的应变能力。我们还需要注意避免自己暴露自己的弱点,或者被对手利用自己的弱点。

我可以给你一个来自商业领域的例子。假设你是一家新兴的电商平台,你的对手是一家传统的实体零售商,你发现对手的弱点是:

  • 对手的成本较高,因为他们需要支付店面租金、员工工资、库存费用等。
  • 对手的产品种类较少,因为他们受到店面空间和供应链的限制。
  • 对手的客户忠诚度较低,因为他们没有提供优惠券、积分、会员制度等激励措施。

那么,你可以利用这些弱点来制定你的策略,比如:

  • 在你的定价时,尽量把价格设得低于对手,利用你的成本优势来吸引消费者。
  • 在你的产品时,尽量提供多样化和个性化的选择,利用你的平台优势来满足消费者的需求。
  • 在你的营销时,尽量提供优惠券、积分、会员制度等激励措施,利用你的数据优势来增加消费者的忠诚度。

通过这样的策略,你就可以扩大自己的市场份额,同时削弱对手的竞争力。

另一个著名的例子是1960年美国总统选举中的电视辩论,这是美国历史上第一次电视辩论。当时,民主党候选人约翰·肯尼迪利用了共和党候选人理查德·尼克松的弱点,比如:

  • 尼克松的外表显得苍白、紧张、出汗,而肯尼迪则显得自信、魅力、清爽。
  • 尼克松拒绝化妆,而肯尼迪则接受了化妆师的建议,使他在电视上看起来更有活力。
  • 尼克松刚从医院出院,身体状况不佳,而肯尼迪则身体健康,精力充沛。

通过这些弱点,肯尼迪在电视辩论中给观众留下了深刻的印象,而尼克松则显得不够出色。这对肯尼迪赢得选举起到了关键的作用,因为他最终只以微弱的优势击败了尼克松

走出囚徒困境 如何在重复博弈中建立合作,以及如何用惩罚机制来防止作弊

  • 囚徒困境是一种博弈情景,其中两个玩家都有动机背叛对方,但是如果他们都合作,他们的总收益会更高。
  • 走出囚徒困境的一个方法是重复博弈,即玩家不只玩一次,而是玩多次,并且可以根据对方的历史行为来调整自己的策略。
  • 在重复博弈中,玩家可以建立合作的信誉,并且使用惩罚机制来防止对方作弊。惩罚机制是指如果对方背叛了你,你就会在下一次或者未来几次博弈中报复他,从而降低他背叛的收益。
  • 一个著名的惩罚机制是以牙还牙策略,即你在第一次博弈中合作,然后在以后的每一次博弈中,你都做和对方上一次做的一样的事。这样,你既可以奖励对方的合作,也可以惩罚对方的背叛。
  • 以牙还牙策略有一个缺点,就是它可能会导致长期的报复循环,即如果由于误解或者噪音导致双方都背叛了一次,那么他们就会一直互相背叛下去,无法恢复合作。
  • 为了避免这种情况,可以使用一个更温和的惩罚机制,比如慷慨的以牙还牙策略,即你在第一次博弈中合作,然后在以后的每一次博弈中,你都做和对方上一次做的一样的事,除非对方背叛了你,那么你就有一定概率原谅他,并且重新合作。这样,你既可以保持合作的稳定性,也可以增加从报复中逃脱的可能性。

如何用威胁、许诺、警告和保证等策略行动来影响对手的选择,以及如何判断这些行动的可信度

策略行动是指在重复博弈中,一方通过发出威胁、许诺、警告或保证等信息,来影响对方的期望收益和行为选择。策略行动的效果取决于它的可信度,即一方是否有动力履行自己的承诺。可信度的判断可以根据以下几个方面:

  • 是否有外部的执法机制,比如法律、合同或第三方仲裁,来保证承诺的履行。
  • 是否有内部的惩罚机制,比如声誉损失、未来合作的破坏或道德责任感,来制约背信弃义的行为。
  • 是否有足够的耐心和持续性,使得履行承诺的长期收益大于违背承诺的短期收益。
  • 是否有足够的信息和沟通,使得双方能够了解彼此的意图、偏好和信念,以及能够相互监督和验证承诺的履行。

一个策略行动的例子是美国总统肯尼迪在1962年的古巴导弹危机中,对苏联发出的警告和保证。他警告苏联如果继续向古巴运送核导弹,就会引发核战争,同时保证如果苏联停止运送并撤走已有的导弹,美国就不会入侵古巴。这个策略行动的可信度来自于美国的军事优势、国际舆论的支持、以及肯尼迪的坚定态度。最终,苏联接受了美国的条件,避免了核战争的爆发。

#### 如何通过改变自己的收益、限制自己的选择或者公开自己的信息等方式来建立可信的承诺,以及如何应对不可信的承诺

可信的承诺是指在重复博弈中,一方通过改变自己或对方的收益、限制自己或对方的选择或者公开自己或对方的信息等方式,来增强自己承诺的可信度,从而影响对方的期望收益和行为选择。可信的承诺可以有以下几种方法:

  • 改变收益:通过提高履行承诺的收益或降低违背承诺的收益,来增加自己承诺的可信度。例如,一方可以提前支付定金、抵押物品或签署合同,来表明自己履行承诺的决心。
  • 限制选择:通过削弱自己或加强对方的反应能力,来增加自己承诺的可信度。例如,一方可以放弃某些选择、委托第三方代理或设置自动机制,来表明自己无法或不愿违背承诺。
  • 公开信息:通过透露自己或获取对方的私人信息,来增加自己承诺的可信度。例如,一方可以公布自己的偏好、信念或行动计划,来表明自己与对方的利益一致或相互依赖。

如果对方发出了不可信的承诺,那么应该怀疑其真实性,并尽量避免被其欺骗或利用。可以通过以下几种方法来应对不可信的承诺:

  • 检验逻辑:通过分析对方的收益和选择,来判断其承诺是否符合逻辑和理性。如果对方没有动力履行承诺,或者有动力违背承诺,那么其承诺就不可信。
  • 要求证据:通过要求对方提供可靠的证据、担保或保证,来验证其承诺是否真实和有效。如果对方无法提供足够的证据,或者提供了虚假的证据,那么其承诺就不可信。
  • 保留权利:通过保留自己的反应能力和选择余地,来防止被对方的承诺所束缚或误导。如果对方试图剥夺自己的权利,或者利用自己的权利,那么其承诺就不可信。

一个可信的承诺的例子是美国总统尼克松在1971年对中国发出的保证,即如果中国同意与美国建立外交关系,美国就会承认中国在台湾问题上的主权,并逐步撤走美军。这个承诺的可信度来自于美国的战略利益、国际形势的变化、以及尼克松的个人信誉。最终,中国接受了美国的条件,与美国正式建交。

一个不可信的承诺的例子是苏联领导人赫鲁晓夫在1958年对西方发出的最后通牒,即如果西方不同意将柏林划为自由城市,苏联就会单方面签署和平条约,并切断西柏林与外界的联系。这个承诺的不可信度来自于苏联的军事劣势、西方的坚决反对、以及赫鲁晓夫的政治风格。最终,西方拒绝了苏联的条件,苏联也没有履行自己的威胁。

点击 策略思维的详细内容 2