如何在不确定性和信息不完全的情况下做出策略选择?如何用混合策略和随机化来增加不可预测性

在不确定性和信息不完全的情况下做出策略选择,需要考虑以下几个方面:

  • 期望收益:根据自己和对方的可能的行动和收益,计算自己在每种情况下的期望收益,即收益乘以发生的概率。选择期望收益最高的行动作为自己的策略。
  • 风险偏好:根据自己对风险的态度,决定自己愿意承担多大的风险,以换取更高的收益。如果对风险厌恶,就倾向于选择稳定而低收益的行动;如果对风险喜爱,就倾向于选择波动而高收益的行动。
  • 信念更新:根据自己观察到的信息,更新自己对对方行动和收益的信念,即对方行动和收益发生的概率。利用贝叶斯法则,将先验信念(没有观察到信息之前的信念)和似然性(观察到信息发生的概率)相乘,得到后验信念(观察到信息之后的信念)。
  • 混合策略:如果自己和对方都没有明显的优势策略,就可以考虑采用混合策略,即以一定的概率随机选择不同的行动。通过混合策略,可以使对方难以预测自己的行为,从而增加自己的期望收益。
贝叶斯法则

贝叶斯法则是一种用于根据新的信息更新信念的数学公式。它的基本思想是,如果我们已经知道某件事情发生的概率,以及在这件事情发生的条件下,另一件事情发生的概率,那么我们就可以计算出在另一件事情发生的条件下,这件事情发生的概率。

贝叶斯法则的公式如下:

P(A|B) = P(B|A) * P(A) / P(B)

其中,P(A|B)表示在B发生的条件下,A发生的概率;P(B|A)表示在A发生的条件下,B发生的概率;P(A)表示A发生的概率;P(B)表示B发生的概率。

举个例子,假设你有一个朋友,他有50%的概率是男性,50%的概率是女性。你想知道他是否喜欢看足球比赛。你知道,在男性中,有80%的人喜欢看足球比赛,在女性中,只有20%的人喜欢看足球比赛。你给他打电话,他告诉你他正在看足球比赛。那么,你可以用贝叶斯法则来更新你对他性别的信念:

P(男性|看足球) = P(看足球|男性) * P(男性) / P(看足球)

= 0.8 * 0.5 / (0.8 * 0.5 + 0.2 * 0.5)

= 0.8 / (0.8 + 0.2)

= 0.8

也就是说,在他告诉你他正在看足球比赛之后,你认为他是男性的概率从50%上升到了80%。

贝叶斯法则 例子2
  • 贝叶斯法则是一种用于根据已有的信息更新概率估计的方法。它可以用于政治经济分析中,例如预测选举结果,评估政策效果,或者分析不确定性和风险。根据网上搜索的结果,我找到了一个例子:

  • 贝叶斯定理可以用来分析政治候选人的支持率。假设有两位候选人A和B,我们想知道他们各自的胜选概率。我们可以根据历史数据和民意调查来给出一个先验概率,即在没有新信息的情况下,我们对他们的信念。例如,我们可以假设A的先验概率是60%,B的先验概率是40%。然后,我们可以根据新的信息来更新我们的后验概率,即在考虑了新信息后,我们对他们的信念。例如,如果有一次辩论中,A表现得更好,那么我们可以认为A的胜选概率会上升,B的胜选概率会下降。贝叶斯定理可以帮助我们计算这种变化的大小。

贝叶斯定理的公式是:

P(A|X) = P(X|A) * P(A) / P(X)

其中P(A|X)表示在知道X的情况下,A发生的概率;P(X|A)表示在A发生的情况下,X发生的概率;P(A)表示A发生的先验概率;P(X)表示X发生的总概率。

假设在辩论中,A表现得更好的概率是80%,B表现得更好的概率是20%。那么,我们可以用贝叶斯定理来计算A和B在辩论后的胜选概率:

P(A|辩论) = P(辩论|A) * P(A) / P(辩论)

= 0.8 * 0.6 / (0.8 * 0.6 + 0.2 * 0.4)

= 0.75

P(B|辩论) = P(辩论|B) * P(B) / P(辩论)

= 0.2 * 0.4 / (0.8 * 0.6 + 0.2 * 0.4)

= 0.25

因此,在辩论后,A的胜选概率上升到了75%,B的胜选概率下降到了25%。这就是贝叶斯定理在政治经济分析中的一个应用。

贝叶斯定理在股票市场中的应用
  • 贝叶斯定理是一种根据已有信息更新信念的方法。在股票市场中,投资者可以利用贝叶斯定理来根据新的数据或信息调整对股票未来收益率的预期。例如,假设投资者对某只股票的收益率有一个先验分布,即在没有新信息之前的信念。当他获得了一些新的信息,比如该股票的财报、行业动态或市场情绪等,他可以利用贝叶斯定理计算出一个后验分布,即在考虑了新信息之后的信念。后验分布可以反映出投资者对该股票收益率的最新预期,从而帮助他做出买卖决策。

  • 一个具体的例子是,假设投资者认为某只股票的收益率服从正态分布,均值为10%,标准差为5%。这是他的先验分布。然后他得知该股票发布了优于预期的季度财报,这是一个正面的信息。他可以利用贝叶斯定理更新他对该股票收益率的预期,即计算出一个后验分布。具体的计算方法可以参考³中的公式和步骤。假设经过计算,他得到了一个新的正态分布,均值为12%,标准差为4%。这是他的后验分布。这意味着他对该股票收益率的预期提高了,并且信心也增强了。因此,他可能会决定增加对该股票的持仓或买入该股票。

贝叶斯定理在股票市场中的优势

贝叶斯定理是一种用于根据已知信息推断未知概率的方法。在股票市场中,贝叶斯定理可以用于根据历史数据和新闻信息预测股票的价格变化和龙头股的出现。一个可能的应用是使用贝叶斯文本分类算法分析财经新闻和个股新闻,计算每支股票的情绪指数,然后根据情绪指数和其他因素(如市场环境、行业趋势、基本面等)生成套利信号 。
这种方法需要不断更新数据和预测模型,以适应市场的变化。贝叶斯定理并不保证能够准确地确定龙头股,但可以提供一种基于概率的决策辅助工具。 根据网上的信息,贝叶斯定理是一种利用先验概率和观察数据来更新后验概率的方法。在股票市场中,贝叶斯定理可以帮助投资者根据历史数据和新的信息来调整对股票价格走势的预期和信心。

贝叶斯定理在股票市场中的优势有:

  • 可以利用多种来源的信息,包括基本面分析、技术面分析、市场情绪等,来更新对股票的评估和决策。
  • 可以根据不同的假设和证据来进行灵活的模拟和测试,从而提高投资策略的有效性和适应性。
  • 可以量化不确定性和风险,从而帮助投资者管理预期和情绪。

贝叶斯定理在股票市场中的局限性有:

  • 需要大量的数据和计算能力,可能导致过度拟合或计算错误。
  • 需要合理的先验概率和损失函数,可能受到主观偏见或信息不完整的影响。
  • 不能完全消除随机性和不可预测性,可能导致意外的结果或损失。

如何用混合策略和随机化来增加不可预测性

  • 混合策略是指玩家在博弈中以一定的概率选择不同的纯策略,从而增加自己的不可预测性。随机化是指玩家在博弈中采用一种随机的方式来确定自己的策略,从而使对手无法根据自己的行为推断出自己的策略。

  • 混合策略和随机化可以帮助玩家在博弈中获得更好的结果,特别是在存在多个纳什均衡或者没有纯策略纳什均衡的情况下。例如,在扩展式博弈中,有些纳什均衡可能是不可信的,因为玩家可能会偏离自己的最优反应。为了避免这种情况,玩家可以采用混合策略或者随机化,使得对手无法确定自己的收益,从而达到子博弈完美均衡 。

  • 混合策略和随机化的应用范围很广泛,包括体育、商业、政治、军事等领域。例如,在网球比赛中,选手可以通过改变发球方向和力度来增加对手的猜测成本;在拍卖中,竞拍者可以通过随机出价来避免被其他竞拍者模仿或者利用;在核威慑中,超级大国可以通过隐蔽或者移动核武器来增加对方的不确定性;在真人秀节目中,参与者可以通过混合合作和背叛的策略来提高自己的生存几率。

混合策略的例子

  • 假设有两个足球队在比赛中,每个队有两种策略:进攻或者防守。如果两个队都选择进攻,那么比分是2:2;如果两个队都选择防守,那么比分是0:0;如果一方进攻,另一方防守,那么进攻方得分为3,防守方得分为1。这个博弈的纯策略纳什均衡是(进攻,进攻),但是这个均衡并不稳定,因为任何一方都有动机偏离自己的策略,试图获得更高的得分。为了避免这种情况,两个队可以采用混合策略,即以一定的概率选择进攻或者防守。例如,如果每个队以2/3的概率选择进攻,以1/3的概率选择防守,那么这就是一个混合策略纳什均衡,因为在这种情况下,每个队的期望得分是2,而且没有动机改变自己的策略。这样,两个队就增加了自己的不可预测性,使得对手无法根据自己的策略来确定自己的反应。

  • 我再给您举一个随机化的例子,来自本书的第九章。假设有一个国家领导人要决定是否对另一个国家发动战争。他知道对方有核武器,但不知道对方是否愿意使用核武器进行反击。如果对方不使用核武器,那么他可以轻易地获得胜利;如果对方使用核武器,那么他将遭受灭顶之灾。为了解决这个问题,他可以采用一种随机化的方式来确定自己的决定,即抛一枚硬币。如果硬币正面朝上,他就发动战争;如果硬币反面朝上,他就放弃战争。这样做的好处是,他可以使对方无法根据他的性格或者利益来推测他的行为,从而增加对方的不确定性和恐惧感。这可能会迫使对方做出让步或者妥协,从而避免战争的发生。

混合策略和随机化并不是万能的,它们也有一些局限性。例如:

  • 混合策略和随机化需要玩家有足够的信息和理性,能够根据对手的策略和概率来计算自己的最优策略和概率。但是,在实际中,玩家可能缺乏信息或者受到情绪、偏见、惯性等因素的影响,从而偏离理性的选择。
  • 混合策略和随机化需要玩家能够有效地实施自己的策略和概率,能够保持一致性和不可观测性。但是,在实际中,玩家可能难以控制自己的行为或者隐藏自己的意图,从而被对手察觉或者利用。
  • 混合策略和随机化需要玩家能够承受一定的风险和损失,能够接受不确定性和变化。但是,在实际中,玩家可能对风险和损失有不同的态度和偏好,从而影响自己的决策。
  • 混合策略和随机化可能导致一些不理想或者不公平的结果,例如社会浪费、道德风险、逆向选择等。这些结果可能损害玩家的利益或者社会的福利,从而引发新的冲突或者问题。

举一个混合策略导致社会浪费的例子,来自本书的第八章。假设有两个公司在竞争一个市场,每个公司有两种策略:高价或者低价。如果两个公司都选择高价,那么他们的利润都是100;如果两个公司都选择低价,那么他们的利润都是50;如果一方选择高价,另一方选择低价,那么高价方的利润是0,低价方的利润是150。这个博弈的纯策略纳什均衡是(高价,高价),但是这个均衡并不稳定,因为任何一方都有动机偏离自己的策略,试图获得更高的利润。为了避免这种情况,两个公司可以采用混合策略,即以一定的概率选择高价或者低价。例如,如果每个公司以2/3的概率选择高价,以1/3的概率选择低价,那么这就是一个混合策略纳什均衡,因为在这种情况下,每个公司的期望利润是66.67,而且没有动机改变自己的策略。但是,这样做的坏处是,社会总利润降低了,从200变成了133.33。这就是社会浪费的结果,因为两个公司为了争夺市场份额而牺牲了自己和社会的利益。

我再给您举一个随机化导致不公平结果的例子,来自本书的第九章。假设有一个国家领导人要决定是否对另一个国家发动战争。他知道对方有核武器,但不知道对方是否愿意使用核武器进行反击。如果对方不使用核武器,那么他可以轻易地获得胜利;如果对方使用核武器,那么他将遭受灭顶之灾。为了解决这个问题,他可以采用一种随机化的方式来确定自己的决定,即抛一枚硬币。如果硬币正面朝上,他就发动战争;如果硬币反面朝上,他就放弃战争。这样做的好处是,他可以使对方无法根据他的性格或者利益来推测他的行为,从而增加对方的不确定性和恐惧感。这可能会迫使对方做出让步或者妥协,从而避免战争的发生。但是,这样做的坏处是,他也可能导致一场不必要或者不正义的战争,造成无辜人民的死伤和财产损失。这就是不公平结果的可能性,因为他把自己和对方国家的命运交给了随机事件。

如何在高风险和高回报的情况下做出策略选择

  • 评估自己的风险承受能力和风险偏好,以及自己的目标和期望。不同的人和组织对风险的态度和反应可能不同,因此要选择适合自己的策略,而不是盲目跟随别人。
  • 分析风险和回报的概率和影响,以及可能的不确定性和变化因素。使用一些工具和方法,如决策树、博弈论、敏感性分析等,来帮助自己预测和比较不同策略的结果和后果。
  • 制定一个灵活和适应性强的策略,能够应对不同的情景和挑战。在执行策略的过程中,要持续监测和评估风险和回报的变化,以及自己的表现和进展,及时调整和改进策略。
  • 学习从成功或失败的经验中汲取教训,提高自己的策略思维能力。要有勇气承认错误,有意识地反思和总结,有创新和改进的意愿,有持续学习和成长的动力。

当然可以。我会用一个简单的例子来说明。

假设你是一个企业家,你有一个创新的产品想要推向市场,但是你面临两个选择:一是自己独立开发和销售,二是与一个大公司合作,让他们负责生产和分销。你想要知道哪个选择的风险和回报更高。

你可以用决策树来表示这个问题。决策树是一种图形工具,用来显示不同选择的可能结果和概率。决策树由节点和分支组成。节点表示决策点或事件点,分支表示不同的选择或结果。决策树的根节点表示初始状态,叶节点表示最终状态。每个分支都有一个概率和一个回报值,表示该选择或结果发生的可能性和收益。

下图是一个简化的决策树,表示你的问题:

image

从这个决策树中,你可以看到:

  • 如果你选择自己独立开发和销售,你有50%的概率成功,获得100万美元的回报;也有50%的概率失败,损失50万美元。
  • 如果你选择与大公司合作,你有80%的概率成功,获得40万美元的回报;也有20%的概率失败,损失10万美元。
  • 你可以计算每个选择的期望回报,即概率乘以回报的加权平均值。自己独立开发和销售的期望回报是25万美元(0.5×100万 - 0.5×50万);与大公司合作的期望回报是28万美元(0.8×40万 - 0.2×10万)。
  • 根据期望回报,与大公司合作似乎是更好的选择,因为它有更高的收益和更低的风险。
  • 但是,你还要考虑其他因素,比如你对风险的偏好、你对市场的判断、你对合作伙伴的信任等。这些因素可能会影响你的最终决策。

你也可以用博弈论来分析这个问题。博弈论是一种研究多方互动和策略行为的理论。博弈论假设每个参与者都是理性的,并且会考虑其他参与者的行为和反应。博弈论可以用矩阵或表格来表示不同参与者的选择和收益。

下表是一个简化的博弈矩阵,表示你和大公司之间的博弈:

大公司合作 大公司不合作
你独立开发 100万, 0 -50万, 0
你不独立开发 40万, 40万 -10万, -10万

从这个博弈矩阵中,你可以看到:

  • 如果大公司愿意合作,你无论选择独立开发还是不独立开发,都会获得正向收益。但是如果大公司不愿意合作,你无论选择独立开发还是不独立开发,都会获取亏损

如何在边缘政策中平衡威慑和逃避

边缘政策是⼀种策略,指的是在冲突中故意制造⼀种危机的氛围,以向对⼿展示⾃⼰的决心和意志,从⽽迫使对⼿让步或妥协。边缘政策的难点在于如何平衡威慑和逃避,即如何在保持对⼿的压力的同时,避免引发不可控制的战争。

根据博弈论的分析,边缘政策中的平衡取决于以下几个因素:

  • 对⼿的理性程度。如果对⼿是完全理性的,那么他会根据成本收益分析来决定是否屈服或挑战。如果对⼿是有限理性或非理性的,那么他可能会受到情绪、偏见或误判的影响,从⽽做出不符合⾃⼰利益的选择。
  • 对⼿的信息完备度。如果对⼿能够准确地了解⾃⼰和对方的偏好、能⼒和决策规则,那么他可以更好地预测对方的反应,并据此制定最优策略。如果对⼿缺乏相关信息,那么他可能会低估或高估对方的威胁或许诺,从⽽做出错误的判断。
  • 对⼿的信念更新机制。如果对⼿能够根据新的证据或信号及时地更新⾃⼰对对方的信念,那么他可以更灵活地调整⾃⼰的策略,并及时地寻求和平解决。如果对⼿坚持固有的信念或忽视新的信息,那么他可能会陷入僵局或误判形势。
  • 对⼿的风险态度。如果对⼿是风险厌恶的,那么他会倾向于避免不确定性和潜在损失,并更容易接受妥协或让步。如果对⼿是风险中性或风险喜好的,那么他会倾向于追求不确定性和潜在收益,并更容易发起挑战或抵抗。

综上所述,要想在边缘政策中平衡威慑和逃避,就需要考虑以上因素,并根据具体情况采取相应的措施。例如:

  • 如果想要增强威慑效果,可以通过以下方式提高对方承担战争风险的成本或降低自己承担战争风险的成本:增加自己的军事实力、联合盟友、发出可信的承诺、采取不可逆转的行动、增加不可预测性等。
  • 如果想要增强逃避效果,可以通过以下方式提高自己和对方寻求和平解决的收益或降低自己和对方寻求和平

如何在多人博弈中实现合作与协调

  • 逃离囚徒困境:通过建立信誉、惩罚作弊者、保证惩罚等方式,促进长期的合作关系。
  • 策略行动:通过威胁、许诺、警告、保证等方式,影响对方的选择,达成有利的结果。
  • 可信的承诺:通过限制自己的选择、增加自己的成本、改变自己的偏好等方式,增强自己的可信度,使对方相信自己的承诺。
  • 合作与协调:通过寻找共同利益、解决冲突、制定规则等方式,实现多方的协调,避免无效的竞争
如何在多人博弈中实现合作与协调--举一个例子

假设你和你的同事都想申请一个项目经理的职位,这是一个多人博弈的情况。你可以使用以下的方法:

  • 逃离囚徒困境:你可以和你的同事建立一个合作关系,互相支持,分享信息,避免恶意竞争,这样可以提高你们的整体表现,也可能增加你们的晋升机会。
  • 策略行动:你可以向你的上司表达你对项目经理职位的兴趣和能力,同时也暗示如果没有得到晋升,你可能会考虑离开公司,这样可以增加你的筹码,影响上司的决定。
  • 可信的承诺:你可以在工作中展现出你对项目经理职位的适合和热情,同时也承诺如果得到晋升,你会为公司带来更多的价值和贡献,这样可以增加你的可信度,使上司相信你的承诺。
  • 合作与协调:你可以寻找和你的同事和上司的共同利益,比如项目的成功、公司的发展、员工的满意等,同时也尊重他们的不同意见和需求,通过沟通和协商,实现多方的协调,避免无效的竞争。