囚徒困境博弈论思维模型-多学科思维模型数学思维模型

囚徒困境:是个博弈理论的一个模型,它对于卖家来说,有实战的意义。天猫,京东,亚马逊,风水轮流转,游戏规则常常变。伴随着电商环境的流转和变化,很多“干货”很快就变得没用了。但是也有一些理论知识,不管中国的电商怎么变,它都会一直发光,一直能给你带来新的洞察和灵感。这样的理论和知识,还是要好好研究一下。“囚徒困境”这个模型,就是这些重要知识中的一个。

先把什么是“囚徒困境”解释一下。如果你已经了解过博弈论的相关内容,可以跳过这一部分。或者如果你想要得到更详细更好的解释,那也可以去Wiki或者别的知识网站看。

一个犯罪团伙的两个成员(A和B)被拘捕了,他们完全被隔离开,互相之间绝对没有办法互通消息。警方目前缺乏证据,无法以他们所共犯的主要罪行来将他们定罪。但是警方手里有一些次要证据,可以较轻的罪名判他俩各一年。于是警方对他们分别同时提出了“浮士德”交易的条件(别管浮士德是什么,这不重要):

1. 如果A和B都供述罪行,那么每人判两年。
2. 如果A供述,B不供述,那么A可释放,B要坐3年牢(反之亦然)
3. 如果A和B都不供述,那么他们每人要判一年。

我再解释的清楚一些。A和B对上面交易的3个条件各自都很清楚明了地知道。也就是说,他们知道警察手里的证据只够判每人一年的,如果没有这个交易,他俩也就是各坐一年牢完事。有了这个交易,他俩只要都不认罪,也还是只要坐一年。

另一个重要的假设条件:他俩都是所谓的“经济人”。也就是说,他们每个人做出的决策,都会以自己的利益最大化为目的。在这个“游戏”中,如果某犯的选择是不供述,那么我们把他的选择叫做“合作”(意指他试图采取跟另一名罪犯合作的策略,当然他必须指望对方也合作,才能获益);如果某犯选择了供述,那么我们把他的这个选择称作“背叛”。

说到这里,我把关于这个交易该交代的都交代了。但是我多次发现,对于理科生,这些信息已经够了,但是文科生常常没看明白。鉴于电商多有文艺青年出身的掌柜,这里我再给一个文科生专用案情详述(理科生跳过吧):

A和 B一起持枪抢银行,目前被拘捕关押,互相隔离。他们被抓的时候,随身搜出了没有登记过的点22口径手枪。但是除了非法持枪这个铁证之外,检方并没有确凿的证据来起诉他们抢银行的罪行。他们知道检方证据不足,所以他们现在只要一口咬定没抢银行,那就最多因非法持枪罪判一年。

对于警察来说,这也是个无奈的局面,谁让他们抓不到证据呢? 可是这时有个年轻的检察官说:我有办法。这个聪明的检察官分别给A和B提供了相同的选择。他对他们分别说:

“你好哥们!我是地区检察官柯南。我现在经授权可以和你达成一个交易。交易的条件是这样的:你现在可以选择沉默,也可以选择把抢银行的事供出来。如果你供述了,而你的同伙保持沉默,那我可以放了你,但是你的同伙要判三年。反过来,如果你沉默,但是你同伙供述了,那同样,他就自由了,你要坐三年牢。如果你们两个人都供述认罪了,那你们各自要坐两年牢。但是如果你们俩都沉默,那我就只能以非法持枪罪起诉你们,每人判一年。你好好想想吧,明天早上之前写好你的选择,交给狱卒。”

于是,在这个夜晚,A和B都将辗转反侧,权衡利弊,做出对自己最有利的选择。

他们各自的选择会产生4种可能的结果,我在这里把这4种结果都列出来:

好,我们来看一下他们的选择思路。假设你是A,你现在不知道B会怎么选,所以你必须考虑B做出每一种选择可能给你带来的后果。

假如B选择了沉默,那么你现在做哪个选择更划算呢?如果你沉默,那你坐一年牢;如果你供述,那么你可以不坐牢。所以如果B沉默的话,你应该选供述更划算。

假如B选择了供述,那你的两种选择分别会带来什么样的后果呢? 如果你沉默,那你要坐3年牢;如果你供述,那你要被关2年。2年 v.s. 3年,那还是选供述更划算。

于是,无论B做哪个选择,你都应该选择供述更划算。于是,“供述”便是A唯一合理的理性的,利益最大化,损失最小化的选择。

同样的道理,B也会选择供述。这样一来,第二天早上我们这位聪明的检察官将会毫无悬念地得到两份认罪供述。

这个毫无悬念的结局就是经典囚徒困境的唯一答案(囚徒困境有其他条件变化而产生的变体,答案也随之会变化)。两个囚犯被这个游戏逼入了一个悲惨的困境,明明有一个“你好我也好”的可能,但是偏偏结果却必然是“你不怎样我也不怎么样”。而这个必然的结局就是著名的“纳什均衡点”。

接下来我们本来应该把这个游戏的结果,和对它的意义的思考,仔细地展开讨论。不过这里我先插入一个和电商卖家相关的情境,趁热打铁,把我们最终要触及的话题赶紧先推出来亮亮相。

假设你是一位买家,想在网上购买一件商品(我本来想举一个具体的商品例子,比如衣服鞋子什么的,但是这样一来只怕会太具象,以至于局限了我们讨论和思考的范围,所以我还是决定在此讨论某件抽象的商品。故此要向文科生表示抱歉了。)。这件商品按品质大致可以分为两种:高质量,和低质量。可是因为你是在网上购买,没法对实物进行考察和测试,所以你不知道你现在加入购物车的这件究竟是高质量的,还是低质量的。卖家虽然明确把他的商品的质量等级向你表明了,但是你不知道他说的是真是假。

这个商品也有两个不同的价格,高价和低价。所以你面临着4种可能的结果:高价高质,高价低质,低价高质,低价低质。

我们把你购买这件商品所得到的价值回报用货币金额的数值来表达:

假如你出高价买到了高质的商品,那么你的价值回报是7元(多出些钱买到一个好东西,还是值得的)。
假如你出低价买到了高质的商品,那么你的价值回报是10元(这么便宜买到这么好的宝贝,赚大了)。
假如你出高价买到了低质的商品,那么你的价值回报是 -5元(我擦,被宰了)
假如你出低价买到了低质的商品,那么你的价值回报是3元(买的就是便宜货嘛,就这样了)

好,我们先把这位买家放一边不说(虽然他的选择已经有了,你可以自己帮他计算一下应该怎么选)。现在我们来看看卖家的情况。卖家同样也有4种选择:高价卖高质,高价卖低质,低价卖高质,低价卖低质。卖家在这4种情况下得到的回报金额是:

假如他以高价卖掉了高质的商品,那么他得到的回报是7元(卖好东西,赚好利润,不错啊)
假如他以低价卖掉了高质的商品,那么他得到的回报是 -5元(砸手里了,亏啊)
假如他以高价卖掉了低质的商品,那么他得到的回报是10元(宰到了!)
假如他以低价卖掉了低质的商品,那么他得到的回报是3元(天生就是摆地摊的)

现在两边的情况都已经清楚了,你可以自己参考上面囚徒困境的表格来计算一下最终的结局了。

在这个游戏里,无论卖家如何选择,买家总是出低价更划算;另一方面,无论买家如何选择,卖家总是提供低质商品更划算。

这是买家和卖家之间的囚徒困境 - 明明有一个大家都能获得更好的回报的可能性,可是博弈的结局却注定了是一个对双方来说都更差的结果。

囚徒困境是一个静态条件下的博弈游戏,如果对它的条件进行改变的话,那么就能够走出困境的宿命,改变最终的结果。

最直接来说,如果这两个囚徒能够有机会商量一下,或者有办法找人送个口信的话,那么他们就可以同时选择更好的结果。问题是,他们互相信任吗?他们会抵制住背叛承诺的诱惑吗? 毕竟,背叛可以得到更好的结局。这时候,可信度就变得非常重要了。

可信度可以来自于声誉。假如这两个囚犯是田伯光和岳不群,那么囚徒困境的答案根本不会改变。但是如果是风清扬和令狐冲,那么走出困境就指日可待了。

可信度也可以来自面临的后果。如果一个犯罪团伙的帮规是要杀了背叛同伙的人,犯我帮规者,虽远必诛,那么合作就变得可信了。

又或者假如这个游戏不是一次性的,而是要不断重复下去的,那么双方的计算也会改变。因为总不能一直这么亏下去吧? 其中的一方或许会选择吃几次亏,让对方看到诚意,于是双方达成长期的合作,避免了持续的困境。

对于卖家来说,你如果能够成功地发出信号,让买家看到你不是田伯光,而是令狐冲,那么这就是走出囚徒困境的一条光明大道。

因此卖家需要思考的是:我怎样才能发出可信的信号给买家? 还有一点非常重要:你的商品的品质或者功效,买家在买回来之前越难以进行评估,你发出的信号就越重要。

比如香水,你无论用多少形容词来描述你的香水,买家都没法判断它究竟是个什么味道。所以香水品牌喜欢在杂志中提供小样。当然,香水你只要买回来,还是可以马上知道它的味道的。还有些商品,你买回来用了,依然很难做出评估。




比如减肥产品,买家无论如何事先都很难评估它的效果的,而且买回来也要过很长一段时间才能做出评估。其他比如以耐用性为主要卖点的商品,也有同样的问题。于是“无效退款”,“延长保质期”等等承诺,都可以成为卖家发出的信号。可是接下来问题又来了:我真的信你能实践你的承诺吗?这个山寨大国里,有什么承诺是可信的吗?

更有甚者,有些东西买家买回去,消费完了,体验完了,但还是无法对它的品质进行评估。比如任何吃的喝的,我作为消费者,吃完了喝完了,我真的知道我吞到肚子里的是什么东西吗? 这花生是不是发霉变质的又重新加工的?这咖啡是不是从非洲哪个国家收购来的陈年废料加工的?

那么现在,请你思考,你能做些什么,让你发出的信号给人靠谱可信的感觉呢?

在一个正常的商业环境里,我们还是可以想出很多办法来的。可是我们所在的这个环境正常吗?

我们可以把店铺精心地装修一番,把详情页做到细致美观,信息充分,让买家体会到我们是很用心的,我们对品质的关注渗入到了我们日常经营的方方面面。可是转眼,我们的这些创造都被那些地摊货卖家复制了。信号无效。

我们可以用心地提供实物拍摄,让买家看到我们商品的实际情况,所见即所得。可是你一回头,发现那些地摊货卖家直接从韩国日本网站盗来的图片,比你的实拍图好看多了。日本人韩国人的图片连水印都没有,买家哪里分辨的清? 信号无效。

我们可以努力地积累好评和信用,以历史事实来说话。可是,不用说你也知道 - 信号无效。

我们可以努力经营自己的品牌,让买家看到我们是有担当有愿景的,我们有足够的动力和激励来提供更好的价值。然而,你看到那些地摊货也开起了旗舰店,用网络上偷来的图片,以地摊的价格甩着低质的廉价货。买家是买你的还是买他的? 我们从囚徒困境中已经找到答案了 - 当然是买他的。

劣币驱逐良币,这就是囚徒困境带来的结局。当你做出的各种摆脱囚徒困境的努力都失效时,事情就又回到了起点,也就是说,你没能摆脱这个困境。

因此,囚徒困境不仅仅是你作为一个卖家所遭遇的困境,也不仅仅是买家白白被葬送的可以获得更高回报价值的机会。囚徒困境是整个电商环境的困境,是天猫和淘宝应该面对却始终逃避的局面。马云如果能够面对这个现实,如果能够做出改变,那么短时间内或许他会损失一部分销售额,但最终他将为买家,卖家,和平台都创造出更高的回报。另一方面,如果说在天猫和淘宝,信号都已经失效了,那么就意味着,下一个有可能挑战马云的人,将会是一个能够构建起一个确保释放有效信号的平台的人。这样的平台,如果建起来的话,我一定会投奔的。

于此同时,你作为一个有战略眼光的卖家,也不是束手待毙的。从囚徒困境这个模型中,你看到了一些关键的症结,那么现在你就可以发挥你的创造力了。你应该怎样才能更好地向你的买家和潜在买家持续发出有效的可信的信号,这样一个思路是不是为你打开了一扇门了呢?

商业是一个神秘的事物,或许它的本质是一个永远不得而知的秘密。我们能够做的,就是接受新的知识,从而产生新的视角,新的分析,新的洞见,以致新的灵感和创意。囚徒困境模型,也是这样的一个知识点。了解它,运用它,拿它来磨砺一下你的商业思路,灵感的火花就会闪耀起来。毕竟,诺贝尔奖不是白给的。

再比如股票分红

分红后股价不填权,假设公司仍然持续赚钱,分红率(占净利润的比例)不变,那投资者投资1万元,分红复投,迟早会现金买下整个千亿上市公司。醒醒!这样的好事大家都想要,所以现实中股价必然填权,必然不会有这样的事情发生。分红必然填权是囚徒困境所保证的。

 

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章阅读

留言与评论