给PM看的博弈论01:社会选择

从活动投票说起

一个创业公司组织周末活动,老板征求大家意见,去玩密室逃脱或者去吃某个新开的自助餐。老板做出决定很简单,大家在群里投票,哪个票多就哪个。但有员工提出,最近某部才上映的电影也不错,可以一起加入活动待选项,老板同意了。

假设现在公司就只有3位员工,每个员工有6票,他们的投票得出了如下的结果:

这个时候老板头疼了,因为结果中活动的总分都是一样,选择任何一个活动好像都不太合适。

通过这个例子可以看出,“尊重大多数”这种投票模式在一些的社会选择问题中是有毛病的。接下来我们就来简单聊聊社会选择问题。聊这个之前,我们先来看看两个定义,社会福利函数(social welfare function)和 社会选择函数(social choice function)。

社会福利函数与社会选择函数

我们经常可以看到社会福利函数和社会选择函数,那么它们到底是什么意思,我们花个2分钟来了解下。
社会福利函数的定义是 :$F: L^n \rightarrow L$。其中 $L$ 表示选项集合 $A$(候选项) 的线性排序集合,$n$ 是参与投票人的数量。也就是说,社会福利函数是 $L^n$ 到特定选项排序的线性映射。这么听上去可能有点绕,我们可以理解为社会福利函数是一个获取群体的偏好结果的函数,比如:

社会选择函数的定义是:$F: L^n \rightarrow A$。社会选择函数是$L^n$ 到选项集$A$的一个线性映射。我们可以把它看成是一个获取最终选择结果的函数,比如老板看了下投票,然后宣布: 走,去吃自助

策略操纵

搞清楚这两个函数概念后,我们接着再看另一个公司投票的例子,现在公司有4个员工,每个员工有10票,现在每个员工投票的真实评分(投票)如下:

可以发现,密室和自助的得票数都是12票,但员工2是个吃货,他太想去吃自助了。这个时候,他就动起了歪脑筋,为了保证密室的得票数低于自助,他在投票的的时候并没有按照自己的真实偏好(自助>密室>卡丁车>电影),而是将自己的投票数变为了:

这样,员工2就可以确保自助活动的票数最多,我们把这种投票方式称为策略操纵(strategic manipulation)。策略操纵行为的原因是对选项的偏好(密室>电影)受到了选项 自助 的影响。如果社会福利函数中,投票者对选项的偏好不会受到影响,那么我们称其社会福利函数满足独立性,定义如下:

也就说,满足独立性的社会福利函数没有被策略操纵的空间。

独裁者

在来看另一个公司投票例子,现在还是4个员工,每人10票对活动进行投票,投票结果如下:

奇怪的是,最后大家一致决定去玩密室逃脱。原因是员工1是公司一位漂亮的单身女员工,其他员工都想参加她最喜欢的那个活动。在这个例子中,这位漂亮的女员工就是“独裁者”。在社会选择中,独裁者的定义如下:

Arrow 定理 与 Gibbard-Satterthwaite定理

明白独裁者和独立性的概念后,我们就可以来看一个大名鼎鼎的Arrow定理:

其证明可以参考:Arrow定理证明

这个定理的确让人很失望,因为我们总是希望我们设计的产品机制没有独裁者,并且同时满足独立性和一致性。没有关系,因为我们还有更绝望的Gibbard-Satterthwaite定理。结合前面所说,如果一个投票者可以通过改变自己的投票行为来获取想要的结果,我们就说社会选择函数 $f$ 可以被该投票者操纵。但如果一个社会选择函数有如下性质,那么投票人将没有操纵的空间。当社会选择函数 $f$ 是单调的时候,那么投票人没有办法通过转换其投票策略来获取想要的结果。这种社会选择函数被称为是激励相容(incentive compatible)的(可以把激励理解为动机,也就是没有操纵的动机)。有了这个概念后,最后我们来看看令人绝望的 Gibberish-Satterthwaite定理:

Gibberish-Satterthwaite定理另人绝望的原因是,它告诉我们:如果选项大于3,设计出不会被操纵,没有独裁的选择机制是不可能的。但是,我们真的就没有办法了吗? 也不是,在下几篇内容中,我们来看看还有什么骚操作。