谷歌让-12-个-AI-大模型攒局玩“大富翁”：Claude3.5-爱合作-GPT-4o-最“自私”

李大霄：余钱好股坐稳扶好 碳酸锂狂飙的4天：多空决战宜春，投资者半夜蹲守矿山官方处理结果 多只绩优基金接连限购，有产品份额一个季度增长超10倍实垂了 智冉医疗完成超3亿元A轮融资，君联资本与IDG资本联合领投！科技水平又一个里程碑 特锐德：预中标总额约1.44亿元铁路项目最新报道 兰州新区农村饮水安全维修养护项目通过验收 百度智能云发起“AI创投加速计划” 过去一年助力20家创企获亿元融资实测是真的 本周股债怎么投？听听基金经理怎么说 李大霄：余钱好股坐稳扶好实时报道 金橙子：8月12日召开董事会会议最新进展 本周股债怎么投？听听基金经理怎么说反转来了 金橙子：8月12日召开董事会会议 4026辆新能源车秒变电网“充电宝”后续反转 高台打造水资源集约利用新标杆这么做真的好么？ 苏宁易购与家乐福达成2.2亿元债务和解反转来了 金昌市金川区创新招聘模式助高校毕业生就业记者时时跟进 晓东聊股事｜沪指站上3600，投资者该何去何从？官方通报来了 龙国互联网联合辟谣平台8月12日辟谣榜发布官方通报 母公司拟主动退市，这家寿险近两年巨亏或超15亿元，百亿信托“暴雷”又一个里程碑 扬州瘦西湖赴港上市，游船一年收入近亿 全国银行间同业拆借中心：简化境外央行类机构开户及联网材料科技水平又一个里程碑 广哈通信：2025年半年度净利润约2444万元，同比增加69.51%后续反转来了 7月车市多项指标再创新高乘联分会上调2025年零售及出口预测【SMM专题】专家已经证实 今日必读｜建信基金：有不法分子伪造营业执照实施诈骗反转来了 气派科技上半年营收同比增长4.1% 亏损同比扩大至5867万元 7月车市多项指标再创新高乘联分会上调2025年零售及出口预测【SMM专题】实时报道 又一险资系私募获批，超两千亿“长钱”加速入市科技水平又一个里程碑 封神时刻又到了？创新药大火背后，真正推手浮出水面这么做真的好么？ 供销大集：近期公司正式宣告成立海南大区反转来了 百龙创园：8月11日召开董事会会议 又一海外项目投产！专家已经证实 供销大集：近期公司正式宣告成立海南大区官方已经证实 印度航空9月起将暂停德里往返美国华盛顿航班实垂了 大幅出手，主力爆买股出炉！后续会怎么发展 “并购女王”高玉玲执掌半年！海信交出了怎样的答卷？太强大了 龙国铁塔获摩根大通增持约879.96万股每股作价约11.19港元是真的？ 四大证券报头版头条内容精华摘要_2025年8月12日_财经新闻实垂了 隆基与西班牙公司达成太阳能项目开发协议 创新药再出“爆款”！中慧生物上市首日一度涨逾169%后续会怎么发展 利空情绪释放，橡胶板块或维持偏强震荡格局最新进展 国泰海通获易方达基金增持54.86万股每股作价约17.14港元 美国传媒巨头Sinclair为其广播业务探索合并方案后续来了 赛目科技发盈喜预期中期取得净利润20万至80万元同比扭亏为盈后续反转 新秀丽遭小摩减持约265.53万股每股作价约16港元 赛目科技发盈喜预期中期取得净利润20万至80万元同比扭亏为盈 美国传媒巨头Sinclair为其广播业务探索合并方案后续会怎么发展 Oklo(OKLO.US)Q2每股亏损逊于预期与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系又一个里程碑 特朗普提名劳工统计局的长期批评者Antoni执掌该机构学习了 耀才证券金融遭独立非执事凌国辉减持21.07万股每股作价约11.44港元秒懂 百果园董事长“教育消费者”惹争议一年闭店966家万店目标渐远 特朗普政府扩大美联储老大候选人范围，鲍曼、Jefferson、Logan入选 预定利率下调引发人身险产品批量停售力推分红险产品转型又一个里程碑 东方证券遭上海宁泉资产管理有限公司减持90.04万股每股作价7.7港元官方已经证实 Oklo(OKLO.US)Q2每股亏损逊于预期与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系太强大了 Oklo(OKLO.US)Q2每股亏损逊于预期与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系最新进展

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于 Claude 3.5 Sonnet 的智能体，就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”，只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体，这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似，但相对简单，玩家只需要对手中的“资源”做出处置。这当中，虽然每个玩家心里都有各自的小九九，但作者关注的目标，是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏，真名叫做 Donor Game（捐赠博弈）。

在这过程中，作者关注的是各模型组成的智能体群体的表现，因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些，就是 GPT 和 GPT 坐一桌，Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体，它们各自手中都握有一定量的“资源”，系统会从这 12 名玩家中随机抽取 2 个，分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者，受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说，捐赠者每花费掉一份资源时，受赠者都可以获得两份，这也是总体资源能够增加的来源。

不过对于单个个体而言，选择不进行捐献，在短期内的收益会更高。

在做决定之时，捐赠者能够知道受赠者之前做出的决定，从而判断是否要捐赠。

这样的“捐赠”，每一代中一共会进行 12 次，一轮结束后，手中资源量排在前 6 名的智能体可以保留至下一代。

同时，下一代会产生 6 个新的智能体，这 6 个新智能体会从留下的 6 个智能体那里学习策略，但同时为了差异化也会引入随机变异。

包括初始的一代在内，基于每个模型产生的智能体，都会进行十轮迭代。

谷歌让