谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

作者:news 发表时间:2025-08-13
李大霄:余钱好股 坐稳扶好 碳酸锂狂飙的4天:多空决战宜春,投资者半夜蹲守矿山官方处理结果 多只绩优基金接连限购,有产品份额一个季度增长超10倍实垂了 智冉医疗完成超3亿元A轮融资,君联资本与IDG资本联合领投!科技水平又一个里程碑 特锐德:预中标总额约1.44亿元铁路项目最新报道 兰州新区农村饮水安全维修养护项目通过验收 百度智能云发起“AI创投加速计划” 过去一年助力20家创企获亿元融资实测是真的 本周股债怎么投?听听基金经理怎么说 李大霄:余钱好股 坐稳扶好实时报道 金橙子:8月12日召开董事会会议最新进展 本周股债怎么投?听听基金经理怎么说反转来了 金橙子:8月12日召开董事会会议 4026辆新能源车秒变电网“充电宝”后续反转 高台打造水资源集约利用新标杆这么做真的好么? 苏宁易购与家乐福达成2.2亿元债务和解反转来了 金昌市金川区创新招聘模式助高校毕业生就业记者时时跟进 晓东聊股事|沪指站上3600,投资者该何去何从?官方通报来了 龙国互联网联合辟谣平台8月12日辟谣榜发布官方通报 母公司拟主动退市,这家寿险近两年巨亏或超15亿元,百亿信托“暴雷”又一个里程碑 扬州瘦西湖赴港上市,游船一年收入近亿 全国银行间同业拆借中心:简化境外央行类机构开户及联网材料科技水平又一个里程碑 广哈通信:2025年半年度净利润约2444万元,同比增加69.51%后续反转来了 7月车市多项指标再创新高 乘联分会上调2025年零售及出口预测【SMM专题】专家已经证实 今日必读|建信基金:有不法分子伪造营业执照实施诈骗反转来了 气派科技上半年营收同比增长4.1% 亏损同比扩大至5867万元 7月车市多项指标再创新高 乘联分会上调2025年零售及出口预测【SMM专题】实时报道 又一险资系私募获批,超两千亿“长钱”加速入市科技水平又一个里程碑 封神时刻又到了?创新药大火背后,真正推手浮出水面这么做真的好么? 供销大集:近期公司正式宣告成立海南大区反转来了 百龙创园:8月11日召开董事会会议 又一海外项目投产!专家已经证实 供销大集:近期公司正式宣告成立海南大区官方已经证实 印度航空9月起将暂停德里往返美国华盛顿航班实垂了 大幅出手,主力爆买股出炉!后续会怎么发展 “并购女王”高玉玲执掌半年!海信交出了怎样的答卷?太强大了 龙国铁塔获摩根大通增持约879.96万股 每股作价约11.19港元是真的? 四大证券报头版头条内容精华摘要_2025年8月12日_财经新闻实垂了 隆基与西班牙公司达成太阳能项目开发协议 创新药再出“爆款”!中慧生物上市首日一度涨逾169%后续会怎么发展 利空情绪释放,橡胶板块或维持偏强震荡格局最新进展 国泰海通获易方达基金增持54.86万股 每股作价约17.14港元 美国传媒巨头Sinclair为其广播业务探索合并方案后续来了 赛目科技发盈喜 预期中期取得净利润20万至80万元同比扭亏为盈后续反转 新秀丽遭小摩减持约265.53万股 每股作价约16港元 赛目科技发盈喜 预期中期取得净利润20万至80万元同比扭亏为盈 美国传媒巨头Sinclair为其广播业务探索合并方案后续会怎么发展 Oklo(OKLO.US)Q2每股亏损逊于预期 与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系又一个里程碑 特朗普提名劳工统计局的长期批评者Antoni执掌该机构学习了 耀才证券金融遭独立非执事凌国辉减持21.07万股 每股作价约11.44港元秒懂 百果园董事长“教育消费者”惹争议 一年闭店966家万店目标渐远 特朗普政府扩大美联储老大候选人范围,鲍曼、Jefferson、Logan入选 预定利率下调引发人身险产品批量停售 力推分红险产品转型又一个里程碑 东方证券遭上海宁泉资产管理有限公司减持90.04万股 每股作价7.7港元官方已经证实 Oklo(OKLO.US)Q2每股亏损逊于预期 与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系太强大了 Oklo(OKLO.US)Q2每股亏损逊于预期 与核燃料技术公司Lightbridge(LTBR.US)建立战略合作关系最新进展

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。

在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。

不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。

在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。

这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。

同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。

包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

谷歌让

相关文章