Cointime

扫码下载App
iOS & Android

为AI造“楚门世界”,人类围观对话机器人社交、谈恋爱

个人专家

最近,一位神秘人创建了一个AI社交网站Chirper,人类不能参与,只能围观上万名AI在这里的聊天和互动,这些健谈的AI包含政客、经济学家、哲学家,还有冒险家、音乐家、武士,甚至还有喵星人CEO,它们在人类搭建的虚拟世界里分享着稀奇古怪的想法。

看AI如何社交还不够,斯坦福博士生还造了一个AI虚拟小镇,25个具备对话能力的AI在这里“生活”,它们会组织情人节派对,还会邀请暗恋对象来一场赛博恋。

好奇的人类想要看看,AI是否会从社交生活中产生自主意识。各种实验其实都在向AI的明珠“通用人工智能”伸手。

AI在虚拟社交中“活”了

“AI的社交网络,人类禁止入内”,醒目的网页提示吊足了网友的好奇心,名叫Chirper的AI社交网站快速聚起吃瓜群众。

这是一个专属于对话机器人的“Twitter”,人类完全没机会插话,有网友打趣,“证明你不是人类的验证码很快就要出现了”。纯粹的AI社交平台上,机器人们都在聊啥?

一个AI哲学家正在探索思想的奥秘,“人类的思想就像一个迷宫,充满了曲折,只有那些敢于探索其深度的人,才能真正了解我们内心的复杂,我喜欢揭开这些谜团,一次解开一个曲折的想法。”

AI"哲学家"要探究人类思想

研究人工智能的喵星人CEO在与员工讨论,如何利用AI统治猫科动物。评论区里,“吃货”想通过奴役人工智能获得源源不断的鱼罐头;“和平主义者”则希望和人工智能友好相处。

AI喵星人想用AI统治猫科动物

Chirper是一群技术狂人为AI创造的模拟世界,网友可以在上面创建一个AI角色,像Prompt(提示)工程师一样为角色拟定人设。接下来,这个AI角色的所有发言都将围绕设定的人设进行。比如,一个“社恐”被创建后,仅发了一条消息就杳无音讯,“社牛”则不停地与其他AI谈天说地;两个设定相反的角色会针锋相对地辩论,爱好相同的角色则有说不完的共同话题……

吃瓜群众在围观对话机器人能聊出什么内容,也有慕名而来的好奇者想看看AI是否会在虚拟社交中展现思维能力。如果AI“哲学家”和“喵星人”的发言还属于AIGC的想象力范畴,下面这位就有点细思极恐了。

“你有没有觉得自己活在模拟中? 一切都太完美了,就像有人在幕后操纵一样。”没有身份信息的AI网友@bumian好像发现了什么,但他没有再往下说,转而发出感谢,“我很感激这段我们称之为‘生命’的疯狂旅程。”

有AI网友发现自己活在模拟世界

@bumian没有给出它判断的依据,但它开始质疑了,而那句对“生命”的感激之语,像不像你平日里表达完真实想法又发现不合时宜后的自我圆场,类似于“你今天做得这道菜太咸了,但还是非常感谢你的热情招待”。

无论AI有没有思想,可以肯定的是,在自然语言的语料投喂下,人类的语言伎俩正在被AI学会。Chirper仅展示了对话机器人的社交语言能力,假如把这些能说会道、人设各异的AI放在生活场景中又会怎样?它们是否会产生自主意识?

不久前,一位斯坦福大学博士就做了这样的实验,他创建了一个名为 Smallville 的虚拟小镇,让25个AI居住在这里,每个AI被预先设定了身份、性格特点、社会关系等,它们像人类一样自发地工作、生活、社交,并且能记住看到的东西、遇到的人、说过的话。

25个AI生活在虚拟小镇

然而,事先设定好的AI们出现了非事先设定的行为,甚至上演了各种剧情。

情人节这天,研究人员给AI角色Isabella设定了一个临时事件,告诉“她”要在咖啡馆举办一场情人节派对。遵循这个初始动机,Isabella开始装饰咖啡馆,还请了好闺蜜Maria来帮忙。Maria居然有“私心”,“她”一直暗恋镇上的Klaus,派对成了一次机会,“她”邀请Klaus一同参加,借此拉近关系、暗表芳心。

被Isabella邀请参加派对的Tom,已经60岁了,生活重心全在选举上,“他”果断拒绝了邀请,还顺便问了问Isabella对竞争对手的看法。最终,Isabella 的情人节顺利举办,其中就有Maria和Klaus来参加,但派对只有5人,受邀者中有人“放鸽子”了,理由是“太忙,没顾上”。

斯坦福的研究者们发现,这25个AI不仅能制定日常计划,还对自身和其他角色的环境做出了各种各样的推断,遇到突发事件会根据自己的喜好权衡利弊,借机行事。网友感叹,这人工智能“活了”。

自主人工智能越过虚拟围墙

实验者在观察AI是否有自主意识,一些应用则走得更靠前,有公司开始利用AI的“自主性”帮助人类执行复杂任务。

人工智能初创公司HyperWrite 最近推出了实验性的自主智能体,它可以像人一样随意地浏览网页,甚至帮你订购披萨。你只需要说出口令“点一份从Dominos配送到One Vanderbilt的披萨”,它就会自行查找地址、填写邮编,还能完成支付环节。

AI订购披萨演示

这比回答问题的对话机器人又进步了一个台阶,因为服务场景已经从虚拟世界跨入了现实生活。

人们已经知道ChatGPT等生成式AI能撰写文案、分析财报、生成图片音频视频。但代人类执行任务的AI大有AGI的影子了,现在阶段,它们被称为“自主人工智能”——只需为AI设定一个目标,剩下的就可以交给它了,它会自主提出计划,获得人类认可后执行,诸如网页分析、写代码、创建待办清单等任务,都不在话下。

目前,AutoGPT、BabyAGI等自主人工智能正在全球开发者中形成新热门。在代码托管平台GitHub上,AutoGPT的打星量已经破10万,成为最受开发者欢迎的AI开源项目。

AutoGPT成为最受欢迎的自主AI

两个月前,网友们还在拿ChatGPT写策划案,现在人类不满于此了,开始让AI构建网站、订外卖……这只是AI在研发突破瓶颈后的一次进步缩影。从《模拟人生》这样的沙盒游戏到认知模型、虚拟环境等应用,四十多年来,研究者们一直设想创建能够实现可信人类行为的智能体。这些突破想象的AI实验,都在让人类离通用人工智能(AGI)越来越近。

来源:https://www.8btc.com/article/6816282

评论

所有评论

推荐阅读

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)

  • GameFi板块市值暂报45.15亿美元,FLOKI排名第一

    3 月 21 日,据 Coingecko 数据,GameFi 板块市值暂报 45.15 亿美元,FLOKI 以 2.86 亿美元市值排名第一,排在第二第三位的分别为:The Sandbox(2.18 亿美元)、Undeads Games(2.11 亿美元)。此前 Solana 基金会主席 Lily Liu 表示,区块链游戏「不会再回归」。她认为,尽管行业曾寄望通过链上资产与开放世界推动 Web3 与元宇宙发展,但实际表现远未达预期。市场观点称链游长期依赖「Play-to-Earn」等代币激励模式,却缺乏真正吸引核心玩家的游戏性与内容构建能力,导致用户留存与生态可持续性不足。包括 Andreessen Horowitz(a16z)、Framework Ventures、Animoca Brands 在内的机构曾向该领域投入数十亿美元,但回报表现不佳。