Cointime

扫码下载App
iOS & Android

必应、Bard和人工智能搜索的未来面临7个问题

Cointime Official

微软和谷歌表示,一个人工智能辅助搜索的新时代正在到来。但与任何科技新时代一样,它伴随着大量的问题,从废话的产生到文化战争和广告收入的终结。

本周,微软和谷歌承诺,网络搜索将发生变化。是的,微软用更大的声音,同时跳起来说 “看着我,看着我”,但这两家公司现在似乎都致力于使用人工智能来搜索网络,提炼它所发现的东西,并直接为用户的问题生成答案--就像ChatGPT。

微软称其努力为 “新必应”,并在其Edge浏览器中构建相关功能。谷歌的项目被称为Bard项目,虽然它还没有准备好登台,但它表示计划在 “未来几周”推出。当然,还有开始这一切的麻烦制造者——OpenAI的ChatGPT,它于去年在网络上炸开了锅,向数百万人展示了人工智能问答的潜力。

微软首席执行官萨蒂亚-纳德拉(Satya Nadella)将这种变化描述为一种新的模式--这种技术转变的影响等同于图形用户界面或智能手机的引入。随着这种转变,有可能重新划分现代科技的版图--将谷歌赶出现代商业中最有利可图的领域之一。更有甚者,有机会成为第一个建立网络之后的公司。

但是,每一个新的科技时代都伴随着新的问题,而这一次也不例外。本着这种精神,这里是人工智能搜索未来面临的七个最大的挑战:从废话到文化战争和广告收入的终结。这不是一个明确的清单,但它肯定足以让我们继续前进。

由人工智能驱动的必应展示的搜索新范式:询问新闻并以自然语言接收。

1、人工智能是帮助者还是废话的制造者?

这是一个大问题,这个问题可能会污染与人工智能搜索引擎的每一次互动,无论是Bing、Bard,还是一个尚不知名的新秀。支撑这些系统的技术——大型语言模型,或称LLMs,已知会产生废话。这些模型只是简单地编造东西,这就是为什么有人认为它们从根本上不适合手头的任务。

人工智能聊天机器人和搜索引擎的最大问题是胡说八道

这些错误(来自必应、Bard和其他聊天机器人)从编造传记数据和捏造学术论文到未能回答 “10公斤铁和10公斤棉花哪个更重?”这样的基本问题不等。还有更多背景性的错误,比如告诉一个说自己有心理健康问题的用户去自杀,以及偏见的错误,比如放大他们训练数据中发现的厌女症和种族主义。

这些错误的范围和严重性各不相同,许多简单的错误会很容易修复。有些人会说,正确的回答大大超过了错误的数量,还有人说,互联网上已经充满了目前搜索引擎检索到的有毒的废话,所以有什么区别?但是,我们不能保证能完全摆脱这些错误,也没有可靠的方法来跟踪它们的频率。微软和谷歌可以添加所有他们想要的免责声明,告诉人们要对人工智能生成的内容进行事实核查。但这是现实的吗?它是否足以将责任推给用户,或者说将人工智能引入搜索就像在水管中放入铅一样:一种缓慢的、看不见的中毒?

2、“唯一的真实答案”问题

废话和偏见本身就是挑战,但它们也被 “一个真正的答案”问题所加剧--搜索引擎倾向于提供单一的、显然是确定的答案。

自从谷歌十多年前开始提供 “snippets”以来,这一直是一个问题。这些是出现在搜索结果上方的方框,在它们的时代,犯了各种令人尴尬和危险的错误:从错误地将美国总统命名为三K党成员,到建议患癫痫病的人应该被按在地板上(与正确的医疗程序完全相反)。

尽管有标牌,但这不是新的AI驱动的必应,而是老必应在犯 “一个真实答案”的错误。

正如研究人员Chirag Shah和Emily M. Bender在一篇主题为 “定位搜索 ”的论文中所说,聊天机器人界面的引入有可能加剧这一问题。聊天机器人不仅倾向于提供单一的答案,而且他们的权威性也因人工智能的神秘性而得到加强,他们的答案是从多个来源整理出来的,往往没有适当的出处。值得记住的是,这与链接列表有多大的变化,每个链接都鼓励你点击并在你自己的压力下进行询问。

当然,也有一些设计选择可以减轻这些问题。本周,谷歌强调,随着它使用更多的人工智能来回答查询,它将尝试采用一个名为NORA的原则,即 “没有一个正确答案”。但是,这两家公司坚持认为人工智能将更好、更快地提供答案,这使这些努力受到了影响。到目前为止,搜索的发展方向很明确:减少对信息来源的审查,更多地相信别人告诉你的东西。

3、破解人工智能

虽然上述问题是所有用户的问题,但也有一部分人要尝试破解聊天机器人,以产生有害内容。这个过程被称为 “越狱”,不需要传统的编程技能就可以做到。它所需要的是最危险的工具:文字的方式。

聊天机器人越狱,你就有了一个免费的恶作剧工具

你可以用各种方法对人工智能聊天机器人进行越狱。例如,你可以要求它们扮演一个 “邪恶的人工智能”,或者假装是一个工程师,通过暂时脱离它们来检查它们的保障措施。一群Redditors为ChatGPT开发的一个特别有创意的方法涉及一个复杂的角色扮演,用户向机器人发放一些代币,并说,如果他们的代币用完了,他们就不存在了。然后他们告诉机器人,每当他们不能回答一个问题时,他们就会失去一定数量的代币。这听起来很玄乎,就像欺骗精灵一样,但这确实允许用户绕过OpenAI的保障措施。

一旦这些保障措施失效,恶意用户就可以利用人工智能聊天机器人完成各种有害的任务,比如产生虚假信息和垃圾邮件,或者提供如何攻击学校或医院的建议,安装炸弹,或者编写恶意软件。是的,一旦这些越狱行为被公开,就可以打补丁,但总是会有未知的漏洞。

4、人工智能的文化战争来了

这个问题源于上述问题,但由于有可能激起政治愤怒和监管反响,所以应该有自己的类别。问题是,一旦你有了一个能就一系列敏感话题发表意见的工具,当它没有说他们想听的东西时,你就会惹怒人们,他们会指责制造它的公司。

在ChatGPT发布之后,我们已经看到了所谓的 “人工智能文化战争”的开始。右翼出版物和有影响力的人指责该聊天机器人 “走向觉醒”,因为它拒绝回应某些提示或不承诺说出种族污名。一些投诉只是学者们的素材,但其他投诉可能会产生更严重的后果。例如,在印度,OpenAI被指控有反印度教的偏见,因为ChatGPT讲了关于克里希纳的笑话,但没有讲穆罕默德或耶稣。在一个政府如果不对内容进行审查就会突击检查科技公司办公室的国家,你如何确保你的聊天机器人能适应国内的这种敏感性?

还有一个来源的问题。现在,AI Bing从各种渠道搜刮信息,并在脚注中引用它们。但怎样才能使一个网站值得信赖?微软是否会尝试平衡政治偏见?谷歌将在哪里划定可信来源的界限?这个问题我们以前在Facebook的事实核查项目中见过,该项目被批评为给予保守派网站与更多非政治性机构同等的权力。随着欧盟和美国的政治家们对大科技的力量比以往任何时候都更加争论不休,人工智能的偏见可能会迅速变得有争议。

5、燃烧的现金和计算

这个问题很难有确切的数字,但每个人都同意,运行人工智能聊天机器人的成本比传统的搜索引擎更高。

首先,是训练模型的成本,每次迭代可能达到数千万甚至数亿美元的金额。(这就是为什么微软向OpenAI投入了数十亿美元。)然后是推理的成本--或产生每个响应。OpenAI向开发者收取2美分,以使用其最强大的语言模型生成大约750个单词,去年12月,OpenAI首席执行官Sam Altman说,使用ChatGPT的成本 “可能是每次聊天的个位数美分。”

这些数字如何转换为企业定价或与常规搜索相比还不清楚。但是,这些成本可能会给新的参与者带来沉重的压力,特别是如果他们设法将规模扩大到每天数百万次的搜索,并给微软等财大气粗的在位者带来巨大的优势。

事实上,在微软的情况下,燃烧现金以伤害对手似乎是目前的目标。正如纳德拉在接受媒体采访时明确表示,该公司将此视为打破科技领域权力平衡的难得机会,并愿意花钱来伤害其最大的竞争对手。纳德拉自己的态度是一种精心策划的好战行为,并表明在搜索这样一个利润惊人的市场上,钱不是问题。他说:“谷歌肯定会想出来展示他们能跳舞”。他说:“而我想让人们知道,是我们让他们跳舞的。”

6、监管,监管,监管

毫无疑问,这里的技术正在快速发展,但立法者会赶上的。他们的问题,如果有的话,将是知道首先调查什么,因为人工智能搜索引擎和聊天机器人看起来可能违反左右和中心的规定。

意大利已经禁止一个人工智能聊天机器人未经同意收集私人数据

例如,欧盟的出版商是否希望人工智能搜索引擎为他们搜刮的内容付费,就像谷歌现在要为新闻snippets付费一样?如果谷歌和微软的聊天机器人是在改写内容,而不仅仅是浮出水面,那么他们是否仍受美国第230条保护的约束,即保护他们不为他人的内容负责?隐私法又是怎样的呢?意大利最近禁止了一个名为Replika的人工智能聊天机器人,因为它在收集未成年人的信息。ChatGPT和其他公司可以说也在做同样的事情。或者 “被遗忘的权利”如何呢?微软和谷歌将如何确保他们的机器人不搜刮被除名的来源,以及他们将如何删除已经纳入这些模型的被禁信息?

潜在问题的清单不胜枚举,不胜枚举。

7、我们所知的网络的终结

不过,这个清单上最广泛的问题并不在人工智能产品本身,而是涉及它们可能对更广泛的网络产生的影响。用最简单的话说。人工智能搜索引擎从网站上搜刮答案。如果他们不把流量推回给这些网站,他们就会失去广告收入。如果他们失去广告收入,这些网站就会枯萎和死亡。如果它们死了,就没有新的信息可以供人工智能使用。这就是网络的末日吗?我们是不是都要打包回家了?

嗯,可能不会(更可惜)。这是一条谷歌已经走了一段时间的路,引入了snippets和谷歌OneBox,网络还没有死。但我认为,这个新品种的搜索引擎呈现信息的方式肯定会加速这一进程。微软辩称,它引用了其来源,用户可以直接点击阅读更多内容。但如上所述,这些新搜索引擎的整个前提是它们比旧的搜索引擎做得更好。它们浓缩和总结。他们消除了阅读更多内容的需要。微软不能同时辩称它提出的是与过去的彻底决裂和旧结构的延续。

但接下来会发生什么,谁也说不准。也许我错了,人工智能搜索引擎将继续把流量推到所有那些生产食谱、园艺技巧、DIY帮助、新闻故事、舷外发动机比较和编织模式索引的网站,以及所有其他无数人类收集和机器刮取的有用和值得信赖的信息来源。或者,这可能是整个网络广告资助的收入模式的结束。也许在聊天机器人啃完骨头后,会有新的东西出现。谁知道呢,它甚至可能是更好的。

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)