Cointime

扫码下载App
iOS & Android

全同态加密如何解决 LLM 的隐私问题

项目方

撰文:Ingonyama

人工智能的崛起令人惊叹。从基本的算法,到如 ChatGPT 和 Copilot 这样的语言学习模型 (LLMs),人工智能已处于技术演进的前沿。随着这些模型与用户互动并处理大量数据和提示,数据隐私问题变得尤为重要。其中亚马逊和苹果等大公司已经限制员工访问 ChatGPT 等公共 API,来防止可能因 AI 交互而导致的数据泄露。此外,可以合理地预测,相关法规将很快出台,以强制要求一定程度的用户隐私保护。

我们如何确保与这些模型的交互、提问和共享的数据保持隐私呢?

全同态加密(FHE)简介

在密码学领域,全同态加密是一个开创性的概念。它的魅力在于其拥有的一种独特能力:它允许直接对加密的数据进行计算,而不需要先对数据解密,从而实现了对敏感信息的隐私推理。

借助这种特性可以确保两个重要的事情:数据在处理过程中保持安全,以及对模型知识产权(IP)的完全保护。

‍隐私推理与知识产权保护‍

如今,「隐私」和「用户体验」似乎是鱼和熊掌的关系,二者不可得兼。人们往往为了更好的用户体验,信任第三方去处理他们的信息。我们相信,这些第三方公司能够在用户隐私与优质的用户服务之间找到一个平衡点,而不必在隐私性更高但缺少功能的本地解决方案或牺牲隐私以获得丰富功能的服务之间做出选择。

全同态加密能够在完全保护模型知识产权的情况下实现隐私推理。通过对加密数据进行计算,它可以确保提示词完全保密,同时还能保护大语言模型的知识产权。

传统加密方法 VS FHE

在传统的加密方案中,如果要对加密形式下的数据进行有意义的运算,首先需要对其进行解密。但是解密就会暴露数据明文,这意味着数据将变得脆弱,易受到攻击,哪怕只是一瞬间的解密。

相比之下,全同态加密可以直接对密文进行运算,确保敏感信息在整个运算过程中处于「不可见」的状态。

为什么 FHE 很重要

全同态加密的重要性不仅限于理论。想象一下在云计算服务中,可以在不解密数据的情况下进行数据处理,或者医疗数据库可以在不获取敏感患者详细信息的情况下进行分析。全同态加密的潜在应用非常广泛且多样化,包括安全投票系统和对加密数据库进行隐私搜索等

FHE 的数学基础

全同态加密基于容错学习(LWE)问题,这是一种格密码学技术,具有抗量子性。在 LWE 中,利用随机噪声使数据变得不可读,除非拥有密钥。对加密数据进行算术运算是可能的,但这通常会增加噪声水平。如果连续进行过多的运算,任何人都无法读取数据,包括持有密钥的人。这就是部分同态加密(SHE)。

而要将部分同态加密转换为全同态加密,需要一种能降低噪音水平的操作。这种操作被称为「自举」(Bootstrapping),多种全同态加密方案都采用了自举操作。在本文中,我们将重点讨论环面上的全同态加密方案 (Torus FHE),它利用数学环面的代数结构来实现全同态加密。

TFHE 的优点

尽管每种全同态加密方案都有自己的优缺点,但在实际场景中,TFHE 目前拥有更高效的实现。TFHE 的另一个重要优势在于其可编程自举(Programmable Bootstrapping,PBS),它将通常的自举操作扩展到包括对单变量函数的计算,例如在机器学习领域中至关重要的激活函数。

TFHE 的一个劣势是在计算中每执行一次算术运算都需要执行一次 PBS 操作,而其他方案则允许在自举操作之间批量执行一些操作。

假设与近似

为了估计使用全同态加密进行大语言模型 (LLM) 推理所需的时间,我们做出一些假设来评估:

  • 每个 Token 所需的算术操作次数大约是模型中参数数量的 1–2 倍。这是一个下限,因为每个 Token 都使用了整个模型,我们将假设这个下限足够接近实际需求。
  • 大语言模型中的每个算术操作都可以映射到 TFHE 中的一个算术操作。这基本上是两种方案中变量类型大小的说明。我们假设对于大语言模型来说,INT4 变量足够,并且对于 TFHE 来说是可行的。
  • 大语言模型中的每个算术操作都需要映射到全同态加密中的一个算术操作。这意味着我们不能在未加密的情况下运行模型的一部分。Zama 最近的一篇博文考虑了不使用这个假设的 FHE 推理,其中大部分模型由用户在本地执行,没有任何加密,只有一个小部分(例如单个注意力头)在模型的公司服务器上使用全同态加密运行。我们认为,这种方法实际上并没有保护模型的知识产权,因为在这种情况下,用户可以只运行缺失的头部,并且只有轻微的精度损失,如此处所示,或者对缺失部分进行相对廉价的训练,以获得与原始模型相当的结果。
  • TFHE 中的每个算术操作都需要进行一次 PBS(可编程自举)。PBS 是 TFHE 计算的主要瓶颈。
  • 目前最先进的 TFHE 实现是 FPT。这是一种 FPGA 实现,以每 35 微秒计算一次 PBS。

LLM 和 FHE 的挑战

随着最新技术的进展,目前最好的全同态加密实现可以在仅需 35 微秒的时间内执行一次算术操作。然而,当考虑到像 GPT2 这样复杂的模型时,单个 Token 需要进行惊人的 15 亿次操作。这意味着每个 Token 的处理时间约为 52,000 秒。

为了更好地理解,对于语言模型来说,一个 Token 可以表示一个字符或一个完整的单词等内容。想象一下与一个语言模型进行交互,其中响应时间需要一两个星期!这是不可接受的,这样的延迟显然对于实时通信或模型的任何实际应用都是不可行的。

这显示了在当前的全同态加密技术下,对于大规模的语言模型来说,实现实时推理仍然是一个巨大的挑战。尽管全同态加密在数据保护方面具有重要意义,但在需要高度计算密集型的任务中,其性能限制可能使其难以应用于实际场景。对于实时交互和快速响应的需求,可能需要探索其他的安全计算和隐私保护解决方案。

潜在的解决方案

为了使全同态加密应用到大语言模型中,以下是一个可能的路线图:

使用多机器实现并行处理:

  • 起始为 52,000 秒 /Token。
  • 通过部署 10,000 个并行机器,我们将时间缩短到 5 秒 /Token。请注意,大语言模型确实可以高度并行化,目前的推理通常在数千个或更多的 GPU 核心上并行执行。

过渡到先进的硬件:

  • 从改进后的 -- 起始为 5 秒 /Token
  • 切换到 GPU 或 ASIC,我们可以实现每个 Token 0.1 秒的处理时间。虽然 GPU 可以在速度上提供更直接的收益,但 ASIC 在速度和功耗方面都可以提供更高的收益,例如之前 Blog 提到的 ZPU 就是这样的例子。

正如图所示,使用现有的数据加速技术,通过全同态加密可以实现大语言模型的私有推理。通过在足够大的数据中心中进行大规模但可行的初始投资,可以支持这一点。然而,这种可能性仍然是微乎极微的,并且对于更大的大语言模型,如 Copilot(120 亿参数)或 GPT3(1750 亿参数),仍存在差距需要弥补。

对于 Copilot 来说,较小的 Token 吞吐量就足够了,因为它生成的是代码输出,通常比人类语言更简洁。如果我们将吞吐量要求降低 8 倍,那么 Copilot 也能达到可行性的目标。

最后的差距可以通过组合更大规模的并行化、更好的实现以及在全同态加密中进行引导的更高效算法来弥补。在 Ingonyama,我们相信算法是弥合这一差距的重要组成部分,我们的团队目前正专注于相关算法的研究和开发。

总结

全同态加密的安全性和大语言模型的计算能力的结合可以重新定义人工智能交互,确保效率和隐私两者兼顾。虽然存在一些挑战,但通过持续的研究和创新,我们可以实现与 AI 模型(如 ChatGPT)的交互既具有即时性又具有隐私性的未来。这将为用户提供更高效和安全的体验,并推动人工智能技术在各个领域的广泛应用。

评论

所有评论

推荐阅读

  • 以太坊上假冒NOT代币发生Rugpull

    据PeckShield监测,以太坊上假冒Notcoin NOT下跌100%。0xE0eB开头地址抛售了 1,645,040,633,338,481.95枚NOT并兑换为93.5枚WETH(价值28.13万美元)。 注:Rugpull代币与合法代币名称相同。

  • 瑞士联邦委员会计划实施加密资产报告框架以提高税收透明度

    瑞士联邦委员会(由七名成员组成,共同领导瑞士政府)打算实施加密资产报告框架(CARF),以提高税收透明度。15 日,联邦委员会发布了一份咨询文件,以调查加入国际税务机关合作打击偷税漏税的自动信息交换(AEOI)的民意。目前,瑞士加入 AEOI 的时间定于 2026 年 1 月 1 日。据悉,经合组织(OECD)为 20 国集团(G20)国家建立了 AEOI 和其他倡议,后来扩大到包括其他国家。瑞士此前在 2014 年采用了经合组织的共同报告标准(CRS),但未纳入监管加密资产及其提供商处理的 CARF。(Cointelegraph)

  • 埃及RWA金融科技初创公司Mnzl完成350万美元种子轮融资,P1 Ventures等领投

    金色财经报道,埃及RWA金融科技初创公司Mnzl宣布完成350万美元种子轮融资,P1 Ventures、Localglobe 和 Ingressive Capital领投,500 Global、Flat6Labs、First Circle Capital、Enza Capital、Beenok和一批未透露姓名的天使投资人参投。Mnzl 允许用户将汽车和房地产等非流动资产转换为流动资产,并将资产上传到数字钱包进行管理。

  • 4月加密项目融资额增环比增长3.8%至13.6亿美元

    Messari 发布 2024 年 4 月融资报告。2024 年 4 月,加密货币项目融资交易额环比增长 3.8%,达到 13.6 亿美元,自 2023 年 8 月低点(3.72 亿美元)以来持续 8 个月的增长趋势;但融资交易数量下降 16.7%,仅 259 笔。4 月网络领域的投资额占总投资额的 37.7%,大额融资项目包括 Monad(融资 2.25 亿美元)等。值得注意的是,4 月比特币 Layer2 项目激增,多个项目从隐身模式中脱颖而出。金融和基础设施领域也出现显著的融资活动,与前几个月相比,资本在各个类别中的分布更加均衡。

  • 摩根士丹利披露其对灰度GBTC投资近2.7亿美元,成为最大持有者之一

    5月16日消息,摩根士丹利(Morgan Stanley)在Q1提交给SEC的13F文件中披露,其通过灰度GBTC向现货比特币ETF投资了2.699亿美元。根据Fintel的数据,这笔投资使其成为继Susquehanna International Group(投资10亿美元)之后,GBTC的最大持有者之一。 摩根士丹利也是众多披露了对现货比特币ETF投资的全球系统重要性银行(G-SIB)之一,其他银行包括加拿大皇家银行、摩根大通、富国银行、法国巴黎银行和瑞银集团。

  • Coinbase计划为澳大利亚自助养老金部门提供服务

    Coinbase计划为澳大利亚的自助养老金部门提供服务。交易所亚太区总经理John O’Loghlen告诉彭博社:“我们不认为这会损害ETF玩家的利益。”Coinbase正在开发一项专门针对澳大利亚自助养老金部门的服务。自2019年3月以来,澳大利亚的自助基金越来越多地持有加密货币。根据澳大利亚税务局的最新数据,近10亿澳元(6.64亿美元)用于加密货币。成千上万的澳大利亚人使用自助养老金基金押注加密货币,甚至在2023年3月据路透社报道,有人损失了数百万美元。

  • 美国立法者:美SEC应在参议院投票前废除加密会计政策

    美国立法者 Wiley Nickel 在 5 月 15 日致美国证券交易委员会(SEC)主席 Gary Gensler 的一封信中表示,美 SEC 应在参议院投票前废除加密会计政策(SAB 121)。保护投资者是美国证券交易委员会的使命,然而 SAB 121 恰恰相反,它阻止了受到严格监管的美国银行大规模托管数字资产。此外,Wiley Nickel 批评美 SEC 在发布 SAB 121 时绕过了规则制定程序,他认为加密会计政策的目的是澄清现有政策,而不是制定新政策。 此前消息,白宫于 5 月 8 日发布「政府政策声明」表示,限制美 SEC 为加密资产维持全面有效的金融监管框架的能力,将带来严重的金融不稳定和市场不确定性。

  • 天津市公安局河东分局:正在推进蓝天格锐非法集资案各项追逃追赃工作

    5月16日消息,天津市公安局河东分局发布案情通报称,其对天津蓝天格锐电子科技有限公司涉嫌非法吸收公众存款案立案侦查以来,通过国际刑警组织对主要犯罪嫌疑人钱志敏发布红色通报,开展全球缉捕,并通过国际执法合作渠道持续同英国等国家相关执法部门开展国际追逃追赃协作。同时提示集资参与用户配合依法办案,通过合法途径表达诉求。 此前消息,英国 6 万枚比特币洗钱案、天津蓝天格锐 430 亿元非法集资案主犯钱志敏(曾化名 Yadi Zhang)中国在逃 7 年、英国在逃 4 年后,近日在英国归案。她的助理、英国洗钱案共犯温俭,此前已被捕受审,将于伦敦当地时间 5 月 10 日宣判。

  • 比特币单日涨幅超7.5%,系近两个月以来最大涨幅

    比特币周三创下近两个月来最大单日涨幅,原因是疲弱的美国经济数据加大了美联储在夏季降息的可能性。根据 TradingView 和 CoinDesk 的数据,按市值计算,比特币昨日上涨了 7.5%以上,达到 66250 美元,这是自 3 月 20 日以来的最大涨幅。与其他风险资产一样,比特币对主要央行货币政策立场的预期变化和预计法定货币借贷成本下降时的反弹非常敏感。(CoinDesk)

  • 安徽启动“皖剑-2024”拟重点查处虚拟货币、挖矿机、区块链、炒外汇等网络传销活动

    据安徽日报消息,安徽省委政法委、省市场监管局、省公安厅联合印发通知,从5月13日起至12月10日,在全省范围内开展打击传销“皖剑-2024”行动,其中将重点查处打着“区块链”“元宇宙”“数字资产交易”等旗号,开展虚拟货币、挖矿机、区块链、炒外汇等运作的矿币链通型网络传销活动。