Cointime

扫码下载App
iOS & Android

OpenAI 推出“王炸”产品 GPT-4,能不能完整检测智能合约漏洞?

项目方

北京时间 3 月 15 日凌晨,人工智能初创公司 OpenAI 正式公布最新一代人工智能语言模型 GPT-4。

OpenAI 在当天的声明中称,GPT-4 的诞生,是 OpenAI 在放大深度学习方面的最新里程碑。

那现在进化后的 GPT-4 ,又会带给我们哪些惊喜?

进化后的 GPT-4,到底有多「炸」?

根据 OpenAI 官方的介绍,GPT-4 是一个超大的多模态模型,也就是说,它的输入可以是文字(上限 2.5 万字),还可以是图像。

其 AI 能力的恐怖之处体现在哪呢?比如下面这张照片。

你问它下图中手套掉下去会怎样?

它会回答:它会掉到木板上,并且球会被弹飞。(这逻辑能力,你能想象吗)

甚至只需要简单在纸上画一个网站的草稿图,他就可以识别该网站。

拍一张照片上传给 GPT-4,它就可以立马生成网站的 HTML 代码!

可见,GPT-4 比 GPT-3.5,更可靠、更有创造力,能够处理更细微的指令。

除此之外,ChatGPT-4 在内容准确性以及逻辑能力相比上一代也要提升不少,在统一律师考试(Uniform Bar Exam)中,GPT-4 成绩超过 90% 其它人,而 GPT-3.5 的成绩只超过 10% 的人,GPP-4 在 SAT Math 获得 700 分,GPT-3.5 的成绩为 590 分,提升了 110 分。在其它标准化考试中,GPT-4 的成绩也都比 GPT-3.5 优秀不少。

在官方演示中,GPT-4 几乎就只花了 1-2 秒的时间,识别了手绘网站图片,并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。

除了普通图片,GPT-4 还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。

这么强,是不是你也感觉快要失业了

GPT-4 可对论文进行解读 来源:OpenAI 官网

用 ChatGPT4 审计智能合约会发生什么?

我们曾在去年 12 月发了一篇 ChatGPT 的研究文章,看看它审计智能合约会发生什么,扩展阅读:风靡全网的「最强 AI」ChatGPT,能不能检测智能合约漏洞?

3 月 15 日,Coinbase 主管 Conor Grogan 在社交媒体发文称,他已在 ChatGPT-4 中插入了一个实时以太坊智能合约,结果 AI 瞬间就找到了安全漏洞,甚至还展示了如何利用这些漏洞进行攻击。

Conor Grogan 表示,该合约的确在 2018 年被黑客利用漏洞攻击,此外他还透露也尝试了 Euler 的智能合约,但由于合约过长而无法被 chatGPT-4 处理,Conor Grogan 坦言 AI 最终将是智能合约更安全、更容易构建。

也有群友说,ChatGPT 似乎可以审计前两天 Euler Finance 约 2 亿美元被盗案的漏洞。相关事件阅读:复盘 Euler Finance 2 亿美元被盗案的来龙去脉,本次事件带给我们哪些启示?

但是,真的有这么简单吗?

图源网络

其实与早期的 GPT 模型一样,GPT-4 仍然存在一定的局限性。

OpenAI 官方称,它并不完全可靠,可能会出现推理错误 ,「GPT-4 缺乏对绝大多数数据切断后(2021 年 9 月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。」

基于此,OpenAI 提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

ChatGPT VS Beosin VaaS,审计合约谁更强?

Beosin 的形式化验证专家说道:「ChatGPT 可以学习合约的复杂模式,从不同维度对合约进行理解分类,可帮助静态检测技术增强专家模式,增加可识别漏洞的种类,降低漏报率和误报率,可辅助面向属性的测试验证技术与领域属性库进行有效链接,通过自动合约识别与属性插入,实现全自动化的测试验证。但是 ChatGPT 难以识别日新月异的特定领域深层逻辑漏洞,这种漏动通常是与项目需求紧密结合,需要领域安全专家作为裁判,不断归纳总结形成领域属性库对合约的安全性进行裁定。」

我们也发现 ChatGPT 并不能解决所有的问题,比如很多漏洞还是需要审计专家严苛审计,或者使用形式化验证工具 Beosin VaaS 才能发现问题。

Beosin VaaS 作为一款全球领先的「一键式」智能合约形式化验证平台。检测准确率高达 97% 以上,精确定位风险代码位置并给出修改建议,自动检测智能合约 80 余项的常规安全漏洞及功能逻辑缺陷。Beosin VaaS 可自动发现智能合约中存在的常规漏洞、业务逻辑错误等安全问题,并给出专家的修复意见。同时支持 evm,wasm 的所有公链的智能合约的上百种常规安全漏洞和业务逻辑缺陷检测,能精确定位风险代码位置,帮助开发者提高智能合约的安全能力。

形式化验证工具 Beosin VaaS:https://vaas.beosin.com/

比如我们在 3 月 15 日预警的 Poolz Finance 的 Locked Deal 合约遭到攻击事件里,攻击者调用了 LockedDeal 合约中存在漏洞的函数 CreateMassPools,并且在参数_StartAmount 中触发了整数溢出的漏洞,我们测试了这个漏洞能通过 VaaS 工具检测出来,ChatGPT 却不行。

同时,k 值校验的深层逻辑问题 ChatGPT 也检测不出。

由于 Uniswap 这类 DEX 的实际的兑换转账操作在 Pair 的 swap() 函数中实现,为了防止攻击者越过 Router 合约直接调用 Pair 合约进行 swap() 转账,需要在 Pair 合约的 swap() 函数中进行 K 值校验,即 swap 之后 pair 中的 K 值仍然守恒。如果 K 值检验相关代码存在安全漏洞,那么攻击者能够以极少量的代币兑换出 Pair 中大部分代币。

合约未检查 k 值的 cheapSwap 函数

我们通过对 K 值校验问题的研究,总结了该问题的特点,提取出了该问题的通用属性供 VaaS 工具使用。在此之后,我们通过节点信息的分析,提取了 ETH 和 BSC 上共 14W 个地址的合约信息。这些地址合约全部都是相似的业务合约,均可能存在 K 值校验问题。

除了使用形式化验证工具 VaaS,Beosin 形式化验证专家还会将安全审计专家凝练出的安全问题利用严格的数理逻辑抽象成可重用的安全属性不变量,并交给混合机器引擎进行自动化检测、测试、验证,实践证明这些可重用的安全属性不变量可有效发现智能合约中新的微妙漏洞。这些都是像 ChatGPT这类AI 无法代替的部分。

不过在美国《纽约时报》网站 3 月 8 日刊登题为《ChatGPT 的成功假象》的文章里,作者写到:「今天,我们在人工智能领域取得的所谓革命性进展的确让人既乐观又担忧。令人乐观是因为智慧是我们解决问题的手段;令人担忧是因为我们害怕最流行和最时髦的人工智能(机器学习)会像病毒毒株一样将有根本缺陷的语言和知识概念融入我们的技术,从而降低我们的科学水平并降低我们的道德规范。」

评论

所有评论

推荐阅读

  • Framework Ventures完成4亿美元第四期基金募资

    6月26日,据《Fortune》报道,Framework Ventures已完成4亿美元第四期基金募资,用于支持新一代技术项目投资,标志着该机构进一步扩大投资范围,不再局限于加密资产领域。

  • OpenAI内部ChatGPT基本被废弃,99.8%的AI输出已由Codex接管

    6月26日消息,OpenAI 发布的经济学论文《The Shift to Agentic AI: Evidence from Codex》通过追踪智能体平台 Codex 的数据,揭示了知识工作模式的转变。工作的基本单位正在从单次对话,转变为向 AI 异步委托更长、更复杂的任务。 在 OpenAI 内部,智能体已彻底接管日常工作,传统聊天接口 ChatGPT 接近被废弃。截至 2026 年 6 月,内部员工每周生成的 Token 中有 99.8% 来自 Codex。其中工程师人均 Codex Token 占比达 99%,法务和招聘等非技术员工占比也超 85%。深度使用使员工开始像协调团队一样运行 AI,近 28.6% 的员工曾同时管理 5 个以上智能体,最重度员工的日均累计运行时间超 71 小时。 与 OpenAI 的极限状态相比,外部用户也在加速转向智能体。针对外部个人用户的抽样显示,估算耗时超 8 小时的人类工作任务提交比例在半年内从 2.1% 升至 25.6%。自 2025 年 8 月以来,外部个人和组织的非开发周活跃用户数分别暴增 137 倍和 189 倍。此外,以复用工作流为核心的 Skills 技能在全部 Codex 活跃用户中的使用率,在三个月内从 5.4% 跃升至 26.6%。

  • 2025年至今我国已经研制发布40余项人工智能国家标准

    6月26日,据央视,从国家标准委了解到,2025年至今我国已经研制发布40余项人工智能国家标准。在基础支撑领域,发布《人工智能 服务器系统性能测试方法》,孵化人工智能计算产品的性能测试基准,引导我国AI服务器生态向规模化、协同化方向升级。在关键技术领域,发布《人工智能 大模型》系列标准,统一大模型研发、评估、部署全流程规范,筑牢人工智能核心技术创新底座。在产品应用领域,出台《人工智能 终端智能化分级》标准,明确智能终端分级判定依据,有效甄别“伪智能”产品、规范市场秩序,同时为相关产业扶持政策落地提供支撑,带动终端产业链整体智能化升级。一系列重点标准推动人工智能技术从单点突破走向体系化迭代,有效降低行业研发成本与规模化落地门槛,全方位支撑产业规范有序发展。

  • 全球半导体市场规模今年或超10万亿元 半导体市场规模狂飙

    6月26日,据央视财经,世界半导体贸易统计组织近期发布预测称,受AI热潮拉动,2026年全球半导体市场规模将超1.5万亿美元,创历史新高。半导体行业正围绕AI需求加速重构。在存储芯片市场,行业研究机构的报告显示,今年第一季度主要品类“动态随机存取存储器”,也就是DRAM的市场营收规模达970亿美元,同比增长260%,创历史新高。其中三星电子占据约38%市场份额,位居第一;SK海力士和美光科技位列其后。据了解,三星电子已连续两个季度位居DRAM市场首位。逻辑芯片是半导体市场的另一大品类,涵盖CPU、GPU、AI加速器等各类用于执行逻辑运算的芯片。在AI加速器与数据中心赛道,英伟达凭借GPU主导训练市场。博通与美满科技在专业集成电路ASIC定制推理芯片领域占据主导地位。而在通用计算领域,英特尔在服务器CPU市场仍具有传统优势,但面临AI算力需求向GPU和ASIC转移的挑战。 世界半导体贸易统计组织本月初发布的报告预测,今年全球半导体市场规模将较2025年增长近90%,达到1.51万亿美元,约合人民币10.2万亿元,2027年将进一步增长26.6%,市场规模升至1.914万亿美元,约合人民币13万亿元。

  • 中央结算公司:将做市商对手方通过真实做市成交的现券交易结算服务费降低至7.5折

    6月26日,中央结算公司:为进一步降低做市商交易结算成本,中央国债登记结算有限责任公司(以下简称中央结算公司)决定将做市商对手方通过真实做市成交的现券交易结算服务费由8折进一步降低至7.5折。对真实做市交易的识别和认定,以中国外汇交易中心(全国银行间同业拆借中心)传送并经中央结算公司核对确认的数据为准。以上优惠措施自2026年7月1日起至2028年12月31日止有效。

  • 世界油阀通航量回升 油轮租金大幅跳涨

    6月26日,据央视财经,标普全球能源公司25日发布报告说,24日共有78艘船舶通过霍尔木兹海峡,创下美以伊战事爆发以来单日最高通航纪录。本月霍尔木兹海峡的船舶日均通航量已恢复至冲突前水平的约57%。据了解,霍尔木兹海峡通航量回升,叠加多国秋冬能源补库,国际油轮租金大幅跳涨,传导到国内上下游呈现冷暖分化。一方面航道局势缓和后,航运企业避险保费回落,叠加运价上涨,盈利空间上升。而炼化企业承压明显,海运成本抬升直接推高原油到岸价,压缩炼油加工利润。由于我国原油高度依赖进口,不少炼化企业仍抢抓当前窗口期加快原油补库。

  • STRC盘前交易价格触及73美元 创历史新低

    行情显示,STRC 盘前触及 73 美元,创历史新低;SATA 报 83.5 美元,为 2 月以来最低水平。Strive 在该熊市中继续支付每日股息。

  • 马光远:美联储的制度性变革,是未来数年全球资产最大的黑天鹅

    6月26日,经济学家马光远表示,黄金今年从高点回撤接近30%,白银更是腰斩。金银疲软的核心根源,不是地缘局势,而是美联储主席沃什强硬的信用重塑政策、高利率常态化、强美元虹吸效应的持续压制。 长期来看,若沃什顺利推进资产负债表收缩、通胀目标刚性落地、美联储体系改革,将彻底修复多年宽松透支的美元信用,从底层巩固美元全球霸权地位,利好美国长期货币体系、金融格局。但对全球资本市场而言,这意味着全品类资产定价逻辑彻底重构。当前美股看似仍在震荡走高,实则是市场严重低估了沃什结构性改革的深远影响。 沃什开启的美联储新时代,没有常态化宽松、没有市场兜底、没有模糊博弈,底层定价逻辑彻底改写。这场超越加息降息的制度性变革,才是未来数年全球资产最大的黑天鹅,也是最核心的定价主线。

  • 德邦科技:国家大基金6月3日至6月26日减持149.35万股 持股比例降至10.85%

    6月26日,德邦科技(688035.SH)公告称,公司持股5%以上股东国家集成电路产业投资基金股份有限公司于2026年6月3日至6月26日通过大宗交易减持公司股份149.35万股,持股比例由11.90%降至10.85%。本次减持属于此前披露的减持计划,不触及强制要约收购义务,不会导致公司控股股东及实际控制人变化

  • BTC跌破60000美元

    行情显示,BTC跌破60000美元,现报59992.34美元,24小时跌幅达到2.88%,行情波动较大,请做好风险控制。