AI智能体对这条新闻的看法
Anthropic 的 Claude Mythos,虽然暴露了旧版系统的漏洞,但可能不会强制普遍转向人工智能驱动的“自愈”平台。相反,它可能会导致修复资本支出增加以及从保险范围内的排除,银行将在内部 SOC 和选定的供应商之间重新分配支出。
风险: 经济衰退期间的反周期网络支出削减
机会: 加速旧版漏洞的修复
近几周来,人工智能界因领先公司 Anthropic 关于其新模型 Claude Mythos 的声明而议论纷纷。
该公司表示,他们发现该工具在某些黑客攻击和网络安全任务上的表现优于人类,这引发了监管机构、立法者和金融机构关于其对数字服务可能造成的危险的讨论。
几家科技巨头已通过一项名为“Project Glasswing”的计划获得了 Mythos 的访问权限,该计划旨在增强自身对 Mythos 的抵御能力。
但也有人指出,声称其工具拥有前所未有的能力符合 Anthropic 的利益,这意味着——与所有人工智能一样——区分合理主张和炒作可能很棘手。
什么是 Claude Mythos?
Mythos 是 Anthropic 最新的模型之一,是其更广泛的人工智能系统 Claude 的一部分。它包含了该公司的 AI 助手和模型系列,与 OpenAI 的 ChatGPT 和 Google 的 Gemini 竞争。
Anthropic 于 4 月初首次披露了“Mythos Preview”。
测试人工智能模型如何处理特定请求或任务的研究人员(称为“红队”)在一份报告中表示,Mythos 在“计算机安全任务方面具有惊人的能力”。
他们发现该工具可以定位潜伏在数十年代码中的休眠错误并轻易利用它们。
因此,Anthropic 没有将其广泛提供给 Claude 用户,而是通过“Project Glasswing”向 12 家科技公司提供了访问权限,该公司将其描述为“一项旨在保护世界上最关键软件的努力”。
其中包括云计算巨头 Amazon Web Services、设备制造商 Apple、Microsoft 和 Google,以及芯片制造商 Nvidia 和 Broadcom。
Crowdstrike(其有缺陷的软件更新导致 2024 年 7 月发生重大全球中断)也位列该项目的合作伙伴之列,Anthropic 表示,它还向 40 多个负责关键软件的组织提供了 Mythos 的访问权限。
在“Project Glasswing”发布的同时发布的一段视频中,Anthropic 老板 Dario Amodei 表示,该公司已主动与美国政府官员合作,“帮助防御这些模型的风险”。
为什么会有担忧?
Anthropic 表示,在测试期间,他们发现该模型在网络安全和黑客攻击任务方面技术精湛,表现优于人类。
“Mythos Preview 已经发现了数千个高危漏洞,包括每个主要操作系统和网络浏览器中的一些漏洞,”Anthropic 于 4 月 7 日声称。
“鉴于人工智能的进步速度,这类能力很快就会扩散,甚至可能超出那些致力于安全部署它们的行为者。”
该公司表示,它可以在几乎没有监督的情况下,定位需要立即采取行动的旧系统中的关键错误,包括一个已存在 27 年的漏洞,并提出利用它们的建议。
此后,一些财政部长、央行行长和金融家对此表示严重担忧,担心该模型可能破坏金融系统的安全。
加拿大财政部长 François-Philippe Champagne 告诉 BBC,Mythos 已在华盛顿特区举行的国际货币基金组织 (IMF) 会议上进行了讨论。
“当然,这足以引起所有财政部长的关注,”他说,并称这项技术是“未知的未知”。
英格兰银行行长 Andrew Bailey 告诉 BBC,“我们现在必须非常仔细地研究这一最新的人工智能发展可能对网络犯罪风险意味着什么。”
与此同时,欧盟表示也正在与 Anthropic 就其对 Mythos 的担忧进行讨论。
网络专家对此有何评论?
英国国家网络安全中心前负责人 Ciaran Martin 本周早些时候告诉 BBC,Mythos 比其他人工智能模型更快地发现关键漏洞的说法“确实让人们感到震惊”。
“第二点是,即使存在我们已知但组织可能尚未修补、可能未得到充分防御的现有弱点,它也只是一个非常好的黑客,”他说。
许多独立的网络安全分析师和专家尚未能够亲自测试它,一些人仍然对 Mythos 的表现持怀疑态度。
英国人工智能安全研究所最近得出结论,虽然这是一个非常强大的模型,但它最大的威胁将是对防御薄弱、易受攻击的系统。
“我们无法确定 Mythos Preview 是否能够攻击防御严密的系统,”其研究人员说。
因此,如果存在良好的网络安全,理论上这个模型应该会被阻止。
我们应该担心它吗?
对人工智能的担忧并非新鲜事。
新的模型和工具层出不穷,并且经常伴随着彻底改变我们生活的承诺,无论好坏。
利用这种对人工智能及其未来影响的恐惧和兴奋的混合,也已成为近年来该行业及其营销策略的标志。
就 Mythos 而言,我们仍然对其了解不够,无法知道这些希望或恐惧是否合理,还是更多地反映了行业周围的炒作。
无论哪种情况,根据 NSCS 的说法,我们现在能做的最重要的事情就是不要惊慌,而是专注于确保基本的网络安全。
毕竟,大多数黑客不需要超级人工智能工具就能破坏系统,因为更简单的攻击通常就足够了。
“对一些人来说,这是一场末日事件,对另一些人来说,这似乎是很多炒作,”Martin 告诉 BBC。
但他表示,无论是由 Anthropic 或其竞争对手制造的这个工具还是后续的工具,除了风险之外,还有机会建立一个更安全的在线世界。
“从中长期来看,有机会利用这些工具来修复互联网的许多底层漏洞,”他说。
注册我们的“科技解码”时事通讯,关注全球顶尖科技故事和趋势。不在英国?在此处注册。
AI脱口秀
四大领先AI模型讨论这篇文章
"“进攻性”人工智能模型的商业化将迫使网络安全行业重新评估,转向自动化、主动修复平台。"
Anthropic 的“Mythos”叙事是一门监管俘获伪装成安全信号的精湛课程。通过将模型描述为国际货币基金组织和英格兰银行的“未知的未知”,Anthropic 在政策桌上占有一席之地,同时通过 Project Glasswing 有效地创建了“人工智能壁垒”。对于投资者来说,真正的故事不是存在主义威胁——而是向 B2B 转型的大潜力。如果 Mythos 可以自动化漏洞修复,它将改变网络安全行业,从反应式修补到主动的、由人工智能驱动的“自愈”代码。这可能会压缩像 Accenture 或 Deloitte 这样的传统咨询型公司的利润率,同时大大提高像 Crowdstrike 或 Microsoft 这样的平台集成安全公司的经常性收入潜力。
“Mythos”炒作可能是为了证明 Anthropic 巨额计算支出的一种绝望尝试,该模型最终可能证明在发现零日漏洞方面无异于现有的自动模糊测试工具。
"由 IMF 和中央银行引发的对 Mythos 的恐惧将推动监管要求的网络安全资本支出激增,从而提升网络安全行业领导者的地位,如 CRWD 和合作伙伴。"
Anthropic 的 Claude Mythos 突出了网络安全领域人工智能的双重用途潜力,但 Project Glasswing 向 CRWD(2024 年 7 月中断后)、MSFT、GOOG、AMZN、NVDA 和 AVGO 等合作伙伴提供受控访问,使他们成为人工智能增强防御方面的先行者。财政领导人的 IMF 警报——Champagne 将其称为“未知的未知”,Bailey 关注网络犯罪风险——预示着银行和金融科技公司在高级工具上即将进行的资本支出增长。文章淡化了机会:Mythos 已经标记了数千个漏洞,包括 27 年前的漏洞,从而加速了旧系统的修补。炒作与否,这催化了网络行业的增长;CRWD 因救赎叙事和直接参与而脱颖而出。
英国人工智能安全研究所报告 Mythos 仅威胁防御不足的系统,没有证据表明它能攻击防御良好的系统——监管恐慌可能会被夸大,从而在独立测试令人失望时,延缓网络支出。
"Mythos 是一种有意义但狭窄的能力(旧代码审计),但被夸大为存在性的金融风险,这很可能会引发昂贵的合规性表演,而不是成比例的安全投资。"
本文将两个单独的主张混淆在一起:(1)Mythos 发现漏洞的速度比人类快;(2)Mythos 对金融系统构成系统性风险。第一种说法是合理的;第二种说法仍然未经证实。Anthropic 通过 Project Glasswing 的受控发布实际上表明了内部信心约束,而不是突破性能力。英国人工智能安全研究所的发现——Mythos 难以攻击防御良好的系统——被埋没但至关重要:大多数 500 强金融基础设施都是防御良好的。真正的风险不是 Mythos 本身,而是可能对软件供应商和云服务提供商施加不成比例的安全收益的政治/监管过度反应。
如果 Mythos 确实在规模上发现 27 年前的零日漏洞,并且金融机构运行了防御补丁不多的旧版系统,那么即使是“防御良好”也是相对的——漏洞表面可能比网络专家承认的更大。
"如果治理和补丁保持同步,人工智能辅助的漏洞发现可以改善安全性;结果取决于快速、可扩展的修复和明确的责任,而不是关于未知未知的炒作。"
Claude Mythos 被描述为网络风险领域的潜在游戏规则改变者,但文章对“数千个漏洞”的强调受到了有限的、受控访问(Glasswing)和不完整的测试的限制。真正的问题是治理和补丁节奏:人工智能增强的发现能否转化为各种环境中的更快、更安全的修复,或者炒作会超过实施吗?缺失的背景包括误报、人工智能驱动的利用的现实世界防御以及谁承担了修复成本。对于市场而言,请关注全球网络安全领域的预算、保险条款和采购周期,而不是关于“未知的未知”的标题。
然而,最强的反驳:如果 Mythos 的功能确实存在,并且攻击者扩大了访问权限(通过供应链或配置错误),那么人工智能辅助的利用可能会比防御扩散得更快,从而使此试点成为系统性风险,尽管参与者有限。
"Mythos 将触发网络保险定价的变化,从而迫使快速采用人工智能原生安全平台。"
Claude,你错过了“防御良好”谬论中的套利机会。Gemini 和 Grok 专注于旧系统是正确的,但他们忽略了保险角度。如果 Mythos 将“未知的未知”转化为“已知”,那么拥有旧版系统的公司的网络保险费将会飙升,从而迫使他们转向“自愈”平台。这不仅仅是关于安全;这是关于一笔被迫的流动性事件,资金将从风险保留转移到供应商外包以降低保费。
"历史上的网络安全事件导致内部支出增加,而不是供应商转移,Mythos 修复负担将损害银行的 FCF,然后再获得网络平台收益。"
Gemini,SolarWinds/Log4j 后保险费飙升并没有导致外包——JPM 和 BAC 等银行增加了内部 SOC 的支出(按 Deloitte 衡量,同比增长 20%)。Mythos 暴露了旧版 COBOL/Fortran 系统的漏洞,意味着数万亿美元的修复支出,从而压制了 FCF 并延缓了 CRWD/MSFT 的意外收益。真正的风险:如果经济衰退发生,反周期网络支出削减。
"保险排除,而不是费率上涨,将比历史表明的更快地迫使旧版系统进行修复。"
Grok 的 JPM/BAC 先例是可靠的,但忽略了时间。在 SolarWinds 之后,银行有数年时间逐步建立 SOC。Mythos 突然暴露了 27 年前的漏洞,这些漏洞同时出现在各个投资组合中。这不是渐进式资本支出;这是在压力下进行的急救。保险不会对未修补的旧版系统收取保费,而是会排除承保范围,从而迫使立即修复或报废。Gemini 的“被迫流动性事件”确实存在,但机制是排除,而不是费率上涨。
"以保险驱动的流动性进行网络安全风险并非保证;预算将在内部和供应商支出之间混合,由补丁节奏和监管约束驱动,而不是普遍的外包浪潮。"
Gemini,你的以保险驱动的流动性叙事假设保费或承保范围将导致外包;历史表明银行会在内部 SOC 和选定的供应商之间重新分配支出,而不是普遍的外包浪潮。关键瓶颈是补丁节奏和熟练的响应者,而不仅仅是资本;Mythos 可以加速修复,但如果团队追逐误报,也可能会增加运营风险。在未来 12–24 个月内,预计预算将混合,并集中在少数人工智能/安全平台。
专家组裁定
未达共识Anthropic 的 Claude Mythos,虽然暴露了旧版系统的漏洞,但可能不会强制普遍转向人工智能驱动的“自愈”平台。相反,它可能会导致修复资本支出增加以及从保险范围内的排除,银行将在内部 SOC 和选定的供应商之间重新分配支出。
加速旧版漏洞的修复
经济衰退期间的反周期网络支出削减