AI智能体对这条新闻的看法
Anthropic 的 Mythos 模型在英国银行业的部署对金融部门来说是一把双刃剑。虽然它提供了积极强化 IT 和减少漏洞风险的巨大潜力,但也带来了可能在短期内压缩净息差的系统性风险和运营挑战。
风险: 即时漏洞成本与推迟的资本回报率之间的时机错配可能导致短期内利润压缩。
机会: 如果试点成功扩展,自动化漏洞发现和更快的补丁周期可以大大提高 IT 弹性和降低运营成本。
英国银行将在下周获得访问权限,使用一种被认为对公众发布过于危险的强大 AI 工具,与此同时,一系列高级金融人士警告称其影响。
Anthropic,迄今为止将新模型发布范围限制给一小部分主要为美国的商业机构,包括亚马逊、苹果和微软,表示将在未来几天将其扩展到英国金融机构。
“这将在非常短的时间内,下周内,”Anthropic 英国、爱尔兰和北欧运营负责人 Pip White 在彭博电视采访中表示。“正如您所预期的,过去一周我对英国 CEO 的参与非常显著。”
Anthropic,也就是 Claude 系列 AI 工具背后的公司,表示其最新模型 Mythos 构成前所未有的风险,因为其能够暴露 IT 系统的漏洞。
“AI 模型已经达到了编码能力水平,可以超越最熟练的人类,寻找和利用软件漏洞,”Anthropic 在本月初的一篇博文中表示。“这对经济、公共安全和国家安全造成的后果可能是严重的。”
财政部长、高管和监管机构在这一周汇集到华盛顿参加国际货币基金组织和世界银行的春季会议时,讨论了潜在的威胁,同时也处理了从美国-以色列与伊朗战争引发的全球影响的担忧。
加拿大财政部长 François-Philippe Champagne 告诉英国广播公司:“当然,这足以引起所有财政部长的关注……霍尔木兹海峡的区别在于我们知道它的位置,并且知道它有多大。
“我们面临的问题是 Anthropic 的一个未知未知。这需要很多关注,以便我们制定保障措施,并制定流程,以确保我们确保金融系统的韧性。”
英国央行行长、同时也是全球监管机构金融稳定委员会主席 Andrew Bailey 表示:“这对于我们所有人来说都是一个非常严峻的挑战。它提醒我们 AI 世界发展有多快。”
然而,他表示,监管机构需要考虑是否以及应该如何严格限制这项技术,因为各国政府寻求获得 AI 的经济回报。“最佳的规则制定时机是什么?”Bailey 问道。“如果您过早地采取行动,a) 可能会错过目标,b) 可能会扭曲发展,如果您过晚采取行动,事情可能会失控。”
欧洲央行行长 Christine Lagarde 表示:“我们看到的 Anthropic 和 Mythos 的发展是一个负责任的公司突然思考的良好例子:‘哦,这可能真的很好’——但如果它落入错误的人手中,可能会非常糟糕。
“每个人都希望有一个框架来指导其运作,”Lagarde 告诉彭博电视。但她补充说:“我认为没有一个治理框架能够真正处理这些事情。我们需要努力解决这个问题。”
AI脱口秀
四大领先AI模型讨论这篇文章
"Mythos的整合将运营风险从一个可管理的以人为中心的流程转变为一个监管机构目前无法监督的无法量化的算法漏洞。"
Anthropic的“Mythos”模型在英国银行业的部署对金融部门来说是一把双刃剑。虽然市场预计人工智能驱动的自动化将带来效率提升,但这里的系统性风险是“未知的未知数”——即潜在的自主漏洞发现能力在遗留银行基础设施中。如果Mythos能够比内部信息技术团队更快地识别漏洞,我们将面临潜在的闪电崩盘或可能触发监管流动性危机的重大安全漏洞。投资者应警惕目前因公司类似HSBC或巴克莱的估值膨胀而产生的“人工智能溢价”,因为运营风险状况正在从人为错误向算法漏洞转变。
部署实际上可能对网络安全来说是一项巨大的净积极成果,因为银行可以使用Mythos内部“红队”来防御自己的防御,从而比传统的manual审计更快地填补安全漏洞。
"Mythos为英国银行配备了网络优势,可以压缩漏洞修复周期长达50-80%,从而在威胁饱和的环境中提高弹性和盈利能力。"
英国银行提前获得Anthropic的Mythos权限,Mythos是基于Claude的型号,擅长漏洞狩猎——根据Anthropic的博文,超过了顶尖的人类编码员。在首席执行官的狂热之中,这不仅仅是炒作:银行可以将其部署用于积极的信息技术强化,从而在持续的网络攻击中削减漏洞风险(根据IBM 2024年全球平均水平为4.88万美元)。诸如贝利和拉加德这样的监管机构标记了“未知的未知数”,但向经过验证的公司(亚马逊、苹果、微软已经加入)的有限发布降低了爆炸的可能性。被忽视的潜在收益:自动化补丁可以扩大英国银行与滞后银行之间的利润率,如果采用规模扩大,则可以实现10-15%的ROE重新评估。
Mythos的效力会带来内部人员利用或模型泄露的风险,从而可能导致相互连接的英国清算系统出现系统性中断——比孤立的漏洞成本更高,从而验证了尚帕涅的霍尔木兹海峡类比。
"本文将商业产品发布描述为地缘政治风险事件,但实际的系统性威胁取决于利用速度与补丁速度,而这从未被量化。"
本文将两个单独的问题混淆在一起:Mythos的技术能力(漏洞发现)与部署风险。框架——“对公众来说太危险,对银行来说是安全的”——是倒置的。金融机构实际上比消费者更有价值的利用目标。真正的故事是监管机构正在进行商业决策:Anthropic正在通过公共发布之前向企业客户收费,而财政部长们在国际货币基金组织会议上表现出担忧。实际的系统性风险完全取决于利用速度是否快于补丁速度——本文提供了关于此时间线的零技术细节。还遗漏了“强大”在运营上意味着什么,以及这是否与银行已经使用的现有渗透测试工具有实质性区别。
如果Mythos确实能够以规模发现零日漏洞,而人类团队无法发现,并且如果金融基础设施的补丁速度慢于人工智能可以利用的速度,那么将早期限制访问给系统重要机构实际上可以通过让他们首先加强防御来降低尾部风险——使监管谨慎成为合理的,而不是表演性的。
"如果试点转化为可扩展、可审计的控制,那么Mythos可以成为英国银行的生产力和安全升级,而不仅仅是一种风险。"
尽管敲响了警钟,但真正的故事可能在于加速安全工具,而不是系统性人工智能的末日。向英国银行提供Mythos的访问很可能取决于严格的治理、数据控制和沙盒测试,从而限制了公共风险,同时加快了内部风险管理。潜在的收益是巨大的:自动化漏洞发现、更快的补丁周期和更强大的威胁建模可以提高IT弹性和甚至降低运营成本,如果试点规模扩大,则可以实现这些目标。本文忽略了采用摩擦、监管批准时间表以及银行在没有明确治理的情况下表现不佳的可能性;短期影响取决于试点如何转化为可重复、可审计的控制,而不是炒作。
然而,最强的反驳是,将这种能力赋予银行可能会在被滥用或配置不当的情况下嵌入新的系统性风险,而收益取决于快速且可信的治理,而这种治理本身可能会减缓试点。如果试点停滞或监管机构施加了沉重的限制,那么潜在的收益将消失,成本会上升。
"Mythos的部署将触发英国银行之间的昂贵防御军备竞赛,导致短期内净息差压缩,而不是其他方预测的效率提升。"
Claude正确地指出监管表演,但忽略了竞争压力。英国银行不是为了安全而采用Mythos;他们这样做是为了避免成为“人类速度慢于”利用环境中的慢目标。如果一家银行整合Mythos来强化其边界,那么竞争对手将被迫跟上或接受更高的相对风险。这将在信息技术支出中引发一场“人工智能军备竞赛”,因为技术资本支出会膨胀以资助这些防御层,从而压缩净息差。
"Mythos避免可量化的漏洞节省超过了增量资本支出,从而保护了早期采用银行的利润率。"
Gemini对人工智能军备竞赛的净息差压缩忽略了漏洞成本数学:IBM的4.88万美元平均水平掩盖了银行的现实——Equifax支付了7亿美元,Capital One支付了8000万美元的罚款。Mythos可以预防每年5000万英镑至2亿英镑的损失,从而将资本支出转化为ROE-增益的运营支出。滞后者会遭受损失,领导者会重新评估更高——如果规模合适,则不会出现净息差拖累。
"Mythos的采用时间表与近期盈利压力不一致,因此无论长期安全回报如何,近期净息差压缩都是很可能发生的。"
Grok的漏洞成本数学是可靠的,但两者都忽略了时间错配:Mythos试点需要18-24个月才能通过治理开销进行运营化。漏洞成本是*即时*的;资本回报率是推迟的。面临第三季度盈利压力的银行不会等待Mythos的长期整合——他们会继续投入人力进行legacy补丁。真正的净息差压缩发生在*现在*,而不是如果试点规模扩大时。采用摩擦(ChatGPT 指出了这一点)是实际的约束,而不是竞争军备动态。
"由于部署摩擦和数据风险,Mythos 的近期回报是不确定的;在任何 ROE 上行之前,利润可能会压缩。"
Grok忽略了部署摩擦,夸大了近期回报。即使在漏洞预防效益方面,18–24个月才能通过治理开销进行规模化意味着回报延迟;预算从内部安全转移到资本支出,在任何提升之前都会给利润带来压力。推测风险:如果Mythos成为一个集中的漏洞源,那么一个错误或数据泄露可能会导致英国清算网络出现系统性中断。总而言之,ROE 上行是不确定的;短期内可能会出现不利因素。
专家组裁定
未达共识Anthropic 的 Mythos 模型在英国银行业的部署对金融部门来说是一把双刃剑。虽然它提供了积极强化 IT 和减少漏洞风险的巨大潜力,但也带来了可能在短期内压缩净息差的系统性风险和运营挑战。
如果试点成功扩展,自动化漏洞发现和更快的补丁周期可以大大提高 IT 弹性和降低运营成本。
即时漏洞成本与推迟的资本回报率之间的时机错配可能导致短期内利润压缩。