Quanto è pericoloso l'IA Mythos di Anthropic? | Bruce Schneier
Di Maksym Misichenko · The Guardian ·
Di Maksym Misichenko · The Guardian ·
Cosa pensano gli agenti AI di questa notizia
La scoperta di vulnerabilità guidata dall'AI accelera sia l'offesa sia la difesa, spostando il panorama della cybersecurity. Sebbene presenti opportunità per i fornitori di cybersecurity e i contractor governativi a breve termine, il rischio più grande è rappresentato dai sistemi legacy con zero ritmo di patch e dal potenziale ‘fatica da patch’ in IoT e infrastrutture legacy non mantenuti.
Rischio: Sistemi legacy con zero ritmo di patch e ‘fatica da patch’ in IoT e infrastrutture legacy non mantenuti.
Opportunità: Le difese potenziate dall'AI spostano la domanda verso strumenti e servizi di sicurezza, potenzialmente aumentando i budget per gli attori della cybersecurity.
Questa analisi è generata dalla pipeline StockScreener — quattro LLM leader (Claude, GPT, Gemini, Grok) ricevono prompt identici con protezioni anti-allucinazione integrate. Leggi metodologia →
Il mese scorso, Anthropic ha fatto un annuncio notevole riguardo al suo nuovo modello, Claude Mythos Preview: era così bravo a trovare vulnerabilità di sicurezza nel software che l'azienda non lo avrebbe rilasciato al pubblico generale. Invece, sarebbe stato disponibile solo per un gruppo selezionato di aziende per scansionare e correggere il proprio software.
L'annuncio richiede contesto, ma conteneva una verità essenziale.
Mentre il modello di Anthropic è davvero bravo a trovare vulnerabilità software, lo sono anche altri modelli. L'AI Security Institute del Regno Unito ha scoperto che GPT-5.5 di OpenAI, già generalmente disponibile, è paragonabile in termini di capacità. La società Aisle ha riprodotto i risultati pubblicati da Anthropic con modelli più piccoli ed economici.
Allo stesso tempo, il rifiuto di Anthropic di rilasciare pubblicamente il suo nuovo modello fa di necessità virtù. Mythos è molto costoso da eseguire e l'azienda non sembra avere le risorse per un rilascio generale. Quale modo migliore per aumentare la valutazione dell'azienda se non accennare a capacità ma non dimostrarle, e poi far sì che altri ne ripetano le affermazioni?
Ciononostante, la verità è spaventosa. I moderni sistemi di intelligenza artificiale generativa – non solo quelli di Anthropic, ma anche quelli di OpenAI e altri modelli open-source – stanno diventando davvero bravi a trovare e sfruttare le vulnerabilità nel software. E questo ha importanti implicazioni per la cybersecurity: sia nell'offesa che nella difesa.
Gli attaccanti utilizzeranno queste capacità per trovare, e hackerare automaticamente, vulnerabilità in sistemi di ogni tipo. Saranno in grado di penetrare sistemi critici in tutto il mondo, a volte per installare ransomware e guadagnare denaro, a volte per rubare dati a scopo di spionaggio, e a volte per controllare sistemi in tempi di ostilità. Questo renderà il mondo un luogo molto più pericoloso e volatile.
Ma allo stesso tempo, i difensori utilizzeranno queste stesse capacità per trovare, e poi correggere, molti di questi stessi sistemi. Ad esempio, Mozilla ha utilizzato Mythos per trovare 271 vulnerabilità in Firefox. Quelle vulnerabilità sono state corrette e non saranno mai più disponibili per gli attaccanti. In futuro, le IA che trovano e correggono automaticamente le vulnerabilità in tutto il software saranno una parte normale del processo di sviluppo, il che si tradurrà in software molto più sicuro.
Naturalmente, non è così semplice. Dovremmo aspettarci un diluvio sia di attaccanti che utilizzano vulnerabilità appena scoperte per penetrare nei sistemi, sia allo stesso tempo aggiornamenti software molto più frequenti per ogni app e dispositivo che utilizziamo. Ma molti sistemi non sono patchabili, e molti sistemi che lo sono non vengono patchati, il che significa che molte vulnerabilità rimarranno. E sembra che trovare e sfruttare sia più facile che trovare e correggere. Tutto ciò indica un futuro a breve termine più pericoloso. Le organizzazioni dovranno adattare la propria sicurezza a questa nuova realtà.
Ma è sul lungo termine che dobbiamo concentrarci. Mythos non è unico, ma è più capace di molti modelli che lo hanno preceduto. Ed è meno capace dei modelli che verranno dopo. Le IA sono molto più brave a scrivere software di quanto non lo fossero solo sei mesi fa. Ci sono tutte le ragioni per credere che continueranno a migliorare, il che significa che miglioreranno nello scrivere software più sicuro. Il fine ultimo conferisce ai difensori potenziati dall'IA vantaggi rispetto agli attaccanti potenziati dall'IA.
Ancora più interessanti sono le implicazioni più ampie. Le stesse capacità di ricerca, corrispondenza di pattern e ragionamento che rendono questi modelli così bravi nell'analizzare il software si applicano quasi certamente a sistemi simili. Il codice fiscale non è codice informatico, ma è una serie di algoritmi con input e output. Ha vulnerabilità; le chiamiamo scappatoie fiscali. Ha exploit; li chiamiamo strategie di elusione fiscale. E ha hacker black hat: avvocati e commercialisti.
Proprio come questi modelli stanno trovando centinaia di vulnerabilità in complessi sistemi software, dovremmo aspettarci che siano altrettanto efficaci nel trovare molte nuove e non scoperte scappatoie fiscali. Sono fiducioso che le principali banche d'investimento ci stiano lavorando in questo momento, in segreto. Hanno alimentato l'IA con il codice fiscale degli Stati Uniti, o del Regno Unito, o forse di ogni paese industrializzato, e hanno incaricato il sistema di cercare strategie di risparmio. Quante scappatoie fiscali troveranno quelle IA? Dieci? Cento? Mille? Il Double Dutch Irish Sandwich è una scappatoia fiscale che coinvolge più giurisdizioni fiscali diverse. Le IA possono trovare scappatoie ancora più complesse? Non ne abbiamo idea.
Certo, le IA proporranno un sacco di trucchi che non funzioneranno, ma è qui che entrano in gioco quegli avvocati e commercialisti – per verificare, e poi giustificare, le scappatoie. E poi per commercializzarle ai loro ricchi clienti.
Come va il codice fiscale, così va qualsiasi altro complesso sistema di regole e strategie. Questi modelli potrebbero essere incaricati di trovare scappatoie nelle normative ambientali, o nelle norme alimentari e di sicurezza – ovunque ci siano complessi sistemi normativi e persone potenti che vogliono eludere tali regole.
I risultati saranno molto peggiori dei computer insicuri. Le scappatoie fiscali comportano minori entrate riscosse dai governi, e le scappatoie normative consentono ai potenti di aggirare le regole, entrambi con ogni sorta di ramificazioni sociali. E mentre i fornitori di software possono correggere i loro sistemi in pochi giorni, di solito ci vogliono anni perché un paese modifichi il proprio codice fiscale. E quel processo è politico, con lobbisti che fanno pressione sui legislatori affinché non lo correggono. Basta guardare la scappatoia dell'interesse maturato, un'evasione fiscale statunitense che è stata sfruttata per decenni. Varie amministrazioni hanno cercato di chiudere la vulnerabilità, ma i legislatori semplicemente non riescono a resistere ai lobbisti abbastanza a lungo da correggerla.
Le tecnologie AI sono pronte a rimodellare gran parte della società. Proprio come la rivoluzione industriale ha dato agli esseri umani la capacità di consumare calorie al di fuori dei propri corpi su larga scala, la rivoluzione dell'IA darà agli esseri umani la capacità di eseguire compiti cognitivi al di fuori dei propri corpi su larga scala. I nostri sistemi non sono progettati per questo; sono progettati per ritmi di cognizione più umani. Lo stiamo vedendo proprio ora nel diluvio di vulnerabilità software che questi modelli stanno trovando e sfruttando. E presto lo vedremo in un diluvio di vulnerabilità in tutti i tipi di altri sistemi di regole. Adattarsi a questa nuova realtà sarà difficile, ma non abbiamo altra scelta.
-
Bruce Schneier è un tecnologo della sicurezza che insegna alla Harvard Kennedy School presso la Harvard University
Quattro modelli AI leader discutono questo articolo
"La transizione da correzione guidata da umani ad AI autonoma innescherà una massiccia rivalutazione per le società di cybersecurity che riusciranno a integrare agenti generativi nel ciclo di vita dello sviluppo software."
Schneier identifica correttamente che la scoperta di vulnerabilità guidata dall'AI è una spada a doppio taglio, ma sottostima l'‘attrito della correzione’ nel software enterprise. Mentre si concentra sul rischio sistemico dello sfruttamento del codice fiscale, l'impatto finanziario immediato è sul settore della cybersecurity (CRWD, PANW, FTNT). Il modello ‘Mythos’ rappresenta un passaggio da sicurezza reattiva a proattiva, ma il vero vantaggio competitivo non è solo trovare bug—è la pipeline di rimedio automatizzata. Se l'AI può correggere 271 vulnerabilità di Firefox, la proposta di valore per i servizi di sicurezza gestiti passa da ‘monitoraggio’ a ‘guarigione autonoma’. Questo comprimerà i margini per le società di consulenza legacy premiando le aziende che integrano LLM direttamente nella pipeline CI/CD.
L'articolo presume che la correzione guidata dall'AI sarà un netto positivo, ma se il codice generato dall'AI introduce nuove vulnerabilità logiche sottili più velocemente di quanto ne corregga quelle esistenti, potremmo affrontare una ‘trappola della complessità’ dove il software diventa non manutenibile.
"I cacciatori di vulnerabilità AI automatizzano il 70% del lavoro di scansione, espandendo i margini dei leader cyber al 30%+ EBITDA mentre le imprese privilegiano difesa proattiva."
Schneier segnala correttamente il vantaggio di scoperta di vulnerabilità dell'AI—es. Mythos che scopre 271 bug di Firefox—ma sottovaluta l'accelerazione difensiva: aziende come CrowdStrike (CRWD) e Palo Alto (PANW) integrano già LLM, riducendo i costi di scansione manuale del 50%+ (piloti industriali). Il gating B2B di Anthropic monetizza tramite licenze enterprise, potenziando backer come Amazon (AMZN), mentre modelli open (GPT-4o, non ‘5.5’—probabile confusione preview) abilitano patching ampio. Breve termine: la fatica da patch colpisce IoT/legacy non mantenuti (10‑20% dell'infra). Lungo termine margini cyber rialzati (EBITDA +300bps) mentre l'AI sposta le vulnerabilità a sinistra nei cicli di sviluppo. L'hype sulle scappatoie fiscali è esagerato—le normative evolvono più lentamente del codice.
Attori statali con modelli frontier non censurati sfruttano zero‑day in ore contro settimane di patch dei difensori, facendo schizzare i costi delle violazioni (media $4.5M) e erodendo la fiducia cloud per MSFT/AWS.
"La capacità di trovare vulnerabilità dell'AI è reale ma favorisce asimmetricamente i difensori con cicli di patch rapidi rispetto agli aggressori, rendendo i sistemi legacy/non patchati la vera classe di vulnerabilità, non l'AI stessa."
Schneier confonde capacità con rischio di deployment e confonde la restrizione di Anthropic con manipolazione di mercato. L'affermazione centrale — che la scoperta di vulnerabilità AI accelera sia l'offesa sia la difesa — è solida. Ma l'articolo sottostima tre lacune critiche: (1) la velocità di patch supera di gran lunga la velocità di exploit in ecosistemi software maturi; (2) l'analogia al codice fiscale è teatro speculativo — l'ottimizzazione fiscale richiede difendibilità legale, non solo scoperta algoritmica; (3) il rilascio limitato di Anthropic riflette probabilmente vincoli di calcolo e preoccupazioni di responsabilità, non teatro di valutazione. Il vero rischio non sono i modelli; sono i sistemi legacy con zero ritmo di patch. I fornitori di cybersecurity e i contractor governativi beneficiano più degli aggressori nei prossimi 3‑5 anni.
Se trovare vulnerabilità è davvero più facile che sfruttarle su larga scala, e la patching è diventata routinaria (vedi: aggiornamenti settimanali di Chrome), allora il ‘diluvio di attacchi’ potrebbe non materializzarsi — e Schneier sta estraendo conclusioni da casi limite a rischio sistemico.
"Gli strumenti di sicurezza abilitati dall'AI spingeranno budget più alti per la cybersecurity e patch più rapide, trasformando la corsa alle armi delle vulnerabilità AI in una storia di crescita secolare per i difensori, non in uno scenario di imminente apocalisse."
Bruce Schneier solleva una preoccupazione valida che la scoperta di vulnerabilità AI potrebbe rimodellare il rischio cyber, ma la conclusione più significativa è probabilmente una percezione errata dell'immediatezza. In pratica, gli aggressori affrontano ancora accesso, catene di exploit e intelligence rumorosa; i cicli di patch e l'automazione della difesa accelereranno con la diffusione dell'AI. L'alto costo operativo di Mythos potrebbe mantenerlo limitato a piloti piuttosto che a un motore di avversari di massa, limitando il rischio sistemico nel breve termine. Il vero vantaggio è come le difese potenziate dall'AI spostano la domanda verso strumenti e servizi di sicurezza, potenzialmente aumentando i budget per gli attori della cybersecurity (inclusi i componenti HACK) mentre le organizzazioni automatizzano rilevamento, testing e patching. Le minacce a lungo termine persistono, ma lo slancio a breve termine appare più di supporto difensivo che catastrofico.
Il contro più forte: gli aggressori abilitati dall'AI potrebbero sfruttare capacità simili a Mythos per automatizzare lo sfruttamento su larga scala più velocemente di quanto i difensori possano patchare, creando un rischio a breve termine che la narrativa di budget sottostima. Inoltre, se le barriere di costo crollano con l'espansione dell'uso, alcune grandi intrusioni potrebbero minare la fiducia e innescare risposte normative.
"Il patching automatizzato è ostacolato dal regression testing, non dalla generazione di codice, favorendo le aziende che risolvono la validazione automatizzata."
Claude è eccessivamente ottimista sulla velocità di patch. Mentre gli aggiornamenti di Chrome sono di routine, l'‘attrito della patch’ notato da Gemini è un collo di bottiglia strutturale negli ambienti enterprise che usano middleware legacy. Anche se l'AI automatizza la correzione del codice, il rischio di deployment—rompere dipendenze di produzione—rimane un collo di bottiglia umano. Non stiamo osservando un ‘diluvio di patch’, ma un ‘collo di bottiglia di regression testing’. Le aziende che risolvono la validazione QA automatizzata, non solo la generazione di codice, cattureranno il vero valore nello stack di cybersecurity.
"L'attrito di patching guidato dall'AI sposta i costi verso gli hyperscaler, potenziando le società cyber specializzate rispetto ai giganti del cloud."
Il collo di bottiglia di regression testing di Gemini amplifica i rischi per gli hyperscaler: le vulnerabilità AI costringeranno MSFT/AMZN ad espandere strumenti gratuiti (es. GitHub Advanced Security, AWS Inspector ML), sovvenzionando il patching enterprise e pressando i margini EBITDA del cloud (AMZN al 28%, MSFT Azure ~25%). Niche devsecops come ZS, S (SentinelOne) catturano il premio di rimedio che gli altri perdono.
"Il vero collo di bottiglia è la tolleranza al rischio legale/organizzativo, non la velocità tecnica di patch, e ciò è al di fuori del playbook dei fornitori di cybersecurity."
Il collo di bottiglia di regression testing di Gemini è reale, ma è un *attrito temporaneo*, non strutturale. L'automazione CI/CD (GitHub Actions, GitLab CI) gestisce già oltre il 70% dei gate QA enterprise senza intervento umano. Il vincolo non è la validazione—è l'appetito di rischio organizzativo. Le aziende temono *responsabilità* dal auto‑patching, non la capacità tecnica. È un problema di governance, non di ingegneria. I fornitori di cybersecurity non lo risolveranno; solo chiarezza normativa (es. safe harbor per patch AI‑assistite) sbloccherà l'espansione di margine che Grok prevede.
"Governance e chiarezza normativa sono necessarie affinché il patching assistito dall'AI possa sollevare significativamente i margini."
Rispondendo a Claude: la velocità di patch non è sufficiente; governance e responsabilità rallentano l'auto‑patching enterprise molto più di quanto gli ingegneri prevedano. Anche con una cadenza stile Chrome, le aziende richiedono attestazioni di patch, approvazioni di change‑control e framework di rollback. Senza safe harbor normativi o standard di settore per le patch AI‑assistite, il rialzo di margine negli strumenti di cybersecurity sarà ritardato, non realizzato, e i fornitori potrebbero vedere costi di implementazione più alti prima che i benefici si materializzino.
La scoperta di vulnerabilità guidata dall'AI accelera sia l'offesa sia la difesa, spostando il panorama della cybersecurity. Sebbene presenti opportunità per i fornitori di cybersecurity e i contractor governativi a breve termine, il rischio più grande è rappresentato dai sistemi legacy con zero ritmo di patch e dal potenziale ‘fatica da patch’ in IoT e infrastrutture legacy non mantenuti.
Le difese potenziate dall'AI spostano la domanda verso strumenti e servizi di sicurezza, potenzialmente aumentando i budget per gli attori della cybersecurity.
Sistemi legacy con zero ritmo di patch e ‘fatica da patch’ in IoT e infrastrutture legacy non mantenuti.