IA

Claude Fable 5 torna online: il problema non era il modello, ma come veniva sfruttato

Adrian Kessler

Claude Fable 5, il modello di intelligenza artificiale più potente pubblicato da Anthropic, è di nuovo disponibile in tutto il mondo. Il ritorno arriva dopo diciotto giorni di sospensione totale, scattata quando il governo degli Stati Uniti ha imposto controlli sulle esportazioni che obbligavano Anthropic a verificare in tempo reale la nazionalità dei propri utenti. Non riuscendo a soddisfare quel requisito su scala globale, l’azienda ha preferito sospendere completamente l’accesso piuttosto che conformarsi solo parzialmente.

La tecnica che ha scatenato i controlli era un metodo di jailbreak scoperto da ricercatori di Amazon. Il metodo usava Fable 5 per mappare vulnerabilità software in modi che le norme sull’esportazione vietano per determinati cittadini stranieri. L’indagine interna ha rivelato qualcosa che complica la logica regolatoria: la stessa classe di vulnerabilità poteva essere identificata anche con modelli molto meno potenti — tra cui Opus 4.8, GPT-5.5 e Kimi K2.7. La capacità in questione, quindi, non era esclusiva di Fable 5.

La soluzione che ha sbloccato i controlli

La novità è un classificatore di sicurezza addestrato specificamente per bloccare la tecnica documentata da Amazon. Anthropic riferisce che il classificatore intercetta il metodo comunicato in oltre il 99 percento dei casi. Non si tratta di una protezione totale contro futuri jailbreak: è una correzione mirata per una vulnerabilità nota. Il classificatore agisce a livello di input, reindirizzando le richieste che corrispondono ai pattern documentati prima che il modello le elabori.

L’implicazione più ampia è rilevante per come si evolverà la regolamentazione dell’intelligenza artificiale. I controlli sulle esportazioni sono stati applicati a Fable 5 non perché il modello fosse l’unico in grado di causare il danno, ma perché una tecnica nota lo sfruttava. Sono stati revocati non perché il quadro normativo avesse risolto la questione, ma perché un classificatore ha chiuso la lacuna documentata. Anthropic sta lavorando con Amazon, Microsoft e Google su un framework condiviso per valutare la gravità dei jailbreak, basato su quattro criteri: guadagno di capacità, ampiezza del guadagno, facilità di weaponizzazione e scopribilità. Quel framework non esiste ancora come standard pubblico.

Cosa fa il modello e quanto costa

Il modello in sé è invariato. Fable 5 è progettato per ragionamenti complessi a lungo orizzonte e per il lavoro agentivo — compiti che richiedono pianificazione, esecuzione e correzione di rotta in sequenze estese senza approvazione umana a ogni passaggio. La finestra di contesto è di un milione di token, che è anche il valore predefinito. L’output massimo per risposta è di 128.000 token. Il pensiero è sempre attivo; la catena di ragionamento viene restituita come un riepilogo leggibile piuttosto che come output grezzo.

L’accesso è subordinato a condizioni che non esistevano prima della sospensione. Fable 5 richiede ora una conservazione dei dati di 30 giorni — non è disponibile in regime di conservazione zero. Questo impatta direttamente le organizzazioni sanitarie, legali e governative dove gli accordi zero-retention sono spesso il requisito di base per l’adozione di strumenti di intelligenza artificiale. Il prezzo è superiore al livello Opus: dieci dollari per milione di token in input, cinquanta per milione in output. Se una richiesta attiva i classificatori di sicurezza, può essere gestita da un modello alternativo anziché essere rifiutata, e se tale sostituzione sia visibile o no all’utente finale dipende dalla configurazione scelta da ciascun operatore.

Disponibilità e prossimi passi

Fable 5 ha un modello gemello, Claude Mythos 5, con le stesse capacità di base e lo stesso prezzo, ma con funzioni offensive di cybersecurity che Fable 5 non include. Mythos 5 è disponibile attraverso Project Glasswing. I due modelli non sono tornati disponibili contemporaneamente: l’accesso a Mythos 5 era stato ripristinato per alcune organizzazioni statunitensi una settimana prima del ritorno globale di Fable 5.

Fable 5 è disponibile ora sulla piattaforma Claude, Claude.ai, Claude Code e Claude Cowork. Per i piani Pro, Max, Team e alcuni Enterprise, il modello è incluso fino al 50 percento dei limiti settimanali di utilizzo fino al 7 luglio, dopo di che passa a una tariffazione a crediti. L’accesso tramite AWS, Google Cloud e Microsoft Foundry viene ripristinato gradualmente. Il framework che stabilirà come rispondere alla prossima tecnica di bypass è ancora in fase di costruzione.

Tag: , , , , ,

Discussione

Ci sono 0 commenti.