Claude Fable 5 ha trovato un bug fermo da 27 anni, ora è pubblico

Per 27 anni un singolo difetto è rimasto intatto dentro OpenBSD, uno dei sistemi operativi a cui si affidano banche, firewall e i server dietro i siti web di ogni giorno. Chiunque riuscisse a raggiungere la macchina attraverso una rete poteva mandarla in crash, e per quasi tre decenni nessuno se ne accorse. Un modello di Anthropic chiamato Mythos sì. Ora quel modello ha un volto pubblico: Anthropic ha rilasciato Claude Fable 5, la prima versione del suo sistema più capace a cui chiunque può iscriversi per usarla.

Ciò che rende Fable 5 degno di attenzione non è un posto in classifica. È che il modello sottostante legge il software come un revisore navigato legge un contratto, fino a isolare l’unica clausola che manda in pezzi tutto. All’interno di un programma di ricerca che Anthropic chiama Project Glasswing, la versione preliminare ha attraversato più di mille progetti open source, quel codice libero e condiviso che muove gran parte di internet, e ha segnalato oltre 23.000 problemi. Più di 10.000 erano abbastanza gravi da essere classificati alti o critici.

Il dettaglio che ha turbato perfino i ricercatori di Anthropic è che nessuno ha insegnato al modello a farlo. L’azienda sostiene che la capacità di trovare e sfruttare le debolezze non è mai stata un obiettivo di addestramento: è emersa da sola, man mano che il modello ragionava meglio sul codice. FFmpeg è l’esempio più chiaro. Un difetto si nascondeva da 16 anni in quel software di elaborazione video, il motore dietro innumerevoli app di streaming e lettori multimediali, annidato in una riga di codice che gli strumenti di test automatico avevano attivato cinque milioni di volte senza mai accorgersi del pericolo. Il modello se ne è accorto.

Per la maggior parte delle persone, nulla di tutto questo si vede. Il software controllato da Mythos è infrastruttura invisibile: il motore del browser, il nucleo del sistema operativo, la libreria multimediale sepolta dentro un telefono. Ma l’invisibile è esattamente il problema. I difetti riportati alla luce erano sopravvissuti proprio perché vivevano in codice troppo vecchio, troppo noioso o troppo profondo perché qualcuno continuasse a rileggerlo. Uno strumento capace di rileggerlo tutto, senza stancarsi, cambia le probabilità per chi tiene in piedi le fondamenta di internet e, nelle mani sbagliate, per chi vorrebbe attaccarle.

Numeri così significano qualcosa solo davanti a un metro di paragone. Su CyberGym, un test che misura se un modello sa riprodurre una vera vulnerabilità di sicurezza, il motore Mythos dentro Fable ottiene l’83,1 per cento, contro il 66,6 per cento del precedente Claude Opus 4.6: più o meno la differenza tra un analista junior capace e uno specialista che sbaglia di rado. I miglioramenti non si fermano alla sicurezza. La società di analisi Hex ha riferito che Fable è stato il primo modello a superare il 90 per cento nel suo test interno, e i primi utenti raccontano salti simili nello sviluppo software, nell’analisi dei dati e nel disegno delle interfacce.

Poi arriva la svolta. Il Fable 5 pubblico non farà proprio ciò che lo rende notevole. Anthropic ha sigillato quattro aree, cybersicurezza, biologia, chimica e una tecnica di copia chiamata distillazione, e quando una richiesta vi si avvicina, Fable passa in silenzio la conversazione al modello più vecchio e più sicuro, Claude Opus 4.8. L’azienda dice che accade di rado, e che i primi dati mostrano almeno il 95 per cento delle sessioni interamente su Fable. Il risultato è un prodotto insolito: il modello più capace mai distribuito da Anthropic, fermato di proposito dall’usare la sua abilità più affilata.

Quel progetto lascia domande che il lancio non scioglie del tutto. Una barriera che si fa da parte il 5 per cento delle volte resta una barriera con delle cuciture, e la linea tra spiegare come funziona un software e spiegare come romperlo è di rado netta. Anthropic afferma che un programma esterno di caccia ai bug è andato avanti per più di 1.000 ore senza trovare un modo universale di aggirare i limiti, ma sono cifre della stessa azienda, non verificate da alcun regolatore esterno. C’è poi un costo che i più sentiranno per primo: Fable 5 costa 10 dollari per milione di token in entrata e 50 per milione in uscita, le unità approssimative con cui un modello fa pagare la lettura e la scrittura, il doppio di Opus 4.8. E chi lo usa cede qualcosa di più silenzioso, perché Anthropic ora conserva 30 giorni di dati d’uso anche per i clienti che di norma pagano per non conservarne, definendolo una difesa contro gli abusi.

Per ora, l’accesso dipende da come usi già Claude. Gli sviluppatori raggiungono Fable 5 subito tramite l’interfaccia di programmazione di Anthropic, e una versione separata, Mythos 5, è stata consegnata a un piccolo gruppo di organizzazioni approvate in anticipo, accanto a una coalizione industriale che comprende Apple, Google, Microsoft, Nvidia e la Linux Foundation, tutte impegnate a correggere ciò che il modello trova prima che possano farlo gli aggressori. Anthropic ha stanziato 100 milioni di dollari in crediti di modello e 4 milioni in donazioni dirette ai gruppi di sicurezza open source che svolgono quel lavoro di riparazione.

La diffusione più ampia segue un calendario. Gli abbonati ai piani Pro, Max, Team ed Enterprise a postazione di Anthropic ricevono Fable 5 senza sovrapprezzo fino al 22 giugno; dal 23 giugno usarlo attinge ai crediti. Se le barriere reggeranno quando milioni di nuovi utenti le spingeranno è la parte ancora aperta. Il fatto più sorprendente non lo è. Una macchina può ora leggere il codice sotto la vita moderna e trovare le crepe sfuggite a tutti per una generazione, e la domanda che ne segue non è più se possa farlo, ma chi abbia il diritto di chiederglielo.

Tag: Anthropic, tech-en1, cybersicurezza, Project Glasswing, Claude Fable 5, modelli di IA