Introduzione: I sistemi di IA avanzata richiedono governance responsabile

Gli modelli di intelligenza artificiale sempre più capaci possono rafforzare la difesa cibernetica, accelerare la scoperta scientifica e espandere l’accesso all’espertise. Tuttavia, possono anche creare rischi per la sicurezza e la protezione se le loro capacità vengono malinterpretate, i loro controlli di sicurezza sono insufficienti o i governi non hanno le informazioni necessarie per reagire. Per trarre vantaggio da questi sviluppi in modo sicuro e fiducioso, le società avranno bisogno di istituzioni in grado di valutare, proteggere e governare sistemi sempre più capaci.

Per questo motivo, OpenAI ha contribuito a fondare la Appia Foundation, ospitata dalla Linux Foundation. Appia svilupperà specifiche aperte e modulare che tradurranno standard internazionali e quadri stabiliti in criteri concreti valutabili lungo l'intera catena del valore dell'IA. Il lavoro di Appia può aiutare a sviluppare uno strato critico di fiducia per cui terzi possano verificare la conformità agli standard, producendo prove chiare e riutilizzabili quando modelli, infrastrutture e applicazioni vengono sviluppati da diverse organizzazioni. Svolgendo questo lavoro, Appia contribuirà a creare una lingua tecnica condivisa che permetterà alle istituzioni nazionali e internazionali di fidarsi reciprocamente.

OpenAI vede questo sforzo come un passo cruciale in un ampio programma per rafforzare le istituzioni, gli standard e le pratiche di valutazione necessarie per gestire sistemi avanzati di IA.

Una cornice per governare l'IA ai limiti

Nel nostro blueprint per la governance democratica dell'IA all'avanguardia abbiamo offerto una mappa per questo lavoro. Il piano chiede un framework duraturo negli USA, un rafforzamento del Center for AI Standards and Innovation (CAISI), e una strategia di resilienza più ampia su scala governativa. Riconosce anche che i rischi nell'IA di frontiera sono di portata internazionale. I Paesi dovrebbero collaborare per sviluppare quadri di sicurezza compatibili, canali attendibili per condividere le risultanze sui rischi e reazioni coordinate agli incidenti.

La capacità nazionale e la cooperazione internazionale devono rafforzarsi a vicenda. Istituzioni forti come CAISI possono sviluppare competenze tecnica, valutare sistemi di frontiera e supportare un ecosistema di valutazioni indipendenti. Una rete di istituzioni nazionali può stabilire metodi condivisi, riconoscere prove attendibili e fornire ai governi la comprensione tecnica comune necessaria per agire insieme.

La governance tecnica al cuore della collaborazione

Gli standard sono centrali in questo sforzo ed è fondamentale che siano basati su pratiche di valutazione attendibili e rigorosi criteri tecnici. Nel nostro manuale condiviso per valutazioni attendibili da parti terze abbiamo delineato cosa le valutazioni avanzate devono sempre svelare: il sistema testato, l'accesso ai suoi tool e il mezzo di valutazione utilizzato, i metodi adottati per far emergere le capacità, le risorse a disposizione e gli controlli effettuati per validare i risultati. Siamo anche riusciti a mettere in pratica questi principi attraverso partnership di test con il CAISI statunitense e l’AISI inglese, il cui lavoro su valutazioni di capacità di frontiera e protezioni contro utilizzi biologici potenzialmente dannosi ha portato a miglioramenti concreti nei nostri sistemi.

Questo lavoro ha una funzione essenziale per creare le basi per pratiche standardizzabili in grado di valutare in modo confrontabile le prestazioni.

Frammenti integrati del sistema OpenAI per la sicurezza

Queste pratiche complementano l'ampia infrastruttura di sicurezza di OpenAI. Il nostro Framework di Preparazione costituisce la base per come definiamo e operativizziamo il nostro approccio al governo dei rischi più gravi da parte di sistemi avanzati di IA, inclusi i nostri processi interni. Il nostro Framework di Governance di Frontiera applica parti rilevanti di quell’approccio in un documento di governance pubblico incentrato su obblighi regolatori specifici, inclusi il rischio assunto, la segnalazione del modello, i controlli di sicurezza, la risposta agli incidenti e l'inclusione di opinioni esperte esterne. Insieme, questi strumenti aiutano a trasformare impegni generali in pratiche operative verificabili e migliorabili.

Il passo successivo: rendere interoperabili le pratiche

Gli sforzi di Appia mirano al prossimo passo cruciale: rendere interoperabili quelle pratiche all'interno di organizzazioni, giurisdizioni e intere catene di fornitura.

Negli svariati forum, incluso ora attraverso Appia, il nostro obiettivo è trasformare i lezioni imparate nel settore avanzato dell’IA in pratiche aperte, tecnicamente fondate, che governi, aziende e valutatori indipendenti possano utilizzare a livello internazionale. Il coordinamento tecnico e istituzionale è fondamentale, sia per prevenire rischi che per sfruttare al meglio l'enorme potenziale dell'AI.