Per quelli che liquidano Apple come spettatrice nella corsa all’intelligenza artificiale, occhio. Può darsi che l’azienda sia arrivata tardi e di certo può mostrar poco finora, ma la sua evoluzione negli ultimi tre anni rivela tre aspetti significativi. Primo, Apple ha i suoi modelli locali di IA. Secondo, quest’ultimi non sono all’altezza dei miglior di OpenAI e Claude. Terzo, tutto questo potrebbe non contare per nulla.

Tre anni di evoluzione

La traiettoria dei documenti tecnici resi pubblici da Apple negli ultimi anni rivela cambiamenti significativi. Nel 2024 Apple proponeva modelli piccoli, con circa 3 miliardi di parametri (3B), per il completamento di sole compiti semplici, come la generazione di Genmojis o l’elaborazione di riassunti. Nel 2025 l’azienda ha rilasciato il suo framework MLX per rendere più simples e accessibile l’integrazione e il funzionamento dei modelli locali. Nell’attuale anno, 2026, Apple sta proponendo una struttura ibrida che si basa unicamente su un principio basilare: compiti semplici vengono elaborati in dispositivi locali, senza bisogno di connessione a Internet, mentre compiti complessi vengono delegati all’infrastruttura cloud, mantenendo la privacy dell’utente attraverso la sua tecnologia Private Cloud Compute.

Una grande idea: la NAND come risorsa innovativa

Una pietra miliare del nuovo approccio di Apple è il design del modello AFM 3 Core Advanced. Il collo di bottiglia con l’esecuzione di modelli IA “grandi” (con decine di miliardi di parametri) nei dispositivi mobili sta nella limitata quantità di RAM disponibile, che in alcuni iPhone va fino a 12 GB. Solitamente i modelli non riescono ad essere caricati interamente in RAM. La proposta di Apple è di conservare il modello nel disco SSD del dispositivo e caricare solo i moduli necessari in RAM al momento del bisogno, ottenendo un'ottimizzazione significativa di risorse.

Attivazione “esperta” per prompt

Per ulteriore ottimizzazione, Apple utilizza tecniche di podatura per attivare solo una parte dei parametri di un modello (da 1 a 4 miliardi), seguendo il paradigma degli esperti misti (Mixture-of-Experts). Questa attivazione avviene in base al prompt, non a livello di ogni singolo token, permettendo di gestire la lentezza della NAND rispetto alla RAM. In questo modo Apple riesce a mantenere elevate performance nonostante l’esecuzione non sia sempre in RAM.

Privacy sempre al primo piano

Un aspetto distintivo dell’approccio di Apple fin dall’inizio è stato il focus sulla privacy, garantita attraverso modelli locali. Quando i compiti sono complessi, questi vengono eseguiti nella Private Cloud Compute (PCC), un sistema cloud dedicato e altamente protetto. A differenza dei concorrenti, i dati delle interazioni con l’IA di Apple sono totalmente cifrati e non condivisi con terzi. Apple afferma persino che quei dati non verranno utilizzati per addestrare ulteriormente i modelli.

Una collaborazione con Google

Con una forte attenzione verso il controllo totale, Apple ha comunque fatto una concessione: ha collaborato con Google per sfruttare i modelli Gemini e imparare da loro. Nei risultati di tale collaborazione, oggi Apple propone cinque modelli IA:

AFM 3 Core: modello denso con 3B parametri
AFM 3 Core Advanced: modello disperso con 20B parametri e attivazione tra 1B e 4B in base alla richiesta
AFM 3 Cloud: un modello efficiente ed efficiente sull’infrastruttura cloud
ADM 3 Cloud (Immagine): modello per la creazione e editing di immagini, cuore del servizio Image Playground
AFM 3 Cloud Pro: il modello cloud più avanzato, dedicato a agenti autonomi, addestrato con TPUs di Google e eseguito su GPU Nvidia nel Google Cloud

L’incertezza sulle capacità

A differenza di altre aziende, Apple non ha rilasciato metodi per gli standard di benchmarking comuni. Al contrario, ha pubblicato metriche basate su preferenze umane per comparare la soddisfazione dell’utenza rispetto a modelli di altri fornitori. Le valutazioni, però, non sembran mai confrontarsi con la generazione corrente delle alternative. Questo ha causato un certo malcontento da parte dei tecnocompilatori.

I loro nuovi modelli non sono leader di performance, ma sono migliorati

Nel 2025, Apple effettuò confronti con modelli open-source del momento (Qwen-3-4B, GPT-4o, Llama 4 Scout) e i suoi modelli sembrarono funzionare abbastanza bene. Tuttavia, i migliori modelli open-source e quelli di OpenAI, Anthropic e Google potrebbero superare i modelli di Apple. A oggi non è chiaro come si comportino rispetto ai nuovi modelli di IA cinesi. Una cosa però rimane chiara: Apple non cerca un "Mythos" per i suoi modelli, perlomeno ora.

Una profonda integrazione con il sistema

Una carta vincente di Apple è la profonda integrazione tra i suoi modelli di IA e l’hardware, il sistema operativo ed esse applicazioni del dispositivo. Gli AFM possono interagire con gli smartphone Apple, ad esempio con sensori per le fotocamere, il registro delle notifiche o i permessi locali delle app, permettendo di eseguire compiti specifici che un LLM generico non potrebbe facilmente replicare. Questo integrazione hardware-software è fondamentale per il successo del suo approccio AI-centrico.

I rischi del compromesso funzionale

Sebbene l’integrazione e la privacy siano due asset in grado di differenziare Apple rispetto ai concorrenti principali, ci sono rischi. In primo luogo, la funzionalità limitata dei modelli locali o il comportamento non affidabile dei modelli in cloud potrebbe portare ad una percezione del prodotto come sicuro ma tecnicamente mediocre. Siri ha già subito critiche per mancanza di intelligenza.

Con il lancio di Siri AI, Apple spera di migliorare questa percezione, permettendo agli utenti di utilizzare il loro iPhone senza interagire fisicamente con lo schermo. La sfida, però, rimane: trovare il giusto equilibrio tra privacy, sicurezza, efficienza e funzionalità avanzata.