Google DeepMind ha pubblicato i principi e le dimostrazioni di Magic Pointer, un innovativo puntatore del mouse alimentato da Gemini in grado di comprendere cosa sta indicando l'utente e il motivo. La novità è che non è richiesto alcun testo da digitare: basta spostare il cursore per comunicare con l'intelligenza artificiale.

Perché è importante

Negli ultimi due anni l'interfaccia principale dell'intelligenza artificiale ha seguito il modello delle finestre di chatbot dove si apre una finestra, si digita e si ottiene risposta. Magic Pointer presenta un approccio opposto: l'intelligenza artificiale accompagna l'utente sullo schermo, interpreta il contesto visivo e agisce senza necessità di spiegazioni preliminari. Questo sistema fa perdere rilevanza ai tradizionali box di testo come punto di accesso all'IA.

La logica del progetto nasce da un'osservazione: il problema principale dell'IA odierna non è la capacità espressiva, ma la frizione nell'uso. Ogni volta che si richiede qualcosa al modello, è necessario adattarsi al dispositivo: aprire finestre, incollare testi, spiegare il contesto. Magic Pointer inverte questo processo ponendo l'intelligenza artificiale dove è posizionato il cursore.

Funzionamento dettagliato

Il sistema cattura un contesto visivo e semantico intorno al puntatore. Gli esempi dimostrati mostrano che:

    • Selezionando una data in un email, Gemini suggerisce la creazione di un evento
    • Seleccionando due immagini (un divano e un salone), Gemini compone un arredamento
    • Puntando una tabella, il sistema genera grafici direttamente senza aprire nuove app

Il progetto punta a sostituire i prompt estesi con il concetto di "taquigrafia naturale" definito da DeepMind: indicare qualcosa, esprimere la richiesta e lasciare al sistema il compito di connettere i punti.

Disponibilità e integrazione

I demo interattivi sono accessibili su Google AI Studio e il sistema sta già arrivando in Chrome. A partire dall'autunno sarà integrato nel Googlebook, il nuovo notebook prodotto in collaborazione con Acer, Asus, Dell, HP e Lenovo.

Ecosistema e strategia

Nel contesto delle grandi strategie di implementazione dell'IA nei dispositivi, si osservano tre modelli:

    • Apple integra l'intelligenza artificiale all'interno di ogni applicazione esistente
    • Microsoft posiziona Copilot in un pannello laterale
    • Google incapsula Gemini direttamente nel dispositivo stesso: non in background, ma incarnato nel cursore, nei widget e nell'interfaccia.

Questa ultima mossa è una scelta filosofica significativa per il futuro dell'interazione uomo-macchina.

Implicazioni e limitazioni

Nonostante le promesse, Googlebook è previsto in primavera solo come prodotto premium senza prezzo definitivo. Il grosso ostacolo è l'ecosistema Android su dispositivi desktop: senza applicazioni native ottimizzate per schermi grandi, Magic Pointer opera in un contesto ancora in via di sviluppo. Inoltre, in qualsiasi mercato dove Gemini sia limitato per normative regolamentari, l'intera proposta Google perde rilevanza.

Perspective future

Il Magic Pointer rappresenta una svolta epocale. Al contrario di Microsoft dove i modelli di grandi dimensioni si integrano in pannelli laterali come estensioni dei sistemi esistenti, Google ha scelto un percorso radicale: l'intelligenza artificiale non è più un semplice assistente, ma l'interfaccia che governa l'accesso a tutte le funzionalità dei dispositivi. Questa rivoluzione mina all'origine l'immagine di chatbot come entità separate, proponendoli come agenti contestuali direttamente legati al flusso naturale dell'uso delle tecnologie digitali.