Avataar lancia Varya, un modello video adatto al mercato indiano

L'output generato da modelli di AI in India è stato fino ad ora inferiore a quanto visto in Stati Uniti, Europa e Cina. Molti hanno lanciato solo modelli di grandi dimensioni per linguaggio o voce. Per stimolare nuovi sviluppi, il governo ha lanciato la India AI Mission, un'iniziativa di circa 1,2 miliardi di dollari che permette a selezionati startup di accedere a GPU a tariffe scontate in cambio del rilascio pubblico dei modelli. Tra le 12 startup selezionate per il programma, Avataar AI ha lanciato Varya, un modello video pensato per comprendere il contesto locale, identificando ad esempio feste, alimenti e abbigliamento specifici dell’India.

Piccoli passi e grandi risultati

Avataar AI, finanziata da Peak XV, ha realizzato Varya non partendo da zero ma adottando il modello pubblicamente disponibile Wan 2.2 di Alibaba. Ha utilizzato una tecnica detta distillation, per comprimere il modello in una versione più agile e veloce, ottimizzata per gli specifici usi di Avataar. Il risultato è un modello che opera in quattro passaggi, rispetto ai 50 di Wan 2.2, producendo video 10 volte più velocemente, ad un costo nettamente ridotto.

Con un GPU NVIDIA H200, Varya è in grado di generare un video da 5 secondi in 720p in 45 secondi, mentre Wan 2.2 ci impiega 1.230 secondi.

L’aspetto più sorprendente di Varya è il prezzo. Avataar prevede di addebitare ₹0,48 (circa $0,005) al secondo per i video su servizio hostato. Questo è estremamente più economico rispetto a prodotti simili come Veo, Kling, Luma, e Runway, che di solito richiedono $0,10 o più al secondo. La differenza è di circa 20 volte.

La visione sostenibile di Peak XV

Rajan Anandan, direttore generale di Peak XV, commenta: "L'India è un mercato video-guidato. Ogni prodotto per grandi consumatori in India mostra questa tendenza: il video domina sul testo. I modelli AI di video correnti sono troppo costosi per essere utilizzati su larga scala qui. Se l'intelligenza artificiale per il video deve raggiungere studenti, insegnanti, PMI, creatori, aziende e servizi pubblici, i costi devono ridursi in modo drastico. Il costo è il principale fattore che accelera l'adozione della tecnologia AI in India."

Un modello che capisce cultura e località

Modelli di generazione di immagini e video spesso mancano di dettagli culturali specifici, producendo output stereotipato o generico — un problema che TechCrunch ha evidenziato in più occasioni. Avataar utilizza però dati accuratamente selezionati per addestrare Varya a riconoscere sottigliezze culturali, come alimenti tipici, moda nazionale, architettura e celebrazioni locali.

Rilasciato in forma aperta, con dati di training

Varya sarà rilasciato come modello open-weight sul portale India's AI Kosh, il deposito centrale del governo per modelli di AI accessibili al pubblico e insiemi di dati. Saranno disponibili anche i dati di addestramento, permettendo agli sviluppatori di ospitarlo o personalizzarlo. Avataar intende rendere il modello disponibile anche ai propri clienti aziendali e sta cercando collaborazioni con applicativi video, tra cui Higgsfield e Adobe Firefly. Chiunque può provare Varya adesso visitando il suo sito web inserendo input testuali o immagini di riferimento.

Le ambizioni AI dell'India: creare un ecosistema sostenibile

Il lancio di Varya evidenzia il dilemma centrale delle ambizioni AI in India. Persone con esperienza nell'industria concordano sul fatto che l'India possa distinguersi nell'AI creando applicazioni e costruendo un ecosistema sviluppatore robusto piuttosto che competere nei modelli fondamentali. Questa visione pragmatica nasce dal ritardo che India ha avuto rispetto ai paesi concorrenti, in parte a causa della scarsità di risorse di calcolo e di dati di alta qualità.

La India AI Mission fa parte di uno sforzo più ampio del governo per colmare questo gap. Lo scorso anno, ha selezionato 12 startup — tra cui Avataar — per lo sviluppo di modelli AI, offrendo loro accesso a risorse di calcolo low-cost. A breve, il ministro delle comunicazioni e delle tecnologie della informazione Ashwini Vaishnaw ha ribadito l’ambizione di attrarre 200 miliardi di dollari di investimenti in AI entro il 2028, e di raddoppiare la capacità GPU dell’India entro sei mesi.