La popolarità di servizi di intelligenza artificiale generativa come ChatGPT ha suscitato un notevole interesse nell'applicazione di questi nuovi strumenti a pratiche applicazioni aziendali. Oggi, praticamente ogni applicazione aziendale viene ampliata con funzionalità di IA generativa. Sebbene la maggior parte degli strumenti di IA, data science e machine learning per lo sviluppo, la distribuzione e l'operatività supporti applicazioni di IA generativa, questo articolo si concentra specificamente sugli strumenti dedicati all'IA generativa.

Questi strumenti supportano la gestione del ciclo di vita dello sviluppo dell'IA, la gestione dei dati per tale sviluppo e la minimizzazione dei rischi di sicurezza e privacy. Esistono anche molte nuove tipologie di IA generativa che non utilizzano grandi modelli linguistici (LLM) per compiti come la generazione di immagini, video, audio, dati sintetici e la traduzione tra diverse lingue. Ciò include modelli creati con reti generative avversarie (GAN), diffusione, autoencoder variazionali e tecniche multimodali.

In questo contesto, di seguito sono riportati ulteriori dettagli sulle principali categorie di strumenti di sviluppo di IA generativa e sulle loro capacità, insieme ad alcuni dei principali fornitori e implementazioni open source. È anche degno di nota che molti dei principali fornitori stanno iniziando ad espandere la loro offerta principale per supportare più categorie attraverso acquisizioni o sviluppo. Anche se molti strumenti esistenti supportano una specifica categoria, le aziende dovrebbero valutare quali funzionalità delle piattaforme principali supportano queste funzioni direttamente o tramite marketplace integrati nella pianificazione della loro strategia di IA generativa.

Figura 1: Esempi di applicazioni di IA generativa di successo.

1. Modelli e servizi fondamentali

I nuovi strumenti di IA generativa si sono in gran parte concentrati sulla semplificazione dello sviluppo e dell'uso responsabile degli LLM, creati con approcci basati su trasformatori che i ricercatori di Google hanno pubblicato nel 2017. Nuovi modelli di base, che si basano sugli LLM, possono spesso essere utilizzati direttamente per migliorare le applicazioni esistenti. In altri casi, i fornitori sviluppano modelli specifici per il dominio per diversi settori e casi d'uso. Esempi dei migliori modelli e servizi fondamentali includono Claude di Anthropic, Ernie di Baidu Research, Generate di Cohere, la serie Llama di Facebook, Palm di Google, Orca di Microsoft, la serie GPT di OpenAI e il Falcon LLM del Technology Innovation Institute. Tra i principali LLM specifici per dominio troviamo C3 AI, Deci, DeepMind AlphaCode, Google Med-Palm, Nvidia NeMo, BioNeMo e Picasso, oltre a OpenAI Codex.

2. Piattaforme Cloud per IA generativa

Le grandi piattaforme cloud stanno anche introducendo una serie di funzionalità di IA generativa per aiutare le aziende a sviluppare, implementare e gestire modelli e funzionalità di IA generativa. Tra le piattaforme di IA generativa dei fornitori di cloud figurano AWS Generative KI, Google Generative KI e IBM Watsonx. Tra le popolari piattaforme di sviluppo per IA generativa di terze parti per lo sviluppo di IA generativa nel cloud si annoverano le offerte di Hugging Face e Nvidia.

3. Strumenti per l'ottimizzazione dei casi d'uso

I modelli di base generici possono produrre testi che suonano significativi e ben articolati. Tuttavia, tendono anche a "allucinare" e a generare informazioni inaccurate. Gli strumenti di sviluppo specifici per l'IA generativa possono anche aiutare le aziende a sviluppare i propri LLM, adattati alle loro esigenze individuali e alla loro esperienza. La Retrieval-augmented Generation (RAG) può ottimizzare i modelli di base per migliorare la precisione. Gli strumenti di fine-tuning aiutano le aziende a calibrare i modelli di base. Gli strumenti RAG e di fine-tuning sono talvolta utilizzati insieme per bilanciare i vantaggi di entrambi gli approcci.

Tra i principali strumenti RAG figurano il ChatGPT Retrieval Plugin, l'Hugging Face Transformers Plugin e strumenti open source come Farm, Haystack e Realm. Le funzionalità di fine-tuning sono integrate nei servizi per accedere alla maggior parte dei modelli di base commerciali. Altri strumenti di fine-tuning di terze parti includono Entry Point e SynthFlow (ex Fine-Tuner), nonché prodotti di Hugging Face che lavorano con modelli open source.

4. Strumenti di garanzia della qualità e riduzione delle allucinazioni

Nuovi strumenti per il rilevamento delle allucinazioni possono aiutare a identificare e ridurre la prevalenza delle allucinazioni per diversi casi d'uso. Tra i principali strumenti per la riduzione delle allucinazioni figurano LLM Studio di Galileo Labs, Gleen di Helix3 Labs, TruLens di TruEra e la piattaforma Vectara di Vectara. Nuove tecniche di ricerca, come l'algoritmo Woodpecker, possono supportare le aziende nello sviluppo di propri flussi di lavoro per prevenire le allucinazioni. Molti di questi fornitori hanno rilasciato varianti open source, tra cui ChainPoll di Galileo Labs e l'Hughes Hallucination Evaluation Model di Vectara.

5. Strumenti di prompt engineering

Gli strumenti di prompt engineering aiutano a gestire le interazioni con gli LLM e a testare gli LLM. Le varianti orientate all'utente di questi strumenti facilitano lo sviluppo e la gestione di librerie di prompt utili. Le varianti orientate alla tecnica supportano l'automazione dei processi di test per identificare pregiudizi, tossicità o allucinazioni. Tra i principali strumenti di prompt engineering figurano BetterPrompt, OpenPrompt, PromptAppGPT, Prompt Engine e Promptimize.

6. Strumenti di aggregazione dati

I primi modelli di base supportavano finestre di contesto limitate, che indicano quanti dati un LLM può elaborare in una query. Sebbene questi modelli stiano migliorando nella gestione di finestre di contesto più grandi, gli sviluppatori hanno creato diversi tipi di strumenti per lavorare con set di dati più ampi.

Gli strumenti di concatenazione dati, come LangChain, possono automatizzare il processo di inserimento di più documenti negli LLM. I database vettoriali archiviano i dati in un formato intermedio, chiamato spazio di embedding, per poter lavorare con gli LLM. Tra i principali database vettoriali figurano Chroma, Faiss, Pinecone, Qdrant e Weaviate.

7. Strumenti di IA basati su agenti e autonomi

Gli sviluppatori stanno anche esplorando modi per automatizzare le interazioni tra uno o più modelli di base e i servizi backend a cui potrebbero fare riferimento. A lungo termine, ciò potrebbe consentire lo sviluppo di IA basata su agenti o IA autonoma.

Tra gli strumenti di IA autonoma e basata su agenti figurano strumenti open source come AgentGPT, AutoGPT, BabyAGI e il framework per computer autonomi di OthersideAI. I fornitori di piattaforme offrono anche nuovi servizi per l'integrazione di flussi di lavoro su più modelli e servizi LLM.

8. Applicazioni per l'ottimizzazione dei costi dell'IA generativa

Gli strumenti di ottimizzazione dei costi dell'IA aiutano a trovare il miglior equilibrio tra prestazioni, precisione e costi. Questi strumenti sono ancora nelle prime fasi di sviluppo, ma un esempio precoce è il Model Router di Martian. È probabile che i leader di mercato esistenti nel campo dell'ottimizzazione dei costi del cloud sviluppino offerte analoghe a lungo termine.

Per saperne di più sullo sviluppo software:

  • LLM nell'analisi del malware: opportunità e limiti
  • RAG agentico innesca la prossima fase dell'evoluzione dell'IA
  • Riconsiderare l'IA: la piccola IA sulla corsia di sorpasso
  • Amazon Bedrock (AWS Bedrock)

Di: Cameron Hashemi-Pour