In un significativo aggiornamento per il panorama dell'intelligenza artificiale, Cohere ha annunciato versioni migliorate dei suoi modelli di punta Command R e Command R+, consolidando la propria posizione nel settore dei modelli linguistici di grandi dimensioni (LLM) ottimizzati per applicazioni aziendali, in particolare per la generazione aumentata da recupero (RAG) e la gestione di dati strutturati. Questi sviluppi, resi pubblici con un aggiornamento in data 1° settembre 2024, promettono di ridefinire l'interazione tra le aziende e i loro dati attraverso interfacce conversazionali avanzate.
Le nuove iterazioni dei modelli Command R e Command R+ introducono una serie di miglioramenti critici che ne potenziano l'efficacia e l'efficienza. Tra le aree di progresso spiccano la codifica, la matematica, la logica e una latenza ridotta, aspetti fondamentali per le applicazioni enterprise che richiedono risposte rapide e precise. Inoltre, Cohere ha ampliato le funzionalità dei modelli per supportare un numero maggiore di applicazioni multilingue e per facilitare l'analisi di dati strutturati, rendendoli strumenti versatili per un pubblico globale.
Secondo Cohere, il modello Command R ha registrato miglioramenti così sostanziali da essere ora paragonabile alla precedente versione del ben più grande Command R+. Questa evoluzione significa che le aziende possono accedere a prestazioni di alto livello a costi potenzialmente inferiori. I modelli supportano ora oltre 10 lingue, offrono citazioni inline per verificare le risposte e nuove opzioni di personalizzazione volte a ridurre ulteriormente la latenza, garantendo esperienze utente più fluide e affidabili. Gli sviluppatori e le aziende possono accedere alle ultime versioni della serie Command R a un prezzo più conveniente tramite l'API ospitata di Cohere e Amazon Sagemaker. Inoltre, Cohere ha recentemente stretto una partnership con Fujitsu per fornire servizi di intelligenza artificiale alle aziende giapponesi, ampliando la sua portata internazionale.
Command R+: l'LLM di Cohere per il data-chat (RAG)
Questi recenti aggiornamenti si basano sulle solide fondamenta gettate dall'annuncio originale di Command R+ il 6 aprile 2024. All'epoca, Cohere presentava Command R+ come un nuovo LLM specificamente ottimizzato per la generazione aumentata da recupero (RAG) e per l'utilizzo di strumenti in applicazioni aziendali. Il modello era già disponibile su Microsoft Azure, segnando un importante passo avanti nell'offerta di soluzioni AI robuste e mirate alle esigenze enterprise.
Command R+ è stato sviluppato partendo dalle comprovate capacità del precedente Command R, introducendo miglioramenti significativi in tutte le aree di performance. Cohere ha dichiarato che Command R+ supera modelli simili nella stessa categoria di prezzo e si dimostra competitivo anche con modelli notevolmente più costosi, come GPT-4. Questa affermazione sottolinea l'impegno di Cohere nel fornire intelligenza artificiale di alto livello accessibile.
Le forze di Command R+
Secondo Cohere, Command R+ si distingue per le seguenti caratteristiche chiave, pensate per massimizzare il valore aziendale:
- Generazione aumentata da recupero (RAG) avanzata con citazioni delle fonti: Questa funzione è cruciale per ridurre le "allucinazioni" dei modelli AI, fornendo agli utenti la possibilità di verificare la provenienza delle informazioni.
- Supporto di dieci lingue chiave: I modelli sono ottimizzati per inglese, francese, spagnolo, italiano, tedesco, portoghese, giapponese, coreano, arabo e cinese, facilitando l'adozione in contesti internazionali e multilingue.
- Uso di strumenti per l'automazione di processi aziendali complessi: Command R+ può interagire con sistemi esterni per eseguire azioni e automatizzare workflow complessi.
Il focus particolare sul RAG (chat basata su database) è di grande interesse per le aziende. Il nuovo modello migliora l'accuratezza delle risposte e fornisce le citazioni delle fonti, riducendo significativamente il rischio di risposte errate o inventate, un problema comune nei modelli AI generativi tradizionali.
Prestazioni e confronto con i concorrenti
In un test comparativo che ha valutato la riproduzione fluida del testo, la qualità delle citazioni e l'utilità generale, Command R+ ha superato i modelli concorrenti, incluso GPT-4. Ha anche dimostrato una maggiore accuratezza nei test di domande e risposte che utilizzano dati di Wikipedia e Internet, evidenziando la sua robustezza e affidabilità nella gestione delle informazioni.
In termini di costi, Command R+ si posiziona in modo molto competitivo. I costi di input e output per un milione di token sono rispettivamente di $3 e $15, collocandolo allo stesso livello di prezzo di Claude 3 Sonnet. Per fare un confronto, il più recente modello GPT-4-Turbo con 128K token costa $10 per un milione di token di input e $30 per un milione di token di output, mentre Claude 3 Opus ha un costo di $15 e $75 rispettivamente. Questa struttura di prezzi rende Command R+ un'opzione attraente per le aziende che cercano soluzioni AI ad alte prestazioni senza costi proibitivi.
Modello linguistico con accesso a strumenti
Command R+ non è solo un generatore di testo; dispone di funzionalità per l'utilizzo di strumenti, accessibili tramite le API di Cohere e LangChain. Questa capacità permette al modello di svolgere compiti come l'aggiornamento automatico dei record CRM, integrandosi in modo fluido con i sistemi aziendali esistenti e automatizzando processi che altrimenti richiederebbero interventi manuali.
Una novità significativa in Command R+ è il supporto per il Multi-Step Tool Use. Questa funzionalità permette al modello di combinare più strumenti in più passaggi per risolvere compiti complessi. Command R+ è anche progettato per essere in grado di autocorreggersi se commette un errore durante l'utilizzo di uno strumento o se lo strumento stesso fallisce, migliorando notevolmente l'affidabilità e l'autonomia del sistema. Nei test sugli strumenti, come ToolTalk (Hard) di Microsoft e il Function Calling Leaderboard di Berkeley, il modello ha ottenuto risultati paragonabili a quelli di Claude 3 Sonnet e GPT-4-turbo, a riprova delle sue capacità avanzate di interazione con gli strumenti.
Disponibilità e licenze
Command R+, inclusi i suoi pesi, è disponibile gratuitamente per scopi di ricerca. Tuttavia, per chi desidera utilizzare il modello commercialmente, in locale o su cloud non offerti direttamente, è necessario contattare Cohere per un accordo di licenza. Una versione demo è disponibile per consentire agli utenti di esplorare le capacità del modello.
Cohere ha anche annunciato una collaborazione strategica con Microsoft Azure, che consente a sviluppatori e aziende di accedere ai modelli più recenti di Cohere tramite la piattaforma Azure. Nelle prossime settimane, Cohere sarà disponibile anche su Oracle Cloud Infrastructure (OCI) e altre piattaforme cloud, ampliando ulteriormente la sua accessibilità.
Notizie sull'AI senza hype – curate da persone
Questo approfondimento sui progressi di Cohere fa parte dell'impegno di The Decoder nel fornire notizie sull'AI senza sensazionalismi, curate da esperti. Per accedere a contenuti esclusivi e far parte di una community informata, è possibile sottoscrivere l'abbonamento THE-DECODER-Abo, che offre numerosi vantaggi:
- Lettura senza pubblicità e accesso alla community.
- Possibilità di discutere nel sistema di commenti.
- Ricezione della newsletter settimanale sull'AI.
- 6 volte all'anno, la newsletter "KI Radar" – Frontier-Newsletter con gli ultimi sviluppi dalla punta della ricerca sull'AI.
- Fino al 25% di sconto sugli eventi KI Pro.
- Accesso all'archivio completo degli ultimi dieci anni.
Sottoscrivere l'abbonamento significa ottenere più del 16% di sconto e leggere senza distrazioni, senza banner pubblicitari di Google. È un modo per rimanere sempre aggiornati sulle ultime informazioni sull'AI da The Decoder, chiare e concise.