L'AI tascabile di Rabbit "r1" rende le attività quotidiane un gioco da ragazzi.
Coniglio mira ad andare oltre le possibilità produttive dei grandi modelli linguistici e ad affermare l'intelligenza artificiale come parte integrante della vita quotidiana. A tal fine, Rabbit lancerà l'r1, un dispositivo di intelligenza artificiale personale che svolge compiti utilizzando varie applicazioni per conto dell'utente. Il dispositivo è stato presentato ieri alla CES 2024 e ha generato un grande interesse online, con milioni di visualizzazioni dei post promozionali.
Il dispositivo, progettato dall'azienda tecnologica svedese Teenage Engineering, ricorda la console portatile Playdate, anch'essa progettata da Teenage Engineering. Con una dimensione paragonabile a quella di un Post-it, il dispositivo si adatta facilmente a qualsiasi tasca. Utilizza un modello linguistico completo di OpenAI per interpretare i comandi vocali dell'utente. L'obiettivo di Rabbit, tuttavia, come già accennato, è quello di andare oltre le capacità produttive dei grandi modelli linguistici (LLM) e passare a un'intelligenza artificiale più proattiva e coinvolgente.
Presentazione della r1. Guarda il keynote.
Ordina ora: https://t.co/R3sOtVWoJ5 #CES2024 pic.twitter.com/niUmjFvKvE
- rabbit inc (@rabbit_hmi) 9 gennaio 2024
r1 utilizza le credenziali dell'utente per un accesso continuo alle applicazioni
Il punto di forza di Rabbit è il suo software, un modello di intelligenza artificiale appositamente sviluppato che impara a gestire le applicazioni per conto dell'utente. Questo modello di intelligenza artificiale, noto come Large Action Model (LAM), consente all'utente di eseguire compiti come "ordinare un autista Uber per l'ufficio, riprodurre musica motivazionale durante il tragitto e informare il team del mio ritardo". LAM utilizza quindi le app appropriate per completare questi compiti.
La capacità di LAM di coordinare le app consente un'esperienza che va oltre quella di uno smartphone. "Siamo arrivati a un punto in cui i nostri smartphone sono pieni di centinaia di app le cui complesse interfacce utente non comunicano tra loro", spiega Jesse Lyu, fondatore e CEO di Rabbit. "Di conseguenza, gli utenti si sentono spesso frustrati e smarriti".
Il modello è stato originariamente addestrato analizzando migliaia di sessioni utente registrate in varie applicazioni. Gli utenti possono concedere a r1 l'accesso alle loro applicazioni inserendo le proprie credenziali attraverso una pagina di configurazione sul proprio laptop o desktop.
Lyu spiega che le funzionalità disponibili tramite API sono spesso limitate e che l'estensione delle funzionalità API è raramente una priorità elevata per gli sviluppatori di app. Pertanto, Rabbit ha deciso di accedere alle app direttamente tramite le credenziali dell'utente. In teoria, il modello LAM può apprendere tutto ciò che un utente può fare all'interno di un'app.
$199, senza abbonamento: https://t.co/R3sOtVVQTx #CES2024 pic.twitter.com/IFZ9ZC3F21
- rabbit inc (@rabbit_hmi) 9 gennaio 2024
Come reagiscono gli sviluppatori di app alla strategia di Rabbit?
È inevitabile chiedersi come reagiranno gli sviluppatori di app all'approccio di Rabbit. Rabbit consente agli utenti di utilizzare un agente AI come proxy per utilizzare le loro app. Secondo l'azienda, è improbabile che questo proxy mostri pubblicità o incoraggi acquisti in-app. Lyu non crede che gli sviluppatori di app avranno problemi se i loro servizi continueranno a essere utilizzati, ma in un modo nuovo.
Nel corso di quest'anno, Rabbit introdurrà una "modalità di insegnamento" che consentirà agli utenti di addestrare direttamente il modello LAM all'uso delle loro applicazioni principali. Tramite un portale web, chiamato "tana del coniglio", gli utenti potranno mostrare al modello come utilizzano le loro applicazioni e addestrarlo in questo modo. Rabbit spiega che, osservando l'interazione degli utenti con determinate applicazioni, il modello può comprendere e imitare le azioni umane sulle interfacce informatiche. Ciò consente al modello di apprendere nuovi compiti in modo affidabile e rapido. Ad esempio, si potrebbe insegnare a un programma di editing video a rimuovere le filigrane dalle foto.
Rabbit sostiene che il design e le caratteristiche dell'r1 gli consentono di svolgere le attività dell'utente più velocemente di un moderno smartphone. Il dispositivo portatile ha un display touchscreen da 2,88 pollici, pesa 115 grammi ed è dotato di una rotella per scorrere le "schede" con informazioni testuali sulle attività di intelligenza artificiale. Una fotocamera rotante consente di svolgere attività di computer vision come il riconoscimento degli ingredienti dei cibi. Il dispositivo supporta anche le videochiamate e offre connettività Wi-Fi e cellulare, un processore MediaTek, 4 GB di RAM, 128 GB di memoria, una porta USB-C e uno slot per schede SIM. La batteria dovrebbe durare un giorno intero.
Lyu annuncia che l'r1 sarà disponibile a 199 dollari e verrà spedito entro Pasqua (31 marzo).