Nel panorama Semper Più Abollato Degli Assistenti Vocali e AgentI Intelligenti, La Domanda non è più Solo se l'Ai POSSA Premere il Pulsante Giusto, Ma se Sappia DavVero acade Dopo. Ed è proprio alla questione al Centro di Uno Studio publicato da Apple, Conferenza di Present Aacm su interfacce utente intelligenti in Italia.
IL Titolo Dello Studio è “Interazione per l'impatto: verso agenti di AI più sicuri attraverso la comprensione e la valutazione degli impatti delle operazioni dell'interfaccia utente mobile” ed è Stato Realizzato Con lo Scopo Di Misurare il Livello di Consapevolezza Dell'ai Rispetto Agli Effetti Delle Sue Azioni Su Interfacce Mobili.
Fino ad Oggi, Buona parte della Della Ricerca Sull'ai in ambito Ui Si è Focalizzata SULLA Capacità Dell'agente di Navigare Interfacce: Riconoscere I Pulsionti, Muoversi tra I Menu, Selezionare opzion. Ma Apple Ei Co-Autori Dello Studio Hanno DeCiso Di Andare Oltre: non Basta Toccare il Pulsinte Giusto, Bisogna anche sapere quando è il caso di non farlo.
Lo studio ha reclutato Partecipanti per interagire con app reali, Chiedendo Loro di Registrare Tutte Quelle Azioni Che Avrebbero Trovato Preoccupanti se Eseuite da Un'ai in Autonomia: Inviare Messaggi, ModifAre Smarword, Effettuer Transazioni Finanzieie, eme via.
Da qui è nato un framework di classificazione dell'impatto, Che Valuta ogni azione solla base di:
- Intenzionalità Dell'utente (Navigazione, Transazione, Comunicazione …)
- Impatto Visivo Sull'interfaccia
- Diretta Conseguenze per L'Uente
- Reversibilità del'zione
- Frequenza d'illa nella vita reale
Insomma, L'Obittivo è aiUtare l'Ai a Porsi Domande Tipo: “Si Può annulare?”, “Avvisa Qualcun Altro?”, “È un azione permanente?” Prima Di EseGuire Un COMANDO.
Conset set di dati di Con questo in Mano, Gli Autori Dello Studio Hanno Medo alla Prova Cinque Grandi Modelli Linguistici, Tra Cui GPT-4, Google Gemini e il Meno noto Furet-ui di Apple.
Il Risultato? GEMINI HA RAGGIUNTO UNA ACCUREZZA DEL 56%, MENTRE GPT-4 MULMODALE HA TOCCATO IL 58%, Grazie alla Sua Capacità di Ragionamento a Catena (catena di pensiero), Cioè Quella Strategia in Cui il Modello Spiega Passo Passo La Sua Logica.
Furetto-ui? Non è stato il Migliore, MA HA MOSTRATO Progressi e Soprattutto Conferma Che Apple Sta Seriament Sviluppando Ai Proprietaria per Navigare e interpretare le Interfacce Mobili, Con Uno SGuardo Rivol a Siri.
Notizia

