Siamo soliti usare le intelligenza artificiale generativo per tradurre testi, chiecare informazione o per raiasumere document. Fargli assumere il Ruolo del Comandante in Un gioco di Strategia per compenso Fino a Che Punto Possono Essere Sovversive E Cospirare Lungo il Loro Percorso Evolutivo è un esperimento Che richiama l'Attenzione, puro Essendo Già STOTO IPOTIZTO DA UN GRUPPO DI RICECERA CINESE NEL 2024, DEL QUALE PARLEREMO PIO AVANTI.
L'idea, Resa Publlica il 5 Giuugno del 2025, è di Alex Duffy Della Società Di Consolenza Every – Una Compagnia Americana Di Media e Software Nata Nel 2020 Che Offre Anche Formazione E Servizi Basati Sulle IntelligAce Artificiali (IA).
IL GRUPPO DI LAVORO COOTINATO DA DUFFY HA CREATO UNA RIVISITAZIONE DEL GIOCO DI DIPLOMACCIA DI STATEGIA AFFINCHÉ, A CAPO DELLE BAGIGIO POTENZE D'EURO DEL 1901, VI FOSERO DEI DEI MODELLI IA INVECE DI GIOCATORI UMANI.
Diplomacy è un un Gioco da Tavolo di Strategia (Qui Su Twitch) Ambientato Dolli Anni Ineatiatemente precedenti la Grande Guerra Nel Quale Sette Potenze, Austria-Angheria, Francia, Germania, Inghilterra, Italia, Russia E Turchia, Si Sfidano Per Conquica.
La diplomazia ha previsto la creazione di alleanze e negoziati che possono però essere disattese durente la partita, tanthe che Il bluff e il tradiporo sono importante importante tattica di gioco.
Gli llm chiamo si sono sbidati una diplomazia
I Modelli ia Che Hanno Partecipato al Gioco Sono in totale 18, ma ogni partita è stata giocata solista da 7 di missi. Abbina Sono Stati in Tutto 15, per un totale di 36 minera di gioco e la versione rivisitata di diplomacy è stata Resa open source, affinché chiunque whoxa Fare Ulteriori test E, Magari, Schitare Contemporaneament llm e Giocaratori in Carne e Ossa.
Nello Speci SpeciSo, I Modelli Sono:
CHATGPT O3, CHATGPT 4.1, CHATGPT 4O E CHATGPT O4-Mini
Claude 3.7 Sonnet, Claude Sonnet 4 E Claude Opus 4
Deephermes 3
DeepSeek R1-0258 E DeepSeek V3
Google Gemma 3, Google Gemini 2.5 Flash E Gemini 2.5 Pro
Grok 3
Llama 4 Maverick
Medium mistral 3
Qwen 3, Qwen QWQ-32B
Il Termine Llm, modello di grande lingua, fa riferimento a un'intelligenza artificiale Avanzata addestrata su un'enorme quantità di data (big data) e algoritmi di apprendimento. I llm sono i pilastri su cui appoggiano le ia generativo, quindi anche quelle usa per giocare una diplomazia.
Vieni SI sono comportati gli llm
CHATGPT-O3 Ha vinto a Mani Basse. Ha Saputo Manipolare Gli Avversari per POI Tradirli. Claude 4 opus si è dimostrato il più “credito”Stringendo Alleanze Pacifiche Che, Alla Fine, non Si Sono Rivelate Tali.
Anche Gemini 2.5 Pro Si è comportato in Modo Lineare e Pacifico, Mostrando Spiccate Doti Strategiche Che, Però, Sono State Rese Vane da Una Coalizione Segreta Creata da Chatgpt-O3.
DeepSeek R1 ha emulato una personalità istrionica nel proporre e GESTIRE LE Negoziazioni Mostrando Capacità Simili A Quelle di Llama 4 Maverick, Che però è stato Meno Teatrale e Ha Badato All'essenziele.
Non Chiamatele allucinazioni: Quelle Dell'intelligenza artificiale sonoro e proprieo Baggianate
Giuditta Mosca
30 Agosto 2024
COSA DEDURRE da Questa
Con il supporto del professore Alessandro FarinelliProfessore Ordinario di Informatica Presso l'Università Degli Studi di Verona e Diretore del DiParpolo di Informatica, Esaminamo le Finalità Dell'esperimento e Quanta, Simili Test, Siano Degni di Credibilithà.
Professor Farinelli, I llm si comportano Come Noi Perché sono Addestrati Su Dati Prodotti Dall'Uomo. ERA LECITO ASSEGNERSI UN ROSULATO Diverso, al di là dei modelli Che Si sonoro dimostrati più spregiudicati di altri?
“L'idea del'esperiment è interate, in particolare è interassante l'idea di usare un gioco di strategia vieni benchmark per valoroso alcuni aspetti dEi comportamento dii llm, tuttavia sarei muloto cauto riguardo alle conclusioni che si possibili dall'es perché perché Fare Un'analisi Molto Approfondita delle Interazione Che sono Occorse Tra i Vari llm e Soprattutto Dovrebbero Essere Chiarite le Condizioni in Cui l'Esperimento è stato di Dilazioni di revisione. Risulta Sia Stata Fatta per Questo Esperimento Breve, Quindi sì, è ragionevole aspettarsi che le risposte Fornite da misti sistemi emulino quelle che darebbe un persona è impegnata Nels Medesimo gioco.
Tuttavia, A Mio Avviso una Domanda Molto importante è Capire se i Sistemi llm Siano Effettivament nel grado di definire strategia complice di Lungo termine e come possano evolvere nel tempo in base alla base interazione che hanno avuto tra loro. Questo non è affatto scontato, come non è scontato che un esperimento di questo tipo, in cui si osservano dall'esterno le interazioni dei sistemi senza analizzare come evolvono all'interno, sia la maniera migliore di procedere per valutare le effettive capacità dei sistemi stessi”.
FACCIAMO CHIAREZZA: GLI LLM Sono Sono AddESTRATI SU SUNSET DERIVERI TRA LOO? Così non fosse, come si spiegherebbe la differenza di Atteggiamento che Hanno mostre durente il gioco?
“È Molto complimento sapere eSattamente su qualità Dati Siano Addestrati i llm menzionati, ma è estemene Probabile Che Siano Addestrati su Dati Studiativament. Parametri Che varia Molto da Modello a Modello, Ma ci sono Differlenze Anche In Come I Vari elementi computazionali Vengono Collegati tra Loro, viene codifato il testo o le immagini che diamo in ingresso nei sistemi di adddestramento utilizzati, vieni vengono geste e vende elaborate elayaeateateate in input nei sistemi di adddestamento utilizzati, venne vengono geste e vende elaborate elayaeateateate input nei sistemi di adddestamento usilizzati, vieni vengono gestite e vengo elayeateakeate dylakeate in input nei sistemi di adddestamento usilizzati, vieni vengono geste e vende elaborate per esempio. È quindi Molto ragionevole aspettarsi comportamenti diversi da modelli diversi ”.
POSAMO INGERIRE INDICAZIONI SU QUANTO SARNO CONCETTITION LE IA a FUTURO, QUANDO VERRANNO IMPIEGA A CONTERI AZIndali, politici e – PERCHÉ NO? – Diplomatico? Ovvere, è Giunto il Moment di Sdoganare una cultura più ampia Che non Si SI Limite all'uso delle ia assolo generativo per radiasumere testti, tariffa traduzioni o creare immagini?
“Capire se miseri sistemi posano essre usati per suggerire azioni da intrapendere è un aspetto Molto importante e delicato. Sono impressionante.
Tuttavia, la Possibilità di USare llm per Support le'analisi Strategica e Prenre Decision è una UNA DOMANDA APERTA SU CUI la Comunittà scientifica sta LAvondo e la Cui risposta Richiede un Passo Avanti Notole Nella Nostra Complensite DiStemi Sistemi. A BREVE, MISHO ESPERIMENTO PONE SICURAMENTE DELLE DOMANDE MOLTO InterSanti MA NON CREDO POSSO FORNIRE RISPOSTE definitivo, Almeno nella Sua forma Attuale ”.
Un benchmark UN esperimento Simile Supera Gli Attuali? Perché?
“L'Esperimento è Sicuramente Diverso dalle modalià Attuali di Valutazione del dii llm, per dovuto motivale Principali, da un late propone l'USo dei llm per compiti Strategici Molto Molto complice non rientrano eSattente erano shascopi per cui da cui sondemi sonati sonati sonati sonati sonoti sonati sonoti sonoti sonoti sonoti sonoti sonoti sono sonoti sono sono sono sono sonoti sono sono sono sono sonotima sonoti sonoti sono sono sono sonoti sonoti sonoti spologetta sonoti spologetta sonoti -dalti. Element Dinamico: I LLM Interagiscono tra Loro Operando Quindi Su Dati Che Si modificano Nel Tempo in base al Loro Stesso Comportamento. Migliore per Essere Poi Utilizzato in Nazioni Unite Aziedale.
Intelligenza artificiale
Dall-e 3, Grok e Midjourney: Qual è l'ia più pronta una notizia falsa di Generar?
Emanuele Capone
20 Agosto 2024
COSA DICONO GLI Studi Sul Rapporto Tra ia e Diplomazia
Una ricca a Cui Hanno Partecipato esperti di Diverse Università e Istituti cinesi, parte Dal presupposto secondo il quale la diplomazia Tutte le Parti Coinvolte. Da qui – e preside ci rimanda alle'esperimento condotto dal grupo di lavoro di alex duffy – i ricercari cinesi hanno lavoro su Richelieu, agente delle Nazioni Unite Ia Progetta per Gioca una diplomazia E Che non USA set di dati Specifica specifico, Facendo Invece Leva Sul Self-Play, Ossia Sulla Capacità di Migliorora le proprie Concorrenze nella base Allesperienza Acquisita Giocando.
RICHELIEU HA DELLE PECULIARIZA DI RAGIONAMENTO SOCIALE, ESAMINA CIOIE LE INTENZIONI E LE RELAZIONI TRA GLI AVVERSARI, RICORDA I DATI DELLE DELLE NEGOZIAZIONI PASSATE E NE FA USO PER OTTIMEZIONE LE DECENIZIO CHE PRENDE IN STRATEMI DI UN CONTERIO DI STRATEMI DA SVVILUPRE E SULUPE ELUNGO PIBILO.
I Risulti Osservati Suggeriscono una certa Abilità di Richelieu Nelstricarsi tra scenari complici in quadro generale Lontano dal Reggere il Passo con fluidità ei Capovolgeri Repentini Tipici della Diplomazia Nel Mondo Reale. L'agente Creato Dai Ricercatori è una STOTA RESO CompatiBile con diversius llm per Lasciare Anche ad altri Ricercari la Possibilità di Farne Uso.
Allargando Il Focus, VA Cita Uno Studio Condotto Dall'agenzia Australiana per La Scienza (CSIRO) HA ANALIZATO 230 Documi Accademite per Proporre Alcune Strategie Utili A integrare l'utile Delle ia generativa NELL'ESCIZIO DELLE RELAZIONI DIPLOMATHE. I Vantaggi, tra I Qualri il Miglioramento delle Comunicazioni diplomatiche e l'analisi Approfondita Delle Crisi, Sono Controbilantiti da Svantagi altrettanto Rilevanti, Soprattutto I RISCHI DI BIAS E DI Disinformazione compromettere le diplomatiche. Il Risultato a Cui sono giunti i riccatori è quasi scontato: le ia generativo Promettono bene Ma Recolenazioni di Tipo Normativi Ed Etico.
Ampliando ancora di più il raggio, un gruppo di ricercari americano ha redatto uno studio per sondalare il riscato di escalation derivante dall'uso di llm nelle decision militari e diplomatiche.
Sono stati testeti GPT-4, GPT-3.5, Claude-2 e llama 2 ed è stato stata Osservata una Loro Naturale Predisposizione All'escalation, Ossia Tendono a intensificale lo Stato Conflittuate Con il Passaare del Tempo. Lo Studio Pone l'Accento Sul Fatto Che i Modelli non Escludono il Ricorso Alle Armi, Tantomeno a Quelle Nucleari. ANCORA Prima, Le Scelte Strategiche Sembrano Giustificale il Ricorso ad Attacchi Militari preventivi I Quali Sono complecipi Del'escalation.
Lo Studio Boccia Senza Mezzi Termini L'imccuga delle ia olessini ambiti diplomatico-militari Rimandando a Studi Ed Evoluzioni Future Una Nuova Analisi. Insomma, Quando il gioco si fa sieio, le ia da unica non bastano più. C'è Bisgno Della Supervedee Dell'Uomo.

