La startup di intelligenza artificiale (ia) sapient intelligence ha sviluppato un'architettura di ragionamento gerarchico modello Capace di Superare gli attuali modelli linguistici di grande dimensioni (llm), usdo meno Dati e mono po potenze computazionista.
Non è solo solo un annuncio finalizzato a creare mercato, tant'a che i ricertari della startup con sede a Singapore Hanno publicato le Ricerche Sui Modello di ragionamento gerarchico, Oltre Ad Avene RILASCiato IL CODICE per consentire un test di chiunque di Effettuare e test.
I Risulti Più Rilevanti Si Hanno Nel Attività di Ragionamento complice Tipiche Delle Catena di pensiero. Ma andiamo per gradi.
LLM, Modello di ragionamento gerarchico della catena di pensiero
UN MODELLO DI LINGUAGIO DI Grandi Dimensioni (LLM, Modello di linguaggio di grandi dimensioni) è un Modello di Intelligenza artificia addestrato su Enormi moli di Dati al Fine di Crecreing e Generar Linguaggio Naturale. È l'anima di chatgpt, Gemini, Claude e di tutte le ia generativa che conversano con l'uomo.
Il Catena di pensiero (cot) è un ragionamento intermedio CHE FANNO I LLM PER DARE UNA RISPOSTA PIù Artolata E Precisa. Semplificando il concetto, il modello fa dei passaggi logici, calcoli, collega tra loro concetti e nozioni restatuuisce al'utente solista il riserato finale di ricerca ragionamento.
Queni Passaggi necessaria di Molti Dati, Di Una corpa Capacithà Computazionale e Di Molta Latenza ed è proprio per missi motivazione che i ragionamento gerarchico Modello (HRM) Trovano Una propria Ragione d'Essere.
Ricerca di Base
“IndagHiamo il Mistero Dei Big Language Model”
Di Andrea Daniele Signorelli
06 Giugno 2025
Veniti Modello di ragionamento gerarchico di Funziona Un
IL FUNZIONAMENTO DI UN HRM RICHIAMA in Parte Quello delle reti neurali ricorrenti, Modelli Matemati Che Richiamano in Modo figurativo il funzionamento del cervello umano.
Nello Speci Specso, L'HRM USA Due Moduli Che, semplificando Molto Posamo definire “Menti”. Il Primo modulo è di alto livello e si occupa della Pianificazione. IL secondo, Definito di Basso Livello, Svolge Funzioni Rapide e Dettagliate.
I DUE MODULI DAMOGANO MEDIANTE UNA CONVERGENZA GERARCHICA SUNDO LA QUALE IL MODULO DI ATO LOVELLO SI AGGIORNA Solo Quando Quello di Basso Livello Ha Svolto I Propri Compiti.
Per Fare Un Esempio Pratico, Laddove a Un'ia Che fa di Chain of Thought Venisse Chiesto di Trovare la Strada per USCIRE da un labirinto, alla gara del fattore diversivivi Tenendo Traccia Delle Direzioni imbocate, Dei Vicoli Ciechi Trovati e Dei Percorsi Fatti a Ritroso. TUTTO CIò RICHIEDE DATI, TEMPO E, NON DA ULTIMO, UN ERRORE NELLA CATENA DI PENSIERO POTREBBE ROVINA TUTTO IL RAGIONAMENTO.
Il modulo di alto livello di un hrm guarderebbe il labiinto dall'alto e darebbe al modulo di basso livello le indicazioni utili per uscirne. Le Due “Menti” sono Così nel Grado di Impiegare Meno Tempo e di USare Meno Dati per Raggiungere il Risultato Desiderato.
HRM HA 27 Milioni Di Parametri Ed è stato addestrato con un un numero esiguo di dati. Quando si parla di parametri si fa riferimento a valore numerici che il modello regola per restatiore i risulti bhiesti dagli utenti. Per Fare Un Paragone GPT-4 Di Openai Si stimola Che Abbia 1,8 Trilioni di Parametri (Ossia 1,8 Mila Miliardi).
ALLENARE MODELLI DA TRILIONI DI Parametri Richiede hardware Molto Performante e Costoso e Mesi di Calcolo. UN HRM RAGGIUNGE I MEDESIMI LIVELLI CON MOLTO MENO SFORZO E, STATO ALMENO AI RICERCARI I SAPIENT STAMPA
Le implicazioni future
L'organizzazione Gerarchica Dei hrm è una proprietà che emerge Dall'adDestramento, Ossia è un Caratteristica che non è propritaria Dell'architettura, è qualcosa Che il Modello Apprendde da Sé.
UN HRM Sfrutta Un Principio Organizzativa Capace di Un Ragionamento solido e FlessiBile, Dando il Meglio Di Sé Nei Compiti A Lungo Termine.
STATO AI RICERCARI, L'HRM è UN Passo in Più Verso il Ragionamento a Scopo Generale. Oltre a missi dovuta aspetti, per lo più futuribili, resta il fatto che le prime implicazioni possibili situano in quei contesti in cui i dati sono pochi e le risorse di callolo scara. Tra Queni, per Esempio, L'Agricoltura in Paesi Emergenti o l'Analisi di Malattie Poco diffusa in Centri di Ricerca Minoritari.
Intelligenza artificiale
GPT-OSS com'è il modello “Open-weight” (Che non Vuol Dire Affatto Open Source) Di Openai
Di Andrea Monti
09 Agosto 2025

