HRM, Due "Menti" per SuperAre I Limiti Degli Llm

La startup di intelligenza artificiale (ia) sapient intelligence ha sviluppato un'architettura di ragionamento gerarchico modello Capace di Superare gli attuali modelli linguistici di grande dimensioni (llm), usdo meno Dati e mono po potenze computazionista.

Non è solo solo un annuncio finalizzato a creare mercato, tant'a che i ricertari della startup con sede a Singapore Hanno publicato le Ricerche Sui Modello di ragionamento gerarchico, Oltre Ad Avene RILASCiato IL CODICE per consentire un test di chiunque di Effettuare e test.

I Risulti Più Rilevanti Si Hanno Nel Attività di Ragionamento complice Tipiche Delle Catena di pensiero. Ma andiamo per gradi.

LLM, Modello di ragionamento gerarchico della catena di pensiero

UN MODELLO DI LINGUAGIO DI Grandi Dimensioni (LLM, Modello di linguaggio di grandi dimensioni) è un Modello di Intelligenza artificia addestrato su Enormi moli di Dati al Fine di Crecreing e Generar Linguaggio Naturale. È l'anima di chatgpt, Gemini, Claude e di tutte le ia generativa che conversano con l'uomo.

Il Catena di pensiero (cot) è un ragionamento intermedio CHE FANNO I LLM PER DARE UNA RISPOSTA PIù Artolata E Precisa. Semplificando il concetto, il modello fa dei passaggi logici, calcoli, collega tra loro concetti e nozioni restatuuisce al'utente solista il riserato finale di ricerca ragionamento.

Queni Passaggi necessaria di Molti Dati, Di Una corpa Capacithà Computazionale e Di Molta Latenza ed è proprio per missi motivazione che i ragionamento gerarchico Modello (HRM) Trovano Una propria Ragione d'Essere.

Ricerca di Base

“IndagHiamo il Mistero Dei Big Language Model”

Di Andrea Daniele Signorelli

06 Giugno 2025

Veniti Modello di ragionamento gerarchico di Funziona Un

IL FUNZIONAMENTO DI UN HRM RICHIAMA in Parte Quello delle reti neurali ricorrenti, Modelli Matemati Che Richiamano in Modo figurativo il funzionamento del cervello umano.

Nello Speci Specso, L'HRM USA Due Moduli Che, semplificando Molto Posamo definire “Menti”. Il Primo modulo è di alto livello e si occupa della Pianificazione. IL secondo, Definito di Basso Livello, Svolge Funzioni Rapide e Dettagliate.

I DUE MODULI DAMOGANO MEDIANTE UNA CONVERGENZA GERARCHICA SUNDO LA QUALE IL MODULO DI ATO LOVELLO SI AGGIORNA Solo Quando Quello di Basso Livello Ha Svolto I Propri Compiti.

Per Fare Un Esempio Pratico, Laddove a Un'ia Che fa di Chain of Thought Venisse Chiesto di Trovare la Strada per USCIRE da un labirinto, alla gara del fattore diversivivi Tenendo Traccia Delle Direzioni imbocate, Dei Vicoli Ciechi Trovati e Dei Percorsi Fatti a Ritroso. TUTTO CIò RICHIEDE DATI, TEMPO E, NON DA ULTIMO, UN ERRORE NELLA CATENA DI PENSIERO POTREBBE ROVINA TUTTO IL RAGIONAMENTO.

Il modulo di alto livello di un hrm guarderebbe il labiinto dall'alto e darebbe al modulo di basso livello le indicazioni utili per uscirne. Le Due “Menti” sono Così nel Grado di Impiegare Meno Tempo e di USare Meno Dati per Raggiungere il Risultato Desiderato.

HRM HA 27 Milioni Di Parametri Ed è stato addestrato con un un numero esiguo di dati. Quando si parla di parametri si fa riferimento a valore numerici che il modello regola per restatiore i risulti bhiesti dagli utenti. Per Fare Un Paragone GPT-4 Di Openai Si stimola Che Abbia 1,8 Trilioni di Parametri (Ossia 1,8 Mila Miliardi).

ALLENARE MODELLI DA TRILIONI DI Parametri Richiede hardware Molto Performante e Costoso e Mesi di Calcolo. UN HRM RAGGIUNGE I MEDESIMI LIVELLI CON MOLTO MENO SFORZO E, STATO ALMENO AI RICERCARI I SAPIENT STAMPA

Le implicazioni future

L'organizzazione Gerarchica Dei hrm è una proprietà che emerge Dall'adDestramento, Ossia è un Caratteristica che non è propritaria Dell'architettura, è qualcosa Che il Modello Apprendde da Sé.

UN HRM Sfrutta Un Principio Organizzativa Capace di Un Ragionamento solido e FlessiBile, Dando il Meglio Di Sé Nei Compiti A Lungo Termine.

STATO AI RICERCARI, L'HRM è UN Passo in Più Verso il Ragionamento a Scopo Generale. Oltre a missi dovuta aspetti, per lo più futuribili, resta il fatto che le prime implicazioni possibili situano in quei contesti in cui i dati sono pochi e le risorse di callolo scara. Tra Queni, per Esempio, L'Agricoltura in Paesi Emergenti o l'Analisi di Malattie Poco diffusa in Centri di Ricerca Minoritari.

Intelligenza artificiale

GPT-OSS com'è il modello “Open-weight” (Che non Vuol Dire Affatto Open Source) Di Openai

Di Andrea Monti

09 Agosto 2025

What's Hot

Rome unveils new statue in honour of Italian comedy star Alberto Sordi

Outcry in Italy after Vannacci says that femicide ‘does not exist’

Rome’s Vittoriano is sinking slowly

Italian police shut down star-studded party on Stromboli due to music

Italy faces travel chaos this week due to air and rail strikes

Rome shuts parks due to high winds

Metalmeccanici, 8 mine di Sciopero per Rinnovo Contratto – Notizie

La Prossima BMW M3 Avrà un Nuovo Motore a Benzina

Dario Amodei (antropico): “Nei Prossimi 5 Anni l'iA Cancellerà il 50% Degli Impiegati Junior”

Gaza, Assaltato e saccheggiato deposito di cibo del'onu

Aurora Ramazzotti: «Mi sposo Nel 2026. Dopo la Gravidanza Ho smesso di Giudicarmi. Smartphone a cesare? Mio Figlio è senza schermo »

Ea ha cancellato il gioco di nero pantera e ha chiuso lo studio di svilupo

Più Popolari