Il recente rilascio di OpenAI o1 ha catturato l’attenzione sui modelli di ragionamento avanzato (LRM), ispirando lo sviluppo di nuovi modelli mirati a risolvere problemi complessi che i modelli linguistici tradizionali spesso faticano a gestire. Sulla scia del successo di o1, i ricercatori di Alibaba hanno presentato Marco-o1, un modello che potenzia le capacità di ragionamento e affronta problemi con soluzioni aperte, dove mancano standard chiari e ricompense quantificabili.
ANALISI
Marco-o1: ecco il modello di ragionamento avanzato di Alibaba
Si tratta di un modello che potenzia le capacità di ragionamento e affronta problemi con soluzioni aperte, dove mancano standard chiari e ricompense quantificabili. I ricercatori di Alibaba hanno perfezionato il modello Qwen2-7B-Instruct integrando tecniche avanzate come il fine-tuning del chain-of-thought (CoT), il Monte Carlo Tree Search (MCTS) e strategie di azione di ragionamento

Continua a leggere questo articolo
Argomenti
Canali