Esperienza
Il viaggio intercontinentale
Fino a questo momento, ogni volta che mi è capitato di parlare di viaggio con altre persone, ho sempre iniziato con la premessa “Non ho mai viaggiato molto io”. Affermazione verissima, e che continua ad esserlo per motivi storici, ma che, con il passare del tempo, perde sempre più la sua rilevanza. Soprattutto se consideriamo che, grazie alla scusa della conferenza, ho intrapreso il mio prima viaggio intercontinentale, lasciando per la prima volta il continente che mi ha visto nascere e crescere per tutti i 26 anni della mia vita.
Volando per ore e ore
Non ho alcun timore degli aerei, ma ne ho parecchio nei confronti della burocrazia e, in generale, dell’organizzazione di viaggi, dai più banali ai più importanti. Non aiuta il fatto che, per tante ragione, si tratta di una prima esperienza per me. Se non altro, il primo volo Newcastle-Dubai è filato estremamente liscio, sin dalle primissime battute. Ho preso la metro alle 10:00, conscio di avere tempo più che sufficiente per prendere il volo alle 13:15. Quello che non mi aspettavo era di aver già superato i controlli ed essere essenzialmente pronto ad imbarcarmi già alle 11:00. I pochi viaggiatori e il personale molto affabile hanno reso questa una delle esperienze in aeroporto più rilassanti di sempre. Persino l’imbarco è stato velocissimo. Salendo sull’aereo, ho capito subito che questa sarebbe stata un’esperienza diversa dal solito. Abituato agli aerei delle compagnie low-cost per viaggi di al più qualche ora, non ero pronto ad entrare in una vera e propria città volante, con file da 10 sedili divisi in tre file, almeno 4 scompartimenti in grado di ospitare più di 400 persone. Per non parlare dei sedili, molto comodi, con tanto di schermo per poter usufruire di un catalogo sterminato di film e prodotti di intrattenimento vari, roba che avevo visto solo al cinema. Ne ho approfittato per vedere il live action di “How to train your dragon” e il primo film di “Wicked”, che volevo recuperare da un po’, anche se ammetto che mi sarei aspettato qualcosa di più. A questo si aggiungono un plaid, un cuscino, delle cuffie e un pranzetto più gelato niente male. Tutto incluso nel prezzo che, sebbene sia chiaramente elevato, viene quasi giustificato da tutti i comfort che ci vengono messi a disposizione.
Giusto qualche statistica che non posso non condividere. A bordo del volo Newcastle-Dubai, il mio primo volo intercontinentale, era presente un equipaggio di ben 9 nazionalità diverse, in grado di parlare 10 lingue. La distanza che abbiamo percorso è stata di ~5649km, viaggiando intorno ai ~1100km/h con temperature esterne che raggiungevano i -52 gradi Celsius.
Dubai di fretta e furia
Atterrato a Dubai, sono stato accolto da una distesa di luci dorate, fino all’arrivo all’aeroporto internazionale. Allineati come una schiera di soldati, gli aerei della Emirates mi hanno dato la sensazione di essere arrivato in un punto nevralgico del mondo intero. L’internazionalità dell’aeroporto è divenuta l’aspetto più evidente del luogo. Forse a causa della quantità di persone che frequentano l’edificio, i controlli di sicurezza sono stati molto rapidi, quasi sbrigativi. Sebbene all’inizio mi è sembrato di respirare una zaffata di aria proveniente dal mio kebabbaro di fiducia, è bastato fare qualche passo nell’immenso aeroporto per rendersi conto di quanto l’inglese fosse predominante. La quantità di brand internazionali, le insegne luminose, le lunghissime camminate per spostarsi da un gate all’altro costellate dai negozi più disparati, ma tutti chiaramente rivolti ad un pubblico globale e facoltoso, mi hanno restituito l’immagine di una meta turistica che ostenta il suo ruolo senza alcun tipo di vergogna. Sono stato tentato di comprare quantomeno il famoso cioccolato, ma alla fine ho rimandato, nella speranza di trovarlo al ritorno, quando si spera che potrò muovermi con più calma. Infatti, non ho avuto modo di esplorare tutte le ale dello sterminato aeroporto, avendo qualche oretta prima del volo per Singapore.
Seconda parte
Dopo una breve sosta, sono salito a bordo del secondo aereo della giornata, diretto a Singapore, segnando l’inizio della seconda metà del viaggio, su un aereo leggermente più grande del precedente, tant’è che il personale di bordo era composto di persone provenienti dal 20 paesi, in grado di parlare ben 18 lingue diverse. Questa volta sarebbe toccato volare per circa 7 ore e mezza, coprendo una distanza di ~6253km. Anche questo volo è stato piuttosto tranquillo, se non per qualche turbolenza e per la difficoltà a prendere sonno. Stanco com’ero, infatti, speravo di poter riposare per la maggior parte del volo, ma, persino avendo il sedile accanto a me libero, non ho trovato una posizione comoda che mi non comportasse un fastidioso risveglio dopo meno di un’ora. Ho quindi passato un po’ di tempo a vedere i primi due episodi di “Traitors” e ho finalmente recuperato “The princess bride”.
Singapore
Finalmente sono atterrato a Singapore, raggiungendo così la mia destinazione. Sicuramente la lingua non sarà un problema. Ogni segnale è scritto in inglese, per cui orientarsi è persino più semplice che in Olanda.

Destinazione Hotel
Rimaneva arrivare all’hotel. Un’operazione non troppo complicata, anche se mi sono fermato un attimo in bagno, dove ho potuto apprezzare il getto d’acqua pronto a sostituire il nostro bidet ed delle mutande abbandonata da chissà chi. Ho anche fatto un rapidissimo giro nella zona dei cactus, che mi ha portato ad apprezzare per la prima volta il clima caldo e umido di Singapore. Sono rimasto colpito dalla presenza di parquet, comune nelle fredde zone inglesi, ma che non trovo per nulla necessario in un luogo dove la temperatura si aggira intorno ai 30 gradi. Con più scale e meno ascensori, ho l’impressione che lo stereotipo delle città asiatiche non proprio fat-friendly sia piuttosto vero. In ogni caso, dopo aver superato i controlli del passaporto in tempo record, sono finalmente uscito dall’aeroporto. Seguendo il consiglio dato dagli organizzatori della conferenza, ho provato ad utilizzare l’app Grab per prenotare un passaggio fino all’hotel. Il tutto ha funzionato perfettamente, e il pilota mi ha anche dato qualche dritta su come muovermi in città nei prossimi giorni. Però non ero a conoscenza della preferenza dei singaporiani per i pagamenti in contante, e dovendo racimolare in fretta e furia i soldi per saldare il mio conto, ho accettato di effettuare un cambio particolarmente svantaggioso, trovandomi a pagare il trasporto quasi €20 contro i €12 preventivati dall’app. Pazienza, ho imparato la mia lezione. Se non altro, il resto è filato liscio. Sono entrato nella mia camera e, spossato, mi sono riposato per qualche ora. Alle 18:00, ho svolto qualche mansione che avevo rimandato fino a quel momento, mi sono fatto una doccia veloce e sono uscito per esplorare un po’ i dintorni. Mi sono immediatamente perso nel centro commerciale Katong, che si trova proprio sotto il mio hotel, un labirinto di negozi e attività commerciali parecchio variegate. Anche in questo caso, mi sono trovato in difficoltà a causa della mancanza di contanti. Ho quindi deciso di rimediare, recandomi ad un ATM per prelevare un po’ di soldi. Purtroppo ho dovuto regalare loro 5 SDG di commissioni, ma almeno ora ho un po’ di moneta per le emergenze. Ho colto anche l’occasione per fare un giro in un supermercato locale. Anche in questo caso, sono rimasto sorpreso dalla globalizzazione che sembra permeare ogni angolo del pianeta, però effettivamente qualche prodotto è riuscito a sorprendermi, come la frutta e verdura, l’attenzione alle uova e ai condimenti e una sezione internazionale piuttosto fornita. Tornando in hotel, ho completato il mio primo acquisto, Turtle, e ho cenato da un hot pot cinese, un’esperienza decisamente interessante, dato che non avevo compreso subito il funzionamento del ristorante, rendendo la cena un po’ più lunga, complessa e sudata del previsto. Però, con un prezzo di soli 11 SDG, non posso davvero lamentarmi: Singapore sembrerebbe più economica di Newcastle. Spero solo che lo stomaco non mi faccia qualche brutto scherzo domani mattina.

Prima giornata di conferenza
Il risveglio non è stato dei migliori. Il jetlag si è fatto sentire, e dopo aver interrotto il mio sonno alle 2:30, ho dovuto pazientare un po’ prima di riuscire a riaddormentarmi. In qualche modo, però, sono riuscito ad alzarmi per le 6:15, come previsto, e, con tutta la calma di questo mondo, ho fatto colazione in hotel prima di prendere lo shuttle delle 7:25 per raggiungere il Singapore EXPO, sede della conferenza. SI tratta di un edifico immenso, con un parco e parecchie strutture annesse. Al momento, però, sembra essere adibito esclusivamente a AAAI26, che pur essendo una conferenza di grandi dimensioni, utilizza solo un’ala di tutte quelle messe a disposizione. Di conseguenza l’ambiente, con la sua tappezzeria, in molte aree è un po’ più desolato di quanto mi sarei aspettato. Poiché la prima bridge session in programma, la “B2: Bridging Language Models and Symbolic Reasoning (AI and Logic)” iniziava alle 9:00, ho avuto modo di esplorare brevemente i dintorni prima di dirigermi verso la sala Garnet 213 (tutte le sale sembrano uscite da un episodio di Steven Universe). Con l’aria condizionata a palla, mi sono sorbito le molte presentazioni relative all’utilizzo di LLM e le sue capacità di ragionamento logico. Sembra che le scuole di pensiero e relativi approcci proposti siano principalmente due:
- Utilizzare LLM come un semplice strumento per tradurre il linguaggio naturale in una rappresentazione formale, che poi viene risolta da un tool esterno (SMT solver, theorem prover, optimizer, ecc.)
- Affidare l’intero processo di ragionamento all’LLM, magari con qualche accorgimento per migliorare la sua affidabilità e robustezza
Francamente, soprattutto dopo questa sessione che mi sembra cavalcare l’hype più di ogni altra cosa, sono ancora più convinto che stanno cercando di usare uno strumento completamente inadatto allo scopo solo per il gusto di farlo. Barattare l’efficienza, l’affidabilità e il rigore che degli strumenti nati per produrre delle prove in maniera formale con la comodità di un’interfaccia in linguaggio naturale mi sembra controproducente, sebbene poter rendere più accessibili questi strumenti sia sicuramente un obiettivo valido. Abbiamo fatto un piccolo break a metà mattinata e uno più lungo per il pranzo, durante il quale ho tentato senza successo di comprare qualche cosa da mangiare nel vicino conglomerato di ristorantini e fast food dal vibe estremamente asiatico. Per qualche motivo il servizio era estremamente lento, anche considerando la quantità di gente presente. In ogni caso, dopo quasi un’ora di attesa, ho rinunciato, preferendo tornare nella stessa sala per non perdere la sessione pomeridiana. A dirla tutta, non avevo neanche troppa fame dopo l’abbondante colazione e l’abbuffata del giorno precedente.
Se non altro questa sessione mi ha dato modo di conoscere un paio di ragazzi di Udine che hanno presentato il loro lavoro sulla creazione di un set di benchmark più rigorosi per valutare le capacità di ragionamento logico degli LLM, nonché il lavoro di un ricercatore cinese che ha presentato il suo approccio per integrare un generatore di teoremi corretto per costruzione con un LLM, in modo da poter avere il meglio di entrambi i mondi. La parte AI non mi interessa particolarmente, ma quella puramente logica, invece, mi sembra parecchio affascinante. Cercherò di approfondire l’argomento non appena possibile.

Un giretto per China Town
Il mio piano originale di tornare in hotel a riposarmi alle 18:00 è piacevolmente stato messo sottosopra dalla scelta di accodarmi a Lemuel e Alec nel partecipare al ricevimento per studenti tenutosi all’EXPO. Purtroppo, a causa di un piccolo errore di navigazione, Lemuel è arrivato molto tardi, perdendosi buona parte del buffet. Per rifarci, siamo andati a fare un giro a China Town dove abbiamo passato un’oretta in un locale cinese, facendo l’esperienza della comoda metro locale. Io non ho preso nulla, dato che mi ero già saziato al buffet, ma mi ha fatto molto piacere fare la conoscenza di Alec, un dottorando a UCL che mi ha dato l’impressione di essere parecchio in gamba. Ed ovviamente è stato interessante aggiornarsi con Lemuel, dopo anni che non ci sentivamo. Come mi sarei aspettato, la sua esperienza di dottorato è parecchio positiva, con la sua forte passione per il suo campo di ricerca che lo spinge a lavorare sodo e a massimizzare ogni opportunità che gli si presenta. In questo siamo stati sempre agli antipodi. È stata anche l’occasione perfetta per aggiornarmi sulle ultime novità ad UniCT e farmi raccontare un po’ di aneddoti sulle loro esperienze recenti. Nonostante la mia iniziale esitazione a disturbarlo, è stata l’ennesima conferma di quanto basti dimostrare un minimo di spirito di iniziativa, essere proattivi piuttosto che puramente passivi, per socializzare, che si tratti di nuove conoscenze o vecchi amici. Prima di tornare in hotel, ho fatto un rapidissimo stop al supermercato per comprare qualche snack da portare ad amici e parenti, anche se questa piccola deviazione mi è costata qualche preziosa ora di sonno.
Seconda giornata di conferenza
La seconda giornata, per qualche motivo, è stata più faticosa della prima. L’inizio è stato molto simile. Sveglia all’alba, colazione in hotel e shuttle fino all’EXPO. Ho iniziato a seguire la continuazione del bridge session B2, ma a forza di sentire variazioni sullo stesso tema, ho avuto difficoltà a mantenere alta l’attenzione. Piuttosto, specie durante le presentazioni meno interessanti, ho dedicato un po’ di tempo per rifinire le mie slides, aggiungendone una finale per aggiungere diversi qr codes. Ho fatto un pranzetto al volo con riso e pollo presi al café al secondo piano dell’EXPO, prima di continuare con la sessione pomeridiana, ma non prima di aver ricaricato clandestinamente il mio laptop in una delle altre sale. Alcune delle presentazioni, specie quelle degli invited speakers, non erano niente male, ma, travolto dalla stanchezza, ho preferito saltare la panel session e tornare in albergo per riposarmi.
Una serata fra i pesci
Mi sono sdraiato a letto per un’oretta prima di preparami per prendere lo shuttle che ci avrebbe portato al river wonders, presso il Singapore Zoo, per la cena offerta dagli organizzatori la sera prima dell’inizio della conferenza vera e propria, il 22. Continuo a dimenticare che, pur essendo sempre a Singapore, muoversi nella enorme città stato richiede il suo tempo: raggiungere la destinazione ha richiesto quasi un’ora. Dopo aver atteso un’altra mezz’oretta per l’inizio ufficiale dell’evento, siamo stati ammessi all’interno dell’attrazione. Contrariamente alle mie aspettative, non ci siamo limitati a racimolare un po’ di cibo da un buffet, ma abbiamo avuto modo di completare il tour dell’intera zona, un percorso costellato da tantissimi acquari e vasche con i pesci più disparati, tartarughe e persino lamantini. A causa dell’enorme quantità di persone che partecipano all’evento, la coda per il buffet era interminabile, ma con la compagnia di Lemuel e Alec il tempo è passato in fretta. Purtroppo non abbiamo avuto il temo di esplorare ogni angolo del parco, poiché ci siamo dovuti assicurare un posto sul bus di ritorno previsto per le 21:30, ma almeno è stata un’esperienza inaspettatamente piacevole.

Un veloce giro notturno
I miei propositi erano di andare a letto immediatamente appena arrivato in hotel, per le 22:30, ma ovviamente ho perso tempo cercando di preparare i QR code da stampare per sopperire il fatto che ho completamente dimenticato di aggiungerli al poster. Sebbene non fossi particolarmente speranzoso, mi sono aggirato per il quartiere di Kantong diretto ad un negozio di stampa che, su Google Maps, risultava aperto 24 ore su 24. Ovviamente non l’ho trovato, e probabilmente non esiste o si è spostato. In compenso, ho potuto ammirare la tranquilla vita notturna di Singapore, senza particolare confusione ma con un buon numero di persone che, silenziosamente, si aggirano per strata. I centri commerciali rimangono aperti, anche se la maggior parte dei negozi hanno le saracinesche abbassate. Aggirarsi in questi deserti urbani mi ha dato l’impressione di essere stato catapultato in un film di zombie. Le uniche realtà aperte e rumorose sono i pub, che sembrano possedere una clientela affezionata piuttosto particolare. In ogni caso, ho evitato di fare davvero troppo tardi, e per mezzanotte ero già a letto, con la vana speranza di recuperare un po’ di sonno prima della plenaria del giorno dopo.
Terza giornata di conferenza
Solita routine mattutina, con il jetlag che, sebbene ancora presente, pian piano inizia a farsi sentire meno. La plenaria inizia puntualissima alle 8:30, preceduta da un piccolo spettacolo con un drago cinese danzante. C’è stata una breve introduzione sugli eventi principali che si sarebbero tenuti alla conferenza, qualche raccomandazione ed info aggiuntiva sul processo di revisione dei paper, ed, infine, l’assegnazione di una serie di premi. Purtroppo il resto della giornata è stato piuttosto sconclusionato. Abbiamo fatto un giro per i vari talk, alcuni organizzati da alcune compagnie, altri legati alla presentazione di qualche paper, senza contare gli innumerevoli poster sparsi nell’enorme hangar che hanno chiamato hall. Il problema è che, non avendo particolari conoscenze in questo campo, non ho potuto apprezzare appieno tutta l’incredibile mole di ricerca che ci viene vomitata addosso ad ogni angolo della conferenza. Avendo la coppia di esperti di computer vision al mio fianco, mi sono lasciato trasportare dai loro interessi, e, a dire la verità, qualche spunte interessante l’ho anche trovato, ma senza eliminare nemmeno per un attimo la sensazione di essere chiaramente in un territorio che non mi appartiene minimamente. Abbiamo pranzato con il refreshment offerto dagli organizzatori e ci siamo presi una breve pausa al café prima di tornare a seguire una presentazione piuttosto interessante su il Reinforcement Learning che ha illustrato una serie di tecniche inusuali per migliorare l’efficienza dell’apprendimento di un agente in determinati contesti. Per finire la giornata, ho scelto di seguire il talk di Alliance riguardo l’utilizzo di una pipeline basata su agenti per automatizzare il software delivery. Anche se si è trattato di qualcosa di decisamente più generico, finalmente mi sono sentito più a mio agio.
Un ritorno tranquillo
Dopo la conclusione della maggior parte delle attività, abbiamo fatto un salto al centro commerciale adiacente all’EXPO per fare un giro veloce. Ne ho approfittato per comprare uno strano roll Vietnamita un po’ scialbo, ma comunque buono. Siamo tornati in tempo per prendere lo shuttle delle 18:50, che ci ha riportato in hotel. Prima di separarci, abbiamo fatto una veloce cenetta a base di ramen giapponese. L’unica cosa da segnalare è stata la presenza di narutomaki nel brodo, che volevo provare da tempo.

Quarta giornata di conferenza
Il jetlag è un fenomeno davvero strano. Dopo un paio di giorni in cui mi sembrava di essermi quasi completamente adattato al fuso orario locale, la notte del quarto giorno non è andata come previsto. A causa della stanchezza accumulata, sono andato a letto piuttosto presto, per le 22:30, ma mi sono risvegliato alle 2:30. Nonostante i miei sforzi, non sono riuscito a prendere sonno fino alle 5:00, motivo per il quale ho preferito rimanere in hotel un po’ più a lungo e approfittandone per lavorare un po’ per la presentazione. Prima di dirigermi all’EXPO alle 11 ho fatto un salto ad un negozio di stampe per ottenere i QR code che avevo preparato la sera prima da applicare al poster, un aspetto che ho completamente ignorato durante la sua preparazione. Prima di trovare il negozio, però, ho dovuto fare qualche giro in più del previsto, dato che il negozio che avevo individuato su Google Maps e che doveva aprire alle 11 era ancora deserto. Per fortuna, non distante, ne ho trovato un altro che era già operativo. Il negoziante è stato molto gentile e disponibile e in pochissimi minuti avevo tutto ciò che mi serviva e mi sono potuto precipitare alla stazione del bus. Sono arrivato all’EXPO giusto in tempo per poter assaporare il fenomenale pranzo che gli organizzatori hanno messo a disposizione di tutti noi, la pizza hawaiana.
EXPO nell’EXPo
Ho approfittato della pausa per fare un giro e visitare le altre due esposizioni presenti all’EXPO, una dedicata al fashion musulmano e l’altra al cibo internazionale. La maggior parte di ciò che ho visto era particolarmente alieno per i miei gusti, curioso, si, ma nulla che avrei avuto il coraggio o l’interesse di comprare. Ma proprio quando stavo per lasciare l’EXPO alimentare per tornare alle poster sessions, ho incontrato un signore dedito alla vendita di poster con calligrafia cinese. Mi sono fermato ad ammirare il suo lavoro, e dopo qualche minuto di conversazione, ha notato il mio badge, scoprendo la mia affiliazione con l’università di Newcastle. Con mia grande sorpresa, mi ha detto che non solo conosce bene la città, ma che ha studiato ingegneria meccanica proprio lì, prima di tornare a Singapore, il suo paese natale. Basta davvero poco per rendersi conto di quanto il mondo sia piccolo.
Il resto della conferenza
Tornando all’evento principale, ho continuato a girare per i poster, cercando di farmi un’idea più precisa sui lavori presentati. Purtroppo continuo a constatare come non ho le conoscenze sufficienti per apprezzare la maggior parte di ciò che ho visto, ma se non altro ho collezionato un sacco di spunti che potrò approfondire in futuro. Più tardi ho partecipato all’attività interattiva preparata da AWS. Purtroppo si trattava principalmente di una trovata pubblicitaria volta a presentare le ultime innovazioni in termini dei chip messi a disposizione dalla compagnia per l’addestramento e l’inferenza di modelli di machine learning. Anche la parte pratica lasciava parecchio a desiderare, trattandosi semplicemente di una sequenza di passaggi da seguire per trainare e lanciare un modello utilizzando i loro servizi. L’ultima presentazione della giornata è stata la migliore in assoluto. Messa in scena da una ricercatrice esperta in generative AI in robotica, il talk ha illustrato una serie di applicazioni interessantissime, perlopiù legate alla generazione di dataset sintetici per l’addestramento di robot in ambienti simulati, condita con una evidente passione e chiarezza esplicativa esemplari.
Convergenza granchica
Dopo la presentazione, il nostro trio classico, arricchito da un quarto membro, si è diretto al centro commerciale vicino all’EXPO per cenare insieme. L’obiettivo, però, non era una cena qualsiasi: volevamo provare i famosi granchi di Singapore. Trovare un ristorante che li servisse è stato più complicato del previsto. Immagino che la maggior parte dei locali fossero troppo piccoli per offrire questo tipo di piatto. In ogni caso, dopo aver esaurito quasi ogni singola opzione, abbiamo finalmente trovato un posto che faceva al caso nostro. Aveva persino un’offerta piuttosto vantaggiosa grazie alla quale con 48 SDG ci saremmo potuti permettere ben due granchi, per cui abbiamo optato per prenderne due a testa. Sebbene la carne fosse anche piuttosto buona, dover sgusciare ogni singolo arto del povero animale, ottenendo spesso solo una minima percentuale della parte commestibile e cercando a tutti i costi di non sporcare in maniera indecorosa i vestiti e il locale è stata un’impresa che eviterei volentieri di ripetere. Del resto, ho sempre odiato tutti i tipi di cibo che richiedono uno sforzo troppo maggiore del semplice masticare per essere gustati. In ogni caso, dopo esserci sfamati, siamo tornati in hotel piuttosto presto, nella speranza di recuperare qualche ora di sonno.

Quinta giornata di conferenza
Beh, le speranze sono state soddisfatte solo in parte, visto che, pur essendo andato a letto alle 22:30, mi sono svegliato per le 4:30. Tuttavia, dato che non ero particolarmente stanco, ho deciso di alzarmi e svolgere qualche attività prima di fare colazione e dirigermi all’EXPO. Stavolta ho deciso di partecipare a tutte le presentazioni mattutine in merito a constraint optimization, che, quantomeno, sono state piuttosto interessanti, persino divertenti, e mi hanno dato anche qualche spunto.
Poster belli
A pranzo, mi sono diretto nella zona espositiva per dare un’occhiata al poster di Lemuel e Alec. È stato ancora più interessante di quanto mi sarei aspettato. L’architettura che hanno presentato è chiara e ben strutturata, semplice da capire ma dimostratamente efficace. Trovo davvero invidiabile l’incredibile capacità che hanno di comunicare le loro idee in maniera così precisa e concisa, per non parlare della passione e sincero orgoglio che traspare dalle loro parole quando parlano del loro lavoro.
Finalmente si esplora Singapore
Rilassati dal successo ottenuto con la loro poster session, Lemuel e Alec mi hanno proposto di fare un giro per Singapore in serata, dopo esserci ritirati temporaneamente in hotel per riposarci un po’. La metro si è rivelato un mezzo comodissimo per spostarci in città. Partendo dall’hotel, siamo arrivati senza problemi fino a Gardens by the Bay, un enorme parco molto moderno e affascinante, con strutture piuttosto futuristiche. Non siamo entrati in nessuna delle attrazioni, ma abbiamo passeggiato un po’ per i giardini, stregati dalla vista degli enormi alberi artificiali illuminati. Il panorama era anche reso ancora più suggestivo dalla vicinanza del Marina Bay Sands, l’hotel a forma di nave che domina lo skyline di Singapore. Costeggiano la baia, abbiamo continuato il nostro percorso, fermandoci momentaneamente per mangiare in uno dei centri commerciali vicini, particolarmente elegante. Durante in nostro pellegrinare verso Clarke Quay siamo stati colpiti dagli enormi grattacieli appartenenti a compagnie bancarie che fiancheggiavano la strada. Clarke Quay, invece, è un quartiere molto vivace, pieno di ragazzi, soprattutto in un sabato sera come quello. In realtà, a causa della stanchezza accumulata, ci siamo limitati a fare un giro veloce, prendere un drink e tornare in hotel.

Sesta giornata di conferenza
La legge di Murphy ha deciso di diventare ricorsiva, attivandosi proprio nel momento meno opportuno. Essendo particolarmente stanco, ho preferito ritardare il mio risveglio fino alle 9:00, e dedicando qualche oretta a finalizzare le slide per la mia presentazione. La mia intenzione era arrivare all’EXPO per le 11:30 al massimo, per avere il tempo di affiggere il mio poster prima di fare un rapido giro per la hall. Purtroppo, dopo aver fatto colazione, mi sono dovuto chiudere in bagno per un bel po’, probabilmente a causa del piatto di Laska mangiato la sera prima. Mi sono diretto in tutta fretta alla fermata del bus, ma questo mi mi è sfrecciato di fronte, rivelandomi di averlo mancato per una manciata di secondi. Ho dovuto aspettare quello successivo per circa un quarto d’ora, e anche il tragitto è stato più lungo del previsto a causa del traffico.
Poster session
Sono arrivato all’EXPO praticamente alle 12:15, tutto affannato. Per fortuna Alec mi ha dato una mano con l’affissione, ma di certo non è stata l’esperienza piacevole che speravo. Anche la situazione non era esattamente ideale: innanzitutto siamo all’ultimo giorno della conferenza, con la maggior parte delle persone che se ne sono già andate, hanno già partecipato alle attività a cui erano interessati o preferiscono passare l’ultima giornata a visitare la città. Inoltre il poster era posizionato in uno degli angoli più remoti della hall, piuttosto lontano dal flusso principale di visitatori. In ogni caso, una manciata di persone (circa 7) si sono fermate a dare un’occhiata, anche se nessuno ha mostrato un interesse particolare, ad eccezione di un ragazzo cinese che aveva addirittura la copia del paper stampata, il quale mi ha fatto diverse domande estremamente specifiche su alcune ipotesi che temo abbiamo violato nella formulazione dei benchmark. Dal poster sono passati anche Lemuel e Alec, nonché un altro ragazzo del gruppo di Sadegh e Thom, un ragazzo che conosce Oliver.
Presentazione
Dopo aver smontato il poster piuttosto sconfitto, ho deciso di impiegare il poco tempo rimasto per aggiustare nella maniera più frettolosa possibile il frontend di Lucid, così da poter permettere alle persone di provarlo sul loro cellulare. Uno sforzo che si è presto rivelato inutile, dato che la presentazione, nell’ultimo slot della conferenza, ha attirato pochissimo pubblico, una ventina di persone al massimo. Anche il fatto che mi sono ostinato a presentare dal mio sito personale, invece che utilizzare il file PDF caricato sulla piattaforma della conferenza, ha reso il processo molto più macchinoso del previsto, in particolare il dover passare da uno schermo all’altro. Sin dall’inizio, gli organizzatori erano parecchio infastiditi dalla mia richiesta, mettendomi ancora più pressione. Come se non bastasse, durante la presentazione la demo live è stata particolarmente lenta, richiedendo quasi un minuto intero per eseguire una singola operazione, con chiara frustrazione da parte dei presenti. E per concludere in bellezza, l’unica domanda che ho ricevuto era parecchio puntigliosa, riguardante una ipotesi possibilmente violata nei benchmark presentati nel paper, e che non avevo i mezzi per rispondere in maniera soddisfacente, facendo una figura davvero barbina. Se dopo la poster session ero già piuttosto abbattuto, dopo la presentazione ho gettato completamente la spugna, deciso solo a sopravvivere al resto della giornata.
Uscita all’italiana
Quantomeno la sera è stata più piacevole. Siamo tornati a Clarke Quay con l’obiettivo di unirci ad un gruppo di italiani intenti ad esplorare la città come noi. Dopo una iniziale indecisione, li abbiamo raggiunti in un pub in Arab Street, un quartiere piuttosto vivace, pieno di locali e ristoranti. È stato molto facile rompere il ghiaccio, grazie agli aneddoti a dir poco incredibili che i presenti hanno condiviso. Dopo non molto, però, ci siamo dovuti ritirare. Fra la stanchezza accumulata e il fatto che i locali sembrano non rimanere aperti troppo a lungo, abbiamo terminato la serata di comune accordo.

Settima giornata di conferenza
Certo, avendo dormito poco, il risveglio è stato piuttosto duro, ma, con un po’ di forza di volontà e dopo una colazione veloce, sono riuscito a prendere lo shuttle delle 7:25 per l’EXPO, dove ho atteso pazientemente l’inizio del workshop su “Post-AI formal methods”.
Workshop su Post-AI formal methods
Finalmente il momento che aspettavo da quando ho saputo dell’esistenza dei workshop organizzati dalla conferenza e, soprattutto, di chi vi avrebbe partecipato. Soonho, l’autore di dReal, sarebbe stato uno degli invited speaker. Per cui, oltre a presentare un programma interessante e in qualche modo affine a ciò a cui ho lavorato finora, se di lavoro si può parlare, questa sarebbe stata la mia occasione di incontrare di persona una degli sviluppatori che ammiro di più per le sue conoscenze teoriche e pratiche che superano di gran lunga la media. Dopo una presentazione molto ben strutturata, che mi ha fatto voglia di scoprire e fare pratica con Lean, il linguaggio di programmazione unito a theorem prover sul quale sta lavorando al momento, ho provato a fargli qualche domanda, ma non ho trovato il tempo. Si sono quindi susseguite altre presentazioni, alcune più interessanti di altre, ma tutte sopra la baseline che mi ero abituato a vedere alla conferenza. IN particolare, entrambi gli invited talk erano estremamente engaging e stimolanti. Durante la pausa pranzo ho vinto le mie remore e sono andato a parlargli di persona. Com’è spesso il caso, Soonho si è rivelato immediatamente una persona amichevole e ben aperta al confronto e dialogo, riuscendo facilmente a riscaldarmi il cuore. Tuttavia, al momento sembra che si sia messo in prima persona ad apportare qualche aggiornamento a dReal, insieme a qualche altro studente intento a integrare alcune funzionalità mancanti nel progetto. Quindi credo che mi limiterò solo a sottoporgli qualche PR limitata a dettagli tecnici, magari su Bazel.
Una serata più tranquilla del previsto
Il piano della serata era di uscire con il gruppo della serata precedente, ma a causa delle poche ore di sonno in corpo e l’attenzione che ho prestato ai vari talk, il mio corpo mi ha fatto intendere di essere al limite, soprattutto mettendo in conto che, con ogni probabilità, saremmo rientrati molto, molto tardi e il giorno dopo avevo un alto workshop da seguire. Quindi, sebbene controvoglia, ho deciso di calare il pacco e andare a letto prestissimo, per le 21:00.

Ottava giornata di conferenza
La conseguenza della mia scelta il giorno prima mi ha portato a svegliarmi alle 4 di mattina, ma almeno con qualche energia in pià del solito. Quindi, senza troppi problemi, ho steso le attività che avrei dovuto svolgere, sono andato a fare colazione e poi mi ho preso lo shuttle per arrivare all’EXPO.
Workshop su Next-Gen Code Development with Collaborative AI Agents
Avevo delle aspettative davvero basse per questo workshop, aspettandomi che avrebbe ripetuto le solite cose che chiunque sviluppatore conosce già, unito ad un pizzico, o più di un pizzico, di self’advertising. Beh, avevo fatto centro. C’è stata giusto qualche presentazione leggermente pià interessante, ma la maggio parte era completamente inutile. In compenso ho avuto il tempo di svolgere un paio di attività che avevo rimandato fin troppo. Non volendo sprecare l’intera giornata, ho optato per tornare un po’ prima del previsto, così da essere in stanza per le 16. L’unico aspetto positivo della giornata è stato poter fare la foto con Tarta sul logo dell’evento e l’aver incontrato nuovamente Nicolò, che mi ha invitato a passare la serata con lui e il suo gruppo, proposta che ho prontamente accettato.
Occhio non vede
L’idea era quella di incontrarci ai giardini biologici per poi andare a mangiare fuori, solo che mi sono fatto vincere nuovamente dalla stanchezza, e ho quindi raggiunto il loro gruppo molto più tardi del previsto; l’appuntamento era per le 17:00, ma io sono arrivato là alle 18:30. Il problema è che, con la luce del giorno che ha fatto largo al buio della notte, unito al fatto che i giardini sono davvero poco illuminati, ho potuto vedere ben poco di cià che il parco offriva, sebbene il poco che sono riuscito a scorgere non era davvero niente male. Dev’essere davvero piacevole passare degli interi pomeriggi lì, a studiare, leggere, giocare o semplicemente rilassarsi. Dopo aver fatto aspettare un po’ i miei chaperones, ci siamo riuniti e abbiamo deciso di comune accordo di recarci nuovamente ad Arab street per mangiare qualcosa, scelta che abbiamo messo in atto immediatamente. Siamo stati accolti dall’ora della preghiera, con una potente voce amplificata che, dalla moschea, era chiaramente udibile in tutta la zona. E ci siamo fatti scammare anche dal proprietario del negozio immediatamente di fronte alla moschea, che ci ha promesso un sacco di benefits se avessimo scelto di mangiare al suo locale, inclusi un forte sconto e delle pietanze gratis. Peccato che i prezzi esorbitati erano chiaramente pensati per neutralizzare tale sconto. In ogni caso, la cena non era tropo male, e ho potuto provare dei piatti arabi che non conoscevo prima. Abbiamo concluso la serata tornando nello stesso locale a bere qualcosa, prima di tornare a casa, stavolta prendendo l’ultimo autobus della giornata.

Ultimo giorno a Singapore
Finalmente siamo giunti agli sgoccioli. L’ultimo giorno me la sono presa chiaramente con più calma. Innanzitutto, sono andato a fare colazione alle 9:30, e poi ho speso il resto della mattinata ad assicurarmi di aver preso tutto e di non aver commesso qualche tipo di crimine, dato che è molto facile violare le leggi di Singapore anche senza averne l’intenzione. In ogni caso, rassicurato, sono sceso a fare il checkout alle 12 prima di dirigermi a fare un giro della città in solitaria. Ho deciso di rivisitare qualche location da cui eravamo già passati, perché avevo la sensazione che, nel nostro tour frettoloso, ci fossimo persi un sacco di roba. Sicuramente questo è vero per Gardens by the Bay: girandoli con la mia calma, ho scoperto un’enorme sezione liberamente visitabile che sembrava una versione leggermente meno estesa e più compatta dei giardini botanici. Senza contare il fatto che ho potuto fare qualche foto e sono anche entrato all’hotel di Marine Sands, la celeberrima struttura con la piscina in cima ai suoi oltre 50 piani. Scendendo più giù, si raggiunge anche il centro commerciale più esclusivo che mi era ancora capitato di vedere da queste parti, ostentando ancora di più lo sfarzo esagerato di uci quell’area gode. Poi mi sono diretto alla volta di Sentosa, ma invece di prendere la monorotaia che connette l’isola dalla città principale, ho deciso di fermarmi al bel centro commerciale Vivo, dove ho anche comprato un pacchetto di carte per Pumba, prima di farmi il lembo di terra che collega le due aree a piedi. In realtà non ho visto poi tanto, dato che il tempo non era sicuramente dalla mia e tutti gli sbalzi di temperatura, uniti alle ore passate in piedi, iniziavano ad avere il loro effetto sulla mia stanchezza. Quantomeno però sono arrivato sino alla piazza principale, quella con l’enorme logo di Universal che ruota lentamente su sè stesso. Esausto, ma deciso ad aggiungere almeno un’ultima tappa al mio itinerario, mi sono diretto a Little India, poiché mi era stata suggerita diverse volte. Effettivamente l’ambiente è parecchio caratteristico, riuscendo a rappresentare dal vito esattamente come mi immagino la vera India, con i suoi tanti mercati riversati sui marciapiedi (e a momenti sulla strata), una quantità spropositato di ortaggi, frutta, verdura, fiori, sartorie e, notevolmente, gioiellerie, tutti ammucchiati insieme, uno accanto all’altro. A quanto pare il fascino che gli indiani hanno per le loro collane e anelli appariscenti non è unicamente uno stereotipo. Certo, il caos mi ha fatto desistere un po’ dall’idea di visitare, un giorno, il luogo originale, in quanto ho il timore possa velocemente diventare un po’ overwhelming, tuttavia era sicuramente un’esperienza da fare.

Di corsa all’aeroporto
Piuttosto soddisfatto, ma anche estremamente esausto, per le 20:00 ero finalmente tornato in albergo, una tappa obbligata per recuperare i bagagli che avevo lasciato in loro custodia. Ne ho approfittato anche per mangiare il bun che avevo preso per pranzo qualche ora prima e riposarmi un po’, finché non mi sono reso conto che il Pokémon center all’aeroporto avrebbe chiuso i battenti alle 22:00. Considerando il tempo necessario a raggiungerlo, non c’era un attimo da perdere. Nonostante sia riuscito a mancare la fermata prevista e a perdermi più e più volte alla ricerca del piano corretto, sono riuscito ad arrivare a destinazione con circa un quarto d’ora utile. Volevo prendere qualcosa a Corrado, ed alla fine ho optato per un peluche di Lucario piuttosto carino, anche se non sono un fan della posa seduta che hanno dato a lui e tutti gli altri peluche della stessa serie. Con ben 4 ore da impiegare e stremato, ho optato per sdraiarmi un po’ al quinto piano del terminal 1, con una vista meravigliosa sull’imponente cascata interna il cui rumore bianco ha sicuramente conciliato il mio breve sonno. Alle 23:30 mi sono diretto verso il terminal. Nulla da segnalare, se non il fatto che, con la scelta che trovo molto discutibile di rimandare i controlli di sicurezza all’ultimo momento utile prima dell’imbarco, ho la sensazione che si vada a creare una situazione per cui la fila non può beneficiare dei tempi di arrivo naturalmente spalmati su più ore dei viaggiatori, piuttosto concentrando tutte le operazioni nello stesso momento, e quindi rallentando di molto l’avanzamento della fila. Nella pratica, non sono sicuro ci sia un cambiamento tangibile. Magari, considerando quanto è trafficato e il numero elevatissimo di destinazioni, questo approccio è effettivamente migliore, ma la sensazione è che non lo sia per nulla. In ogni caso, da quel momento in poi è filato tutto liscio. Mi sono imbarcato, grazie alla stanchezza accumulata e all’aver reclinato il sedile ho anche dormito per una buona percentuale del primo volo, e dopo lo scalo a Dubai, mi sono avventurato per la seconda metà del mio viaggio di ritorno. Mi spiace solo che, essendo il cambio molto breve, il primo aereo leggermente in ritardo e la distanza per gate piuttosto lunghe, non ho avuto tempo a sufficienza per prelevare qualche moneta del luogo, pena il rischio, piuttosto concreto, di rimanere nel territorio arabo. Un po’ mi spiace non aver completato anche questa sidequest, ma d’altra parte sarebbe stato un po’ disonesto, considerato il fatto che non ho visitato Dubai ma solo il suo aeroporto.

Attività
Important
Quello che segue sono gli appunti che ho preso al volo durante le presentazioni. Contengono sicuramente errori, imprecisioni e soprattutto sono estremamente sintetici.

B2: Bridging Language Models and Symbolic Reasoning (AI and Logic)
09:00 20-21 Gennaio 2026, Singapore
DiLa learning with differential Logic Layer
Can LLMs solve a simple 3 coloring problem? ChatGPT degrades quickly.
Current setup: prompt -> LLM -> external solver. Solvers are powerful, but can get stuck on complex instances LLM have rich semantic, but lack refinement Mix the two strengths more tightly.
What is a SAT problem?
- Variables: x1, x2, …, xn
- Literals: xi or ¬xi
- Clauses: disjunction of literals
- CNF: conjunction of clauses
- Objective: find an assignment of variables that satisfies all clauses or prove such assignment does not exist.
A lot of problems can be encoded as SAT problems, such as the Graph coloring problem. SAT provides a unified symbolic representation.
DiLA starts the LLM doing two things
- Problem formulation: From natural language to formal representation (CNF)
- Initialization: get a guess from the LLM
The minimization problem can be solved by introducing a quadratic loss function. From the total loss we can quantify the error.
The interesting step is the backward pass of the MaxSAT layer
Do LLM really struggle
Can LLM capable of automatically formalizing a NL to FOL?
Decomposition of NL/FOL into Ontology Extraction an Logical Translation
- First identify the components of the NL
- Then translate into FOL
Ranking semantic distance does not align with syntactic distance.
Results can be applied in embedding-centric models.
- Analyse available benchmarks
- Novel benchmarking strategy
- Evaluation of state of the Art LLMs
Keynote 1: Logical reasoning in LLMs
Logic theories
- Logic is important for transparency
- Development moving fast from “system 1” to “system 2”, from statistical token prediction to deliberative reasoning
- Explicit reasoning enables us to double check LLM decisions
Symbolic AI has dominated the landscape before the 19990 (Good Old fashioned AI)
- Knowledge Graphs
- Rule/based engines
- Formal logic systems
| Representative system | Capabilities | Purpose |
|---|---|---|
| Logic theorist | Prove theorems |
- Fuzzy logic
- Probabilistic logic
| Inference mode | reasoning process | LLM skill |
|---|---|---|
| Deductive | Top-down | High |
| Inductive | Bottom-up | Medium |
| Abductive | Mixed | Low (because of hallucinations) |
| Analogical | Mixed | High |
- NL inference: from text to logic problem and relative solution
- Machine Reading Comprehension: identify a flawed argument in a text
Abductive state grounding fro neuro symbolic …
- State grounding
- Finding a function that maps subsymbol representation to symbol representation
- Abductive learning
Empowering LLMs with reliable logical reasoning
LLMs have exhibited impressive emerging abilities to perform complex reasoning like humans. Despite the hype, LLMs still struggle with very simple reasoning tasks. LLMs are unreliable in terms of
- being sensitive to prompts
- poor generalization
- easily distracted by irrelevant information
- lack of logical consistencies
these limits create a risk that cannot be overlooked in high-stakes applications.
To empower LLMs with reliable logical reasoning, we can consider two paths
- Neuro symbolic architecture
- Logic-LM 0 SymbCoT
- Mechanistic interpretability study to undercover the black-box of LLMs
Neuro symbolic architecture
The main idea is to connect the naturale language reasoning with symbolic reasoning. Naturale language is very flexible, but unreliable and hard to verify. The framework proposed is to translate the problem into a symbolic formulation, use a symbolic reasoner to solve the problem, and then translate the solution back to natural language. The challenge is just to design the correct translation, which is closer to the original goal of LLMs. Still, translating NL to symbolic representation is hard. Therefore, we need to introduce an interactive approach, guided by the errors reported by the symbolic reasoner.
There are some limitations:
- information loss
- syntax rigidity
- solvers expect a very specific syntax
- no learning, since LLMs just translate
The evolution of this approach is to have the LLM handle every single step of the reasoning process.
The new limitations are
- sequential structure, meaning the errors cascade to the end
The next evolution is to implement something that is more graph like, like a Tree of Though.
Questions:
- Is there a similar iterative approach to fix logical error in the translation? Maybe keywords?
- Why SymCot is better than Logic-LM? Is it just because of the semantic errors in translations or is it mainly
- Some more details on how the proof by contradiction works. Do you add the conclusion to the premises and check if this leads to a contradiction?
- Does Aristotele include a symbolic solver or is it fully LLM based?
- Does the the stage generalization apply to commercial LLMs?
- How can we prompt LLMs to generate these intermediate representations? Is it just feeding it more data? Is there some NN structures that can help?
LLM challenges in logical reasoning
The light-inspired approach. The essence of intelligence is reasoning.
-LLM> symbolic Neural integration for credible and explainable reasoning
Correct by construction Theorems The LLM is used to help interpretability of the theory, both in its construction and the explanation of the results. Triangle vs Rectangular
How do LLMs learn implicit multi-hop reasoning
To answer this, we start by construct atomic triples. From thos, we construct 2-hop queries that use the triples connections
Tracing and correcting programs
The abstraction and reasoning corpus (ARC) is a collection of grid based visual puzzles. The problem for CNN is that there are too few examples for it to learn properly. The approach proposed is to work with program synthesis. Instead of solving the problem directly via CNN or LLM, the idea is to create a software program that solves the problem.
The core issue is that previous attempts discard the program if it does not pass.
Questions
- This feedback engine seems very black box. What is the metric to compare results? For task 2, for example.
- Did you observe looping in the improvement process? Does increasing the number of iterations help?
Since it only only changes some parts of the program, instead of regenerating it from scratch, the search space is reduced.
Neuro-Symbolic learning in the era of LLMs
By Neuro-symbolic we mean a framework that combines neural networks with symbolic reasoning.
PAC tells us that correctness for a statistical model is only probabilistic.
-
Symbolic as Data generator
- It can be infinite
- Can include only the optimal path or also wrong ones
- Using ta backtrack token to savage erroneous paths
-
Symbolic as data validator
-
Symbolic as data mutator
- Simply creating a template allows for the generation of infinite data
- We can still exploit the LLM to translate NL to symbolic representation
-
Planning augmented reasoning
- LLMs can generate the input for PDDL (LLM + P)
-
Program augmented reasoning
- Have the LLM generate the code that solves the problem
-
Tool augmented reasoning
- The task is subdivided in subtasks. The LLM invokes the appropriate tool for each subtask.
-
Search augmented reasoning
- Reframe the decoding as a tress search process
LLMs can help the tool by
- Pruning
- Warm starting
- General guiding
An interesting use case is symbolic regression, where the function approximating the real one based on data is informed by LLMs. Alternatively, using LLM to guide an evolutionary search over a vast discrete program space, to accelerate it, using some metric to determine the quality of the current solution.
Multimodal symbolic reasoning with LLMs
The limitation that this work wants to address it the lack of multimodal information, usually available in real-world scenarios. Moreover, pure logical reasoning can be brittle, since the rigor of logic can be limiting and require the integration of what we would define as “common sense”, or “informal reasoning”, for its flexibility.
- Collect image and associated text data
- Collect set of symbolic rules
- Instantiate rules with real world objects (A should be …, B should be …)
- Data evaluation
The LogiCAM framework is able to improve performance on this kind of questions.
- Select the critical premise
- Identify the reasoning type, either symbolic or heuristic
- Perform the reasoning
- Check weather there is is more reasoning to be done or the question has been answered.
Keynotes 2
Before trusting the LLM with reasoning, we have to consider the fact that we don’t really know how they reason under the hood. We can treat them as a black-box, as analyzing each layer is way too costly. Still, we can never be sure the LLm is following the same reasoning humans would use, choosing to take some shortcuts that may lead to the correct answer, but for the wrong reasons.
When to introduce some kind of of loss function to steer the LLM towards the desired behaviour? It seems like it is best to do it as early as possible in the training process, to avoid the LLM to develop some bad habits.
If we want to improve the reasoning in naturale language, it makes sense to work using formal language, and then translate the answer back to natural language. How robust is the translation from NL to formal language? LLMs have the potential to be very good at this task, as shown by the existence and diffusion of programming agents, able to produce code from NL description. But can we solve any kind of problems this way? No, there are some limitations that symbolic language has, especially when it comes to representing uncertainty and vagueness. But maybe it is not necessary to do this translation at all. After all, translations may contain errors, syntactic of sematic, adding another layer of complexity to the problem. Instead, it is easier to have the LLM handle the reasoning directly.
It would be interesting to allow the LLM to choose the most appropriate logic system to use for each problem, since different logic systems have different strengths and weaknesses. Among the challenges that the translation has to overcome there is the fact that NL has multiple ways to express the same concept. Ideally, this is something that LLMs should be able to tackle quite easily, given enough training data, since it is basically matching two different distributions. Another difficulty is the fact that NL is much richer than formal languages. Particles, adverbs, adjectives and, in general sentence structure can convey some information that is hard to capture in a formal language.
21 Gennaio 2026, Singapore
Tracing the Evolution of multimodal reasoning on visual puzzles
How to improve the multimodal reasoning capabilities of LLMs? By multimodal we mean the ability to process and reason about information coming from different sources, such as images, videos and text, as well as their combinations. Open source models are bad, while closed source models are better, but still not great.
?
The goal is focussing on multi’hope reasoning in commonsense scenarios, while being large scale but with minimal labour cost.
Can we teach logical reasoning to LLMs.
- Knowledge: facts about the world
- Reasoning: deriving new facts from known ones
In LLMs, reasoning could be mimicked by just knowledge retrieval. Even when considering logic rules such as Modus Ponens, LLMs may infer their inner working being limited to some kind of pattern matching, instead of being completely arbitrary, as we human understand them. This can become a problem when we want to reason about propositions that may be untrue or unknown, as the LLMs may let their prior knowledge interfere with the pure reasoning process. Multistep deduction rules can be constructed by chaining atom rules or axioms. So, even if we cannot teach all the infinite deduction rule combination, we could still teach the atomic ones, and let the LLM learn how to combine them.
The design principles to build more robust samples to train the LLMs are
- Include samples with arbitrary assignments to and
- Include samples with sufficient premises
- Teach the atomic rules
- Diverse linguistic expressions that map to the same logical form
Using this generated dataset for fine-tuning, the LLMs are able to improve their performance on logical reasoning tasks, but also math, coding, nli and other.
Questions:
- Is the structure of the text prompt fixed?
Loading diagram...
Human reasoning process
While humans reason in a series of causal steps, LLMs do not work the same. This means that, in their reasoning chains, LLMs can make mistakes in some steps and still get the right answer and viceversa, with very weak links between the steps. This makes them unreliable for reasoning tasks. Moreover, it is easy to show that LLMs do not generalize as well as humans do, with out of distribution tasks being particularly challenging for them. Especially in the case some facts are repeated multiple times, it is easy that minor but fundamental mutations in the input get completely ignored by the LLM, leading to wrong answers. One solution is to fine-tune the LLMs with datasets like RLVR, helping them to learn the reasoning process better. This is possibly a challenge to overcome to achieve AGI.
Reinforcement learning should be hacked to reward causal reasoning, instead of just the final answer. On the other hand, it is possible to exploit this characterising to detect the use of LLms in texts.
X-A-Castle: Integrating Structured causal knowledge for better reasoning
W28: Post-AI Formal Methods (P-AI-FM)
26 Gennaio 2026, Singapore
Lean Into Verifiable Intelligence
Every time I fire a linguist, the performance of the speech recognizer goes up.
Bitter Lesson by Rich Sutton
Vibe coding can be used for prototyping, but it is catastrophic for production systems. As complexity grows, hidden weaknesses compound.
In the world of AI, what is the role of verification? Can AI improve verification and viceversa? And how to can we create a virtuous cycle between the two?
Reinforcement learning with verifiable rewards. The issue is that they only consider boxed answers, where you only consider the output, but not the reasoning steps, to evaluate the model reward.
In the world of agentic AI, steps matter a lot, because the conclusion could be meaningless if the steps have side effects.
Verification: the key to AI Rich Sutton
References
- GAUSS eval: Human LLM consistency on USAMO 2025
- abc conjecture
- Lean prover
- Clause provable rewards with Lean
- The Bruijn factor
- Aristotle framework, Alpha0 in IMO, Alphaproof?
- CsLib: formalizing CS
- Veri-Coding
- LeanQC, Physics
- Definitions is currently missing
- Auto formalization of papers via LLMs
Selecting the correct Logic with LLM Reasoning
When using a tranlastion from LLM to formal logic, it is important to choose the right logic system for the problem at hand. The proposed pipeline involves three steps:
- Input
- Logic selection
- Translation
- Reasoning
- Output
Tried are
- Prolog
- FOL
- SAT based on many sorted FOL
| LP | FOL | SAT |
|---|---|---|
| Good for a set of fats and rules, where there is a clear chain of forward or backward inference |
To select the most appropriate logic, they crafterd a prompt that informs the LLM of the different strengths of the three logic systems, and asked it to choose the most appropriate one for each problem.
0 The first to reveal and empirically verify that each NL logical reasoning problem corresponds to.
Debugging
Modern computerized systems are huge and difficult to understand. This means that, at some scale, they effectively become black boxes. THis is especially true for deep NN.
Actual causality is a theoretical concept from AI. Extends causal counterfactual reasoning.
Quantification of causality allowing to rank causes by importance. The problem is intractable, but there are efficient approximation algorithms and sufficient partial solutions.
A priori (type) causality vs a-posteriori (actual) causality.
- From past to future predictions
- Gets informations from what actually happened
When do we say that A is a cause of B? Common approach counterfactual causality => A is a cause of B is, had A not happened, then B would not have happened.
in one world means in another world.
There may be more causes or connections between them that determine an outcome (overdetermination).
The order of events could change our interpretation of the causality chain (Preemption).
A is a causa of B if there exists some contingency C in which B conterfactually depends on A.
contingency: conterfactual dependency .
Responsibility is a quantification of the size of the contingency, i.e., how many changes (the number of contingencies) are needed to make A a counterfactual cause of B.
For testing, the explanation of the fault is based on statistical analysis, looking for correlation, elements that appear more in failing traces than in passing ones are suspicious
Vacuity can be considered as overapproximation of causality.
There good reason to use causality in verification
- Interventions are always possible
- The right model is usually straightforward to construct
- The systems are deterministic and all variables are known
- The approach is agnostic to the model -checking algorithm
References
- Halpern, Chockler
- Red dot verification tool
- Spurious correlations website
- Rex tool for explainability in DNN
Decision trees explainability
Shapley values: divide responsibility between features in machine learning, especially explaining decision tree ensembles.
Woodelf algorithm
-
It can be parallelised
-
Can compute both shpley and banzhaf values and interactions
-
Is the baseline arbitrary?
W42: Next-Gen Code Development with Collaborative AI Agents Workshop
27 Gennaio 2026, Singapore
Using AI agents to automate software development tasks
- Should agents communicate with all users in the same way or can they tailor their communication style?
- There needs to be
- Multiple agents working in parallel, with small, modular tests
Multi’agent framework for automated cloud security assessment
- Investigation searching documentation and CVE references to understand a vulnerability
Using AI during the issue report (tickets) such that the tickets end up in a custom taxonomy to catalogue the issue The agent framework orchestrate specialized sub-agents to automate the security assessment workflow through tool-calling and RAG.
- A knowledge base can be too limiting, it needs to be integrated with external resources and internet searches.
Using grammar for generation verification
Using a grammar and a greedy graph strat to avoid generating traces that we know will fail.
ppo vs grpo
Impresssioni su Singapore
Singapore è sicuramente una città sui-generis. L’idea che mi ha dato è quella di una realtà divisa che riesce a coesistere in un equilibrio che, contrariamente a ciò che ci si potrebbe aspettare, si rivela piuttosto solido. Insomma, una città di forti contrasti che in qualche modo ha trovato la soluzione per non esplodere. È forse uno dei posti più puliti che abbia mai visto, probabilmente grazie alla legislazione estremamente severa in materia (i chewing-gum sono banditi!), ma mi è capitato più volte di vedere vere e proprie bande di ratti aggirarsi per le strade non troppo lontano da ristoranti e locali. Lo sfarzo scintillante di alcune zone, in particolare Marina Sands, sembra fare a pugni con quartieri come Little India e Arab street. In particolare, l’immagine di un paio di senzatetto all’ombra del maestoso hotel crea un contrasto difficile da ignorare. Anche le anime della città sono molto diverse fra di loro. Se si esclude l’inglese, onnipresente nei cartelli, indicazioni, pubblicità e etichette, la cultura cinese è senza dubbio quella più rappresentata, esprimendosi a pieno nelle scritte in cinese, nella fisionomia della maggior parte delle persone che si incontra per strada e nella struttura dei centri commerciali, per lo più agglomerati di tantissimi piccoli negozietti, che includono un sacco di servizi estetici, centri di studio per i bambini e stand alimentari, per lo più concentrati nelle food court. D’altra parte, Little India e Arab street rappresentano i pezzi mancanti di questo puzzle, andando a completare il mosaico di culture che compongono Singapore, ma l’impressione è che la loro presenza sia capillare ma molto più nascosta, per lo più relegata ai loro quartieri o a lavori più manuali. Un altro aggettivo che mi sento di attribuire a Singapore è magnetica. Muovendosi per la città, in particolare dirigendosi dal lato opposto a dove ci si trova, non è difficile viaggiare attraverso aree che ricordano chiaramente l’autostrada, senza contare i tempi di percorrenza compatibili con lo spostarsi da, per esempio, Messina a Catania. Ma è impossibile sfuggire all’attrazione gravitazionale della città, e dopo aver percorso decine di kilometri, ci si ritrova sempre nella stessa città. Ovviamente anche il meteo va portato all’attenzione. Sebbene le temperature non siano per nulla male, l’umidità di certe zone rende sopravvivere all’esterno unp sforzo di resistenza alla disidratazione. D’altra parte, sembra che gli abitanti della città abbiano sviluppato un’avversione viscerale verso le temperature più alte di 20 gradi, in quanto ogni singolo locale al chiuso possiede l’aria condizionata e non ha alcuna paura ad usarla, senza preoccuparsi minimamente della differenza termina fra interni ed esterni. Mi sembra essere diventato mio padre, ma temo che, anche nel mio breve soggiorno, questo aspetto abbia messo a dura prova il mio sistema respiratorio.
Similmente, penso sia il caso di fare il punto della situazione riguardo la conferenza. Purtroppo, la sensazione generale è che questo mondo non mi appartenga, il che non fa altro che darmi la conferma di aver sprecato 4 anni della mia vita che avrei potuto investire in altro modo, con risultati probabilmente molto migliori e più soddisfacenti. Detto questo, vedere la passione dei ricercatori lì presenti, per quanto lontana dal mio modo di pensare ed essere, quello spirito di competizione e voglia di emergere, è riuscita ad influenzarmi almeno un pochino, regalandomi allo stesso tempo una nuova motivazione per andare avanti e un senso di inferiorità al limite del panico. Anche in questo caso, quindi, un’esperienza particolare, che mette insieme due estremi apparentemente inconciliabili.
Elenco senza un ordine particolare
- Tantissimi centri commerciali al chiuso con aria condizionata
- Tantissimi piccoli ristorantini e fast food
- Vibe molto asiatico
- Si guida a sinistra
- Clima caldo e umido, ma non insopportabile come le nostre estati
- Molto pulita e ordinata
- Furgoncini che trasportano persone a lavoro la mattina presto
- Centri commerciali aperti fino a tardi, anche se parecchio desolati
- Odore acre di smalto per unghie nei centri commerciali
- Un sacco di scuole private per matematica, lingue e musica
- Un sacco di cartelli con divieti e relative multe
- Intervalli della metro estremamente brevi, anche di 2 minuti
- Inglese, cinese e indiano le lingue che compaiono più spesso
- Strano contrasto fra Marina Bay Sands e i senzatetto sotto il ponte ai suoi piedi
- Zone incredibilmente lussuose vicino alla baia, con grattacieli scintillanti con gli uffici delle banche, ristoranti e negozi di lusso
Diario di viaggio
- 18/01/2026
- 08:00 Sveglia
- 10:00 Uscita di casa
- 10:45 Arrivo all’aeroporto di Newcastle
- 11:00 Arrivo al gate
- 13:35 Decollo da Newcastle
- 19/01/2026
- 00:48 Atterraggio a Dubai
- 03:25 Decollo da Dubai
- 14:25 Atterraggio a Singapore
- 15:35 Preso un Grab per l’hotel
- 16:00 Check-in in hotel
- 18:00 Esplorazione dei dintorni
- 22:00 Ritorno in hotel
- 20/01/2026
- 06:15 Sveglia
- 07:25 Shuttle per Singapore EXPO
- 09:00 Inizio B2 Bridge Session
- 12:00 Pausa pranzo
- 14:00 Ripresa B2 Bridge Session
- 18:00 Ricevimento
- 19:35 Partenza metro
- 20:30 Cena a China Town
- 22:00 Ritorno in hotel
- 21/01/2026
- 06:15 Sveglia
- 07:25 Shuttle per Singapore EXPO
- 09:00 Inizio B2 Bridge Session
- 12:00 Pausa pranzo
- 14:00 Ripresa B2 Bridge Session
- 16:50 Ritorno in hotel
- 18:00 Shuttle per River Wonders
- 19:30 Inizio tour River Wonders
- 21:30 Bus di ritorno in hotel
- 22:19 Ritorno in hotel
- 22/01/2026
- 06:15 Sveglia
- 07:25 Shuttle per Singapore EXPO
- 08:30 Plenaria
- 10:00 Esplorazione talk e poster
- 12:00 Pausa pranzo
- 14:00 Ripresa esplorazione talk e poster
- 18:50 Bus di ritorno in hotel
- 19:30 Cena al centro commerciale
- 21:00 Ritorno in hotel
- 23/01/2026
- 02:30 Risveglio
- 08:15 Sveglia
- 09:00 Lavoro
- 11:00 Stampa QR codes
- 11:25 Bus per Singapore EXPO
- 12:00 Pausa pranzo
- 14:00 Ripresa esplorazione talk e poster
- 20:30 Cena
- 21:30 Ritorno in hotel
- 24/01/2026
- 05:00 Sveglia
- 07:25 Shuttle per Singapore EXPO
- TODO
- 25/01/2026
- 09:00 Sveglia
- 11:30 Bus per Singapore EXPO
- 12:15 Affissione poster
- 14:30 Pausa pranzo
- 16:56 Presentazione
- 20:00 Cena al Market
- 21:30 Ritorno in hotel
- 23:00 Arrivo ad Arab Street
- 26/01/2026
- 06:30 Sveglia
- 07:25 Shuttle per Singapore EXPO
- 09:30 Inizio workshop “Post-AI Formal Methods”
- 12:30 Pausa pranzo
- 17:00 Fine workshop
- 18:00 Ritorno in Hotel
- 27/01/2026
- 04:30 Sveglia
- 07:25 Shuttle per Singapore EXPO
- 09:30 Inizio workshop “Next-Gen Code Development with Collaborative AI Agents”
- 12:30 Pausa pranzo
- 16:00 Ritorno in hotel
- 18:30 Arrivo ai giardini botanici
- 20:00 Arrivo ad Arab street
- 23:50 Ritorno in albergo
- 28/01/2026
- 09:00 Sveglia
- 11:40 Checkout
- 12:30 Esplorazione di “Garden by the Bay”
- 16:00 Arrivo a Vivo city
- 18:00 Arrivo a Sentosa
- 19:00 Arrivo a Little India
- 20:00 Ritorno in hotel
- 21:30 Arrivo all’aeroporto di Singapore
- 29/01/2026
- 01:30 Imbarco
- 02:45 Decollo da Singapore
- 06:25 Atterraggio a Dubai
- 06:50 Imbarco
- 07:25 Decollo da Dubai
Checklists e info utili
Todo list viaggio
- Preparare il poster
- Stampare il poster
- Preparare la presentazione
- Provare la presentazione
- SG arrival card (3 giorni prima dell’arrivo)
- Check-in online volo di andata per Singapore
- Check-in Holiday Inn Express Katong
- Check-in online volo di ritorno per Newcastle
Valigia
- Passaporto
- 4 Mutande
- 1 Pantalone di lino
- 3 Polo maniche corte
- 3 Camicie maniche lunghe
- 1 Pantaloncino
- 3 Buste
- 1 Spazzolino
- 1 Ombrello
- 1 Filo interdentale
- 1 Mini dentifricio
- 1 Pettine
- 1 Forbicine
- 1 Bottiglietta
App utili
Shuttle hotel-conferenza
| Andata | Orario |
|---|---|
| Holiday Inn Express Katong | 7:15 |
| Holiday Inn Express Katong | 7:20 |
| Holiday Inn Express Katong | 7:25 |
| Ritorno | Giorno | Orario |
|---|---|---|
| Singapore EXPO | January 20-21, 2026 | 18:15 |
| Singapore EXPO | January 22-25, 2026 | 18:50 |
| Singapore EXPO | January 26-27, 2026 | 17:15 |
Spunti
- Study LLM applications to formal methods and symbolic reasoning
- Apply Lemuel and Alec’s architecture to other domains for image-to-image translation
- The problem with state space domain violation in benchmarks for barrier synthesis (control theory)
- Issue with noise bounding in our experiments
- Verza cannons? apply their techniques with SAT solvers
- Neuro-symbolic AI with Lean prover
- Using causal information to inform the training of NN
- Safety certification for alzhaimer with generative diffusion model