

L'affermazione delle moderne tecniche sperimentali high-throughputs ha completamente rivoluzionato settori nel campo delle scienze della vita come la genomica, proteomica, trascrittomica, e l'imaging permettendo un approccio al tempo stesso quantitativo e sistemico allo studio dei sistemi biologici. Paradigmatico inoltre è il tentativo di sistematizzare questa conoscenza in forme strutturate condivise con lo scopo di rendere agibile questa enorme mole di conoscenza (ontologica, funzionale, compartimentale, strutturale, etc.). Database pubblici come KEG-Biocyc, Human Proteome Atlas, Pfam, PDB, Uniprot, permettono l'accesso a gigantesche collezioni di dati su componenti biologiche elementari e sulle loro interconnessioni. Al tempo stesso, la nostra capacità di analizzare e modellizzare matematicamente questa conoscenza è limitata dalla mancanza di tecniche algoritmiche/matematiche adeguate.
L'unità di Inferenza Statistica e Biologia Computazionale sviluppa tecniche di modellizzazione matematiche e computazionali ispirate alla fisica statistica dei sistemi complessi per problemi di inferenza, ottimizzazione, e per applicazioni dedicate all'analisi di basi dati sperimentali e in particolare a problemi di inferenza in sistemi biologici complessi.
L'attività del gruppo si sviluppa lungo le seguenti direttrici principali:
• Algoritmi. Lo sviluppo di metodologie matematiche generali di inferenza statistica nel campo dei sistemi biologici costituisce l'infrastruttura dell'attività del gruppo alla base delle diverse applicazioni: studio di problemi inversi, sviluppo di tecniche di intelligenza artificiale per problemi di classificazione supervisionata, semi-supervisionata, e non-supervisionata, metodi di message passing, problemi di ottimizzazione stocastica e combinatoria.
• Analisi co-evolutiva di sequenze e modelli generativi. Inferenza di proprietà strutturali e funzionali di sequenze di aminoacidi, modellizzazione di landscape evolutivi, analisi di dati di mutational scanning (phage display, selex, directed-evolution), modelli generativi di sequenze codificanti con funzione target, analisi di dati immunologici tipo Rep-Seq.
• Biologia quantitativa. Esperimenti di singola cellula di regolazione genica post-trascrizionale, fisiologia cellulare di cellule tumorali e il traffico vescicolare. Per studiare questi sistemi, vengono sviluppate tecniche computazionali e sperimentali innovative per la calibrazione di modelli matematici.
• Metabolismo cellulare in regime proliferativo. Sviluppo di modelli matematici per predizione di fenotipi aberranti, leggi di crescita, caratterizzazione dello spazio funzionale di reti di regolazione, modellizzazione di culture cellulari con tratti fenotipici/genotipici eterogenei competitivi.
(PI: A. Pagnani).