Analisi multivariata e modelli di regressione in bioinformatica: applicazioni pratiche nelle scienze omiche
a.a. 2023/4
Responsabile didattico: Emanuele De Paoli
Docenti: Emanuele De Paoli, Fabio Marroni e relatori esterni (TBA)
Periodo: secondo semestre
Durata: 28 ore
Programma: Il corso mira ad introdurre alcuni strumenti di analisi informatica utili ad interpretare il significato biologico di dati massivi di natura omica (genomica, transcrittomica, epigenomica,…). Dati di questo tipo sono prodotti mediante metodi di sequenziamento ma è la bioinformatica a fornire gli strumenti computazionali per convertire il dato grezzo del sequenziamento in un dato rappresentativo delle proprietà molecolari biologicamente rilevanti. Il dato molecolare richiede a quel punto di essere dissezionato per individuarne le componenti più significative in un dato esperimento, per identificare correlazioni tra proprietà molecolari apparentemente indipendenti, per predire l’output di un processo biologico in condizioni diverse. Il corso intende utilizzare alcune tipologie di dati omici, spiegandone l’origine e la modalità di produzione, come palestra per l’organizzazione di dati in ambiente R, per la esecuzione e interpretazione di approcci di analisi multivariata finalizzata a ridurre la complessità dei dati ed infine per l’applicazione di modelli di regressione volti a sviluppare delle previsioni di comportamento biologico sulla base di informazioni pregresse. Il corso prevederà lezioni teoriche ma si svilupperà soprattutto attraverso esercitazioni in laboratorio informatico e l’utilizzo di dati reali provenienti dal contesto biomedico, animale, vegetale o microbico