Cini Lab on Data Science

Special Sessions on Big Data at CLADAG 2015

Special Sessions on Big Data at CLADAG 2015

Pula (Cagliari), 8th-10th October 2015: the Lab organizes th ...

Data Public-Private Partnership

Data Public-Private Partnership

The Data Public Private Partnership aims at strengthening th ...

Governments should embrace Big Data

Governments should embrace Big Data

Commission urges governments to embrace potential of Big Dat ...

Il Dipartimento di Informatica, Università degli Studi di Milano ha recentemente concluso il progetto europeo ParBigMen. Il progetto è durato due anni, dal 2020 al 2022, ed è stato svolto in collaborazione con il Dipartimento di Science Ecologiche and Biologiche (DEB) all'Università della Tuscia, Viterbo, e The Jackson Laboratory for Genomic Medicine, Farmington, CT (USA).

L'obiettivo del progetto è stato scoprire varianti patogeni associate con malattie genetiche, usando metodi avanzati di Machine Learning e High Performance Computing. In particolare, lo scopo è stato migliorare i risultati ottenuti fin d'ora nel contesto di malattie Mendeliane tramite un dataset espanso. Ciò ha richiesto computazioni particolarmente onerose, eseguite sfruttando le risorse HPC di SuperMUC-NG, un cluster HPC tra i primi 10 supercomputer al mondo.

Configurando i parametri dei modelli di apprendimenti, i ricercatori hanno scoperto con successo il minimo set di caratteristiche genomiche in un tempo ragionevole (12 ore sul cluster SuperMUC-NG, in confronto ad una stima di 2 anni su una singola macchina). Il software sviluppato è disponibile a https://github.com/AnacletoLAB/parSMURF-NG.

News da prof. Giorgio Valentini, Dipartimento di Informatica, Università degli Studi di Milano

Share This

S5 Box

Cini Single Sign ON

This site only stores technical/functional cookies. If you want to know more, go to the Cookie Policy section.