La Research Infrastructure (RI) di SoBigData è un'infrastruttura di ricerca distribuita e multidisciplinare che mira all'uso di social mining, big data, e intelligenza artificiale per comprendere la complessità della società contemporanea globalmente connessa.
La RI di SoBigData ambisce a supportare la crescente domanda di ricerca e innovazione multidisciplinare su numerosi aspetti di societal complexity dalle prospettive combinate di dati e modelli e la crescente importanza dell'etica e della responsabilità dei data scientist come pilastri di un uso affidabile di tecnologie di Big Data e analitiche.
L'obiettivo principale di SoBigData.it, coordinato da CNR-ISTI, è di rafforzare il nodo italiano della RI di SoBigData. Tale obiettivo racchiude l'inclusione di nuove strumentazione tecnologiche, la creazione di nuovi data centres sul territorio italiano (chiamati SoBigData computing nodes) e l'integrazione di nuovi servizi. Questi aspetti si riflettono nel miglioramento di una piattaforma per il design e l'esecuzione di esperimenti di data science e social mining su larga scala, aperti ad utenti con diverso background, accessibili tramite cloud (in linea con le linee guida EOSC) sfruttando infrastrutture di super computing. Lo scopo è il migliorare le capacità di storage e computazione necessarie per supportare scalabilità, disponibilità, robustezza, e fidatezza dei servizi nel corto e lungo termine.
SoBigData.it è coordinato da Roberto Trasarti, CNR-ISTI e supportato dall'Unione Europea - NextGenerationEU - National Recovery and Resilience Plan (Piano Nazionale di Ripresa e Resilienza, PNRR) - Project: “SoBigData.it - Strengthening the Italian RI for Social Mining and Big Data Analytics” - Prot. IR0000013 - Avviso n. 3264 del 28/12/2021.
News da dott. Roberto Trasarti, CNR-ISTI.
Il Dipartimento di Informatica, Università degli Studi di Milano ha recentemente concluso il progetto europeo ParBigMen. Il progetto è durato due anni, dal 2020 al 2022, ed è stato svolto in collaborazione con il Dipartimento di Science Ecologiche and Biologiche (DEB) all'Università della Tuscia, Viterbo, e The Jackson Laboratory for Genomic Medicine, Farmington, CT (USA).
L'obiettivo del progetto è stato scoprire varianti patogeni associate con malattie genetiche, usando metodi avanzati di Machine Learning e High Performance Computing. In particolare, lo scopo è stato migliorare i risultati ottenuti fin d'ora nel contesto di malattie Mendeliane tramite un dataset espanso. Ciò ha richiesto computazioni particolarmente onerose, eseguite sfruttando le risorse HPC di SuperMUC-NG, un cluster HPC tra i primi 10 supercomputer al mondo.
Configurando i parametri dei modelli di apprendimenti, i ricercatori hanno scoperto con successo il minimo set di caratteristiche genomiche in un tempo ragionevole (12 ore sul cluster SuperMUC-NG, in confronto ad una stima di 2 anni su una singola macchina). Il software sviluppato è disponibile a https://github.com/AnacletoLAB/parSMURF-NG.
News da prof. Giorgio Valentini, Dipartimento di Informatica, Università degli Studi di Milano
Il Prof. Ernesto Damiani, presidente del CINI, è stato invitato alla Global Conference on Universal Access to Information 2022 organizzata da UNESCO, il cui obiettivo è arrivare ad un dichiarazione comune su “Artificial Intelligence, e-Governance and Access to Information". In particolare, Ernesto parteciperà al panel “Implementation of the UNESCO Open Data guidelines in support of transparency, innovation and e-governance".
Ai seguenti link si possono trovare maggiori informazioni:
The Data Public Private Partnership aims at strengthening the data value chain, in order to allow Europe to play a relevant role on Big Data in the global market.
The European Commission will team up with European industry (large players and SMEs), researchers, academia in a Public-Private Partnership (PPP) in order to cooperate in data-related research and innovation, enhance community building around data and in order to set the grounds for a thriving data-driven economy in Europe.
Industry and academia have identified R&I priorities in a Strategic Research and Innovation Agenda (SRIA).
In order to reach its objectives the PPP will make use of two major instruments:
The Data PPP is a partnership between the European Commission and the Big Data Value Association, the association of the European Big Data community which includes data providers, data users, data analysts and research organisations.
The Data PPP will become operational in 2015.