OMERO Biobank
Elaborazioni biomediche a larga scala basate su OMERO
Referenti
Contesto
Il numero di settori interessati dal fenomeno dei big data è in costante aumento, sia nella scienza che nell'industria, con i sequenziatori di DNA ad alta processività che sono tra i più massicci produttori di dati. La costruzione di strutture di analisi in grado di tenere il passo con un tasso di produzione così elevato, tuttavia, è solo una parte del problema: le sfide attuali includono la gestione di repository di dati articolati in cui gli oggetti sono collegati da relazioni multiple, la gestione di pipeline di elaborazione complesse in cui ogni fase dipende da un gran numero di parametri di configurazione come pure la garanzia di riproducibilità, controllo degli errori e usabilità da parte di personale non tecnico.
Descrizione
OMERO.biobank è un framework robusto, estensibile e scalabile in tracciabilità pensato per supportare esperimenti a larga scala e ad alta intensità di dati in campo biologico. Il sistema di gestione dei dati è basato sui servizi principali di OME Remote Objects (OMERO), una piattaforma software open source che include una serie di meccanismi di storage, remotizzazione del middleware, API e applicazioni client.
Innovative features
- il kernel di OMERO.biobank è integrato con un sistema di indicizzazione che mantiene una versione persistente della struttura della tracciabilità mappando le entità ai nodi e le azioni agli archi di un database a grafo ;
- è implementato con Neo4j
- il suddetto sistema di indicizzazione può gestire un numero elevato di elementi.
Potenziali utenti
Ricercatori, sviluppatori
Settori d'impatto
Salute - ICT
Ulteriori risorse
- https://github.com/crs4/omero.biobank
- G. Cuccuru, S. Leo, L. Lianas, M. Muggiri, A. Pinna, L. Pireddu, P. Uva, A. Angius, G. Fotia, G. Zanetti, "An automated infrastructure to support high-throughput bioinformatics", 2014 International Conference on High Performance Computing Simulation (HPCS), pp. 600-607, July 2014.
- G. Cuccuru, P. Uva, S. Onano, R. Atzeni, S. Leo, L.Lianas, Manuela Oppo, Luca Pireddu, Andrea Angius, Laura Crisponi, Gianluigi Zanetti, Giorgio Fotia, Exploiting a large scale biodata management system to support NGS variant detection studies. Poster presentation at ISMB/ECCB, 10-14 July 2015, Dublin - 2015.