Nove ricercatrici e ricercatori del Settore Visual and Data-intensive Computing del CRS4 collaborano alla concezione e realizzazione di una risorsa digitale per la ricerca che integra dati clinici, genomici e immagini patologiche provenienti da 26 biobanche di 12 nazioni europee.
È stato pubblicato sulla rivista Nature Scientific Data l’articolo che descrive il Colorectal Cancer Cohort (CRC-Cohort) dataset, risultato di un’attività di ricerca e sviluppo pluriennale condotta nell’ambito dell’infrastruttura europea delle biobanche, BBMRI-ERIC. Il dataset integra informazioni cliniche, genomiche e immagini digitali di patologia (whole-slide images) provenienti da 26 biobanche di 12 paesi europei, che hanno contribuito alla raccolta e armonizzazione dei dati di oltre 10.000 pazienti con diagnosi di cancro al colon retto. Si tratta di uno dei più frequenti e letali al mondo, con incidenza e mortalità in aumento. Questo lo rende una sfida sanitaria globale che richiede nuove strategie di prevenzione, di diagnosi precoce e di terapie mirate e personalizzate. Poiché questo cancro si sviluppa lentamente da lesioni pre-maligne, la diagnosi precoce tramite screening e sorveglianza è fondamentale per individuarlo nelle fasi iniziali e migliorarne la prognosi. La coorte rappresenta una risorsa fondamentale per supportare la ricerca su metodi di analisi, biomarcatori, medicina di precisione e analisi epidemiologiche.
Il lavoro descritto nell’articolo è il risultato di una collaborazione scientifica internazionale molto ampia, che coinvolge decine di istituzioni di ricerca e oltre sessanta affiliazioni accademiche e scientifiche distribuite in diversi paesi europei. Dal CRS4 hanno contribuito nove ricercatrici e ricercatori del settore Visual and Data-intensive Computing– Francesca Frexia, Cecilia Mascia, Alessandro Sulis, Giovanni Delussu, Mauro Del Rio, Vittorio Meloni, Luca Pireddu, Simone Leo e Marco Enrico Piras – impegnati nelle diverse componenti dell’infrastruttura digitale.
Il gruppo di lavoro del CRS4 ha contribuito con lo studio e la definizione di modelli e strumenti per integrare in forma armonizzata e interoperabile i dati eterogenei provenienti dai numerosi centri partecipanti. Il lavoro ha consentito di mettere a punto un modello dati allo stato dell’arte, in linea con i Principi FAIR, fondamentale per la futura inclusione nel dataset nell’European Health Data Space (EHDS). In particolare, il gruppo del CRS4 ha contribuito alla trasformazione e gestione dei dati clinici secondo le specifiche aperte openEHR e allo sviluppo dei meccanismi di interoperabilità basati sugli standard internazionali OMOP e HL7 FHIR, che consentono l’integrazione del dataset nelle piattaforme federate europee per la ricerca biomedica. Il CRS4 ha inoltre partecipato all’elaborazione delle immagini istopatologiche digitali, con la trasformazione delle immagini nel formato aperto OME-TIFF – migliorando l’accessibilità dei dati ed eliminando il vendor lock-in – e l’applicazione dei principi FAIR ai processi di elaborazione per migliorare la tracciabilità e la riproducibilità dei dati.
Il lavoro emerge dalle collaborazioni pluriennali del Settore Visual Computing del CRS4 con BBMRI-ERIC e col suo nodo italiano BBMRI.it, e dalle attività dei centri di ricerca europei impegnati nello sviluppo di infrastrutture digitali e biobanche per la condivisione dei dati biomedici, col contributo di diversi progetti di ricerca, inclusi il progetto EOSC-Life (Horizon 2020, GA 824087) e il progetto XDATA, finanziato dalla Regione Autonoma della Sardegna.
L’articolo completo è disponibile su Nature Scientific Data:
https://doi.org/10.1038/s41597-026-06822-2