pyEHR
Moduli Python per la gestione di progetti OpenEHR
Referenti
Contesto
Negli studi biomedici longitudinali possono rendersi necessari tipi di dati multipli ed eterogenei lungo l'arco di vita del progetto. Idealmente, le soluzioni comuni basate su tabelle di database ad hoc dovrebbero essere sostituite da formalismi computabili per la metadescrizione di dati clinici/fenotipici strutturati. Tali sistemi dovrebbero supportare facilmente operazioni quali le aggregazioni su sofisticate descrizioni di profili su tutti i record disponibili, così come la navigazione approfondita di tutti i dati relativi ad uno specifico partecipante allo studio.
Descrizione
pyEHR è un toolkit per la costruzione di sistemi scalabili di gestione dei dati clinici e fenotipici per applicazioni di ricerca biomedica. Il toolkit utilizza formalismi openEHR per garantire il disaccoppiamento delle descrizioni dei dati clinici dai dettagli di implementazione, e tecnologie di database (sia SQL che NoSQL) per fornire back-end di archiviazione scalabili. pyEHR è specificamente progettato per gestire in modo efficiente le query su grandi collezioni di record strutturati molto eterogenei con sottostrutture ricorrenti e ripetute.
Il sistema è concepito per il trattamento di grandi volumi di dati e delle strutture di dati in evoluzione ed eterogenee che si incontrano nella ricerca biomedica.
Tratti innovativi
- pyEHR utilizza openEHR - un formalismo computabile per la meta-descrizione di cartelle cliniche strutturate - come approccio sistematico per gestire l'eterogeneità dei dati mantenendo una chiara separazione tra la descrizione semantica ben definita delle strutture dati e la loro concreta archiviazione;
- la scalabilità è ottenuta attraverso un’architettura multi-livello con interfacce verso diversi sistemi di storge dei dati;
- le query possono essere espresse semanticamente;
- I Database Management Systems (DBMS) sono supportati sono 2 DB NoSQL/motori di ricerca: MongoDB and ElasticSearch. Il supporto per DB ulteriori sia NoSQL sia relazionali, può essere facilmente aggiunto.
Potenziali utenti
Ricercatori e sviluppatori
Settori d'impatto
Salute - ICT
Ulteriori risorse
- https://github.com/crs4/pyEHR
- Delussu G, Lianas L, Frexia F, Zanetti G (2016) A Scalable Data Access Layer to Manage Structured Heterogeneous Biomedical Data. PLoS ONE 11(12): e0168004. https://doi.org/10.1371/journal.pone.0168004.
- Lianas, L.; Frexia, F.; Delussu, G.; Anedda, P.; Zanetti, G. PYEHR: A scalable clinical data management toolkit for biomedical research projects. In: Healthcom, p. 370–374, 2014.