CRS4

OMERO.biobank: un approccio flessibile per la gestione dati nell’ambito della biologia sperimentale

Luca Lianas
Collana seminari interni 2012, Number 20120523 - may 2012
Download the publication : OMERO_biobank_Lianas.pdf [3.9Mo]  
Strumenti in grado di gestire dati eterogenei e multidimensionali sono fondamentali nei settori di ricerca in cui il volume delle informazioni coinvolte tende a crescere velocemente e la natura delle stesse può cambiare o evolvere con il passare del tempo. OMERO (OME Remote Objects) è un’infrastruttura software sviluppata dal consorzio Open Microscopy dedicata alla gestione delle immagini provenienti da sorgenti di microscopia digitale dotata di un motore per la gestione dei dati altamente flessibile e formente personalizzabile. OMERO permette infatti di aggiungere nuovi concetti al set di modelli già presenti nell’infrastruttura di base e di estendere qualsiasi modello mediante un approccio simile all’ereditarietà tipico dei linguaggi di programmazione ad oggetti; l’aspetto della persistenza dei dati viene completamente mascherato da un middleware che permette di accedere alle informazioni mediante più linguaggi di programmazione (Python, Java e C++). Un’altra importante funzionalità è la possibilità di memorizzare informazioni strutturabili in formato tabulare in strutture dati estremamente efficienti basate su PyTables in grado di gestire quantità di dati che possono raggiungere dimensioni pari a 1 TeraByte. Durante questo seminario verrà presentato OMERO.biobank: un sistema orientato ai dati di tipo clinico e biologico sviluppato utilizzando ed estendendo le caratteristiche di base di OMERO descritte precedentemente. OMERO.biobank è uno strumento realizzato per la gestione di grosse quantità di informazioni estremamente eterogenee ed ha come scopo principale il supporto a studi longitudinali condotti su un numero molto elevato di pazienti e volontari (nell’ordine delle decine di migliaia di persone). Verranno illustrate le varie fasi che hanno portato alla creazione di tale sistema, dalla definizione e modellazione mediante formalismi computabili delle informazioni di cui si desidera tener traccia, alla scelta delle funzionalità offerte da OMERO in grado di garantire la migliore e più efficiente gestione delle varie tipologie di dati memorizzate. Si procederà inoltre ad illustrare la fase di sviluppo di un insieme di strumenti finalizzati all’utilizzo di OMERO.biobank come driver per operazioni di calcolo complesse implementate con moderni algoritmi di calcolo distribuito.

BibTex references

@InProceedings{Lia12,
  author       = {Lianas, L.},
  title        = {OMERO.biobank: un approccio flessibile per la gestione dati nell’ambito della biologia sperimentale},
  booktitle    = {Collana seminari interni 2012},
  number       = {20120523},
  month        = {may},
  year         = {2012},
  keywords     = {imaging, bioinformatics, microscopy},
  url          = {http://publications.crs4.it/pubdocs/2012/Lia12},
}

Other publications in the database

» Luca Lianas