Il portale data.ingv.it per la condivisione dei dati dell’INGV
Per un ente di ricerca, un importante patrimonio è certamente il personale che lavora giorno e notte, con la sua professionalità, esperienza ed entusiasmo. Un fattore di altrettanta ricchezza è costituito dai dati che i ricercatori, tecnologi e tecnici raccolgono, elaborano, conservano e mettono a disposizione del pubblico, esperto e non.
di M. Locati, S. Mazza, P. Montalto, V. Romano, V. Lauciani, R. Vallone, S. Cacciaguerra, G. Dotta
L’INGV rende liberamente disponibili e utilizzabili una grande quantità di dati scientifici attraverso i propri siti web, in continuo aggiornamento. Al fine di supportare al meglio la produzione dinamica di tale mole di dati e di permetterne la consultazione e un utilizzo più organico e semplice, nel novembre 2020 è stato inaugurato il portale dei dati aperti https://data.ingv.it (Figura 1).

I dati dell’INGV consultabili dal portale
Il portale permette la facile fruizione dei dati da parte di diversi tipi di utenti appartenenti sia al mondo scientifico che alla comunità civile tutta.
Il portale è gestito dall’Ufficio Gestione Dati e mira a semplificare il reperimento di dati tramite un unico punto di accesso. data.ingv.it è il “metadata catalogue” istituzionale, ovvero lo strumento che ha il compito di elencare, descrivere e facilitare l’accessibilità ai dati indirizzando gli utenti verso i siti che li ospitano.
La mappatura dei dati pubblicati sin dall’istituzione dell’INGV nel 1999 è tuttora in corso (Figura 2) e si tratta di un’attività che accompagnerà le attività dei ricercatori per i prossimi anni.

La copertura geografica dei dati consultabili tramite il Registro Dati (Figura 3 ) riflette le attività di Ricerca condotte all’INGV concentrandosi soprattutto sul territorio nazionale. Sono disponibili molti dati che coprono l’intero continente europeo, soprattutto relativamente all’area euro-mediterranea. Sono anche consultabili alcuni dataset a copertura globale, alle zone artiche e Antartiche oltre a piccole aree oggetto di indagini sparse in varie parti del globo.

Le schede di metadati sono associate a uno o più Dipartimenti scientifici in cui è diviso l’INGV: Terremoti, Vulcani e Ambiente. Alla data odierna oltre la metà dei dati (54%) consultabili sul portale sono riconducibili al Dipartimento Terremoti, circa un terzo (32%) sono riconducibili al Dipartimento Ambiente e per circa il 8% sono riconducibili al Dipartimento Vulcani, seguono dati riconducibili a dati a cavallo tra più Dipartimenti (Figura 4).

Vediamone in dettaglio alcuni esempi di dati consultabili:
- I professionisti che si occupano di piani comunali o intercomunali di protezione civile, ma anche i privati cittadini, possono consultare i dati sulla sismicità recente (BSI, Bollettino Sismico Italiano) o sulla sismicità degli ultimi 1000 anni (CPTI, Catalogo Parametrico dei Terremoti Italiani) dell’area cui sono interessati.
- Per chi volesse conoscere dove e quanto è stato avvertito un terremoto è possibile consultare le banche dati sui risentimenti dei terremoti recenti nei singoli comuni italiani (HSIT, Hai Sentito Il Terremoto) o i risentimenti dei terremoti storici nelle singole località abitate (DBMI, Database Macrosismico Italiano).
- Le persone che desiderano conoscere l’entità e l’ampiezza delle aree interessate dallo scuotimento del suolo dovuto a un terremoto possono trovare dati e mappe generate in tempo quasi-reale (Shakemaps).
- Gli storici o i cittadini curiosi della storia sismica della propria zona possono individuare le banche dati in cui recuperare dettagli informativi estratti da fonti documentarie (ASMI, Archivio Storico Macrosismico Italiano) che sono particolarmente ricche di informazioni per i terremoti molto forti (CFTI, Catalogo dei Forti Terremoti in Italia).
- Gli appassionati della storia dei fenomeni naturali possono trovare informazioni relative ai maremoti/tsunami accaduti nel Mediterraneo negli ultimi millenni (EMTC, Euro-Mediterranean Tsunami Catalogue) con particolare riferimento agli effetti sul territorio costiero italiano (ITED, Italian Tsunami Effects Database).
- I sismologi e gli ingegneri possono trovare quale banca dati utilizzare per scaricare in tempo reale le forme d’onda registrate dalle reti di monitoraggio accelerometriche per i forti terremoti italiani (ISMD, INGV Strong Motion Data) oppure l’indirizzo da cui scaricare i dati accelerometrici attentamente riprocessati combinati con informazioni dalle carte geologiche e le misure di rumore ambientale (ITACA, ITalian ACcelerometric Archive) o ancora dove scaricare dati accelerometrici per terremoti al di fuori dell’Italia (ESM, Engineering Strong Motion Database).
- I professionisti che si occupano di pericolosità sismica possono trovare i dati alla base delle Norme Tecniche per le Costruzioni in vigore ed elaborate dal Ministero delle Infrastrutture (MPS04, il Database della pericolosità sismica).
- Gli abitanti delle zone vulcaniche che sono interessati ad avere una panoramica su varie tipologie di dati recenti e storici registrati dalle diverse reti di monitoraggio (dati geologici, sismici, geodetici e geochimici) gestite dall’Osservatorio Vesuviano e dall’Osservatorio Etneo, reti di monitoraggio che coprono non solo il Vesuvio, i Campi Flegrei e l’Etna ma anche tutti i vulcani attivi nelle isole del Tirreno, come Ischia, Stromboli, e Vulcano.
- Le pubbliche amministrazioni e gli utenti, professionisti e non, possono scaricare e visualizzare direttamente in un ambiente GIS il modello digitale di elevazione (DEM) dell’intero territorio italiano con risoluzione a 10 metri (TINITALY) e in particolare dell’Etna con risoluzione a 4 metri (Digital Elevation Model of Mt Etna).
- Utenti interessati all’ambiente marino possono trovare i dati sulla temperatura e salinità dell’Alto Adriatico (EMODNET, High resolution climatologies of temperature and salinity of the North Adriatic Sea).
- E’ possibile accedere anche a dataset con misure e analisi dell’ambiente marino, specialmente del Mediterraneo, effettuate nell’ambito di diversi progetti di ricerca (ad esempio MOIST, o nell’ambito dell’ERIC EMSO).
- Set di dati raccolti dagli osservatori posizionati sul fondo del mare.
- Dati sull’ambiente estremo dell’Artide e dell’Antartide sono disponibili grazie ai vari progetti di ricerca condotti nell’ambito del Programma Nazionale di Ricerche in Antartide (PNRA).
- Dati registrati dagli osservatori Geomagnetici italiani, di Castello Tesino in provincia di Trento o di Duronia in provincia di Campobasso.
- Banche dati in cui trovare informazioni registrate dalle strumentazioni INGV operanti in diverse regioni del mondo per il monitoraggio ionosferico (eSWua, Electronic Space Weather upper atmosphere database).
- Dati paleomagnetici raccolti nell’ambito di diversi progetti.
- Dati provenienti da campagne di misura di geofisica integrata dedicati a studi di tipo archeologico.
La politica dei dati
Il mondo scientifico, specialmente quello europeo, ha adottato il paradigma dell’Open Science che si basa su una condivisione efficiente e tempestiva dei risultati scientifici e i dati sono un elemento cardine in questo scenario. Per contribuire a questa visione, l’INGV si è dotato di una Politica dei Dati che fornisce chiare indicazioni al proprio personale su come realizzare il paradigma dell’Open Science (Figura 5) e il portale data.ingv.it, chiamato anche “Registro Dati”, ne è parte integrante e fondante sin dal 2018.
La Politica dei Dati dell’INGV vuole così contribuire all’applicazione ed al rispetto dei principi FAIR, acronimo derivante da Findability, Accessibility, Interoperability, Reusability.

Per l’INGV è fondamentale che i propri dati siano utilizzati in modo corretto e consapevole cercando di fornire agli utenti garanzie di qualità, affidabilità e tracciabilità. Una volta pubblicati online, i dati scientifici possono essere utilizzati liberamente come stabilito dalle licenze Creative Commons adottate da INGV e compatibili con i principi degli Open Data. Queste licenze obbligano l’utilizzatore a citare sempre la fonte di provenienza dei dati così come già avviene per gli articoli scientifici, questo affinché la libertà di circolazione dei dati non infici la loro qualità, garantita da chi il dato lo ha prodotto e validato. A tale scopo il portale data.ingv.it presenta una citazione bibliografica dei dati pronta all’uso che include il codice DOI (Digital Object Identifier), un prezioso strumento che ne permette univocamente riconoscimento e individuazione.
Come consultare il portale
Cercare dati nel portale data.ingv.it è semplice. Basta inserire nella barra di ricerca una parola chiave, il nome del dataset (o una sua parte), di un autore, il DOI o una parola che fa parte della sua descrizione. E’ inoltre possibile cercare i dati usando un criterio geografico che permette di tracciare su una mappa il riquadro di interesse per ottenere i dati disponibili in quell’area (Figura 6).

Per ogni dato vengono riportati in modo chiaro tutte le informazioni che lo caratterizzano (i metadati), come ad esempio:
- il codice DOI che identifica in modo univoco e persistente i dati
- il link al portale web da cui i dati sono scaricabili
- la citazione bibliografica da menzionare quando si utilizzano i dati
- l’elenco delle versioni, quando più versioni dei dati sono disponibili
- l’elenco degli autori e dei contributori e relativi identificativi personali ORCID
- l’elenco delle organizzazioni coinvolte nella generazione dei dati
- l’elenco degli eventuali progetti che hanno finanziato i dati
- la copertura temporale
- la copertura geografica
- l’elenco di altri dati o pubblicazioni collegate in qualche modo ai dati
- l’elenco dei servizi web con cui accedere direttamente ai dati, se disponibili
Nella realizzazione del portale data.ingv.it non è mancata un’attenzione particolare a chi necessita di accedere ai metadati attraverso sistemi più avanzati. Sono infatti disponibili servizi web che consentono una consultazione dei metadati in modalità automatica e programmatica. Sono molteplici gli standard supportati per garantire l’interoperabilità tra sistemi online gestiti da soggetti diversi. Tali standard definiscono in modo dettagliato come formulare e inviare le richieste relative ai metadati e come il servizio deve fornire e codificare le risposte, definendo le Application Programming Interface (API).
I metadati pubblicati nel portale data.ingv.it sono accessibili sia con API gestite direttamente da INGV sia attraverso API gestite da altre istituzioni o enti. Il portale supporta direttamente due API: quelle fornite dal software Open Source CKAN su cui si basa il portale stesso e quelle fornite dal software PyCSW che implementano lo standard Catalogue Service (OGC CSW). I metadati possono altresì essere consultati tramite le API di altre istituzioni: quelle gestite da DataCite e, solo per una porzione dei dati, quelle gestite dal Repertorio Nazionale dei Dati Territoriali (RNDT) e dal portale dati.gov.it.
Per il prossimo futuro si sta progettando un nuovo portale complementare a data.ingv.it dedicato all’accesso diretto e specifico ai dati geospaziali tramite servizi in standard Open Geospatial Consortium (OGC) quali Web Feature Service (WFS), Web Map Service (WMS) e Web Coverage Service (WCS) che permetterà la federazione dei tanti servizi web sviluppati dai gestori delle banche dati. Questa nuova evoluzione costituirà un ulteriore e importante contributo alla missione istituzionale per la valorizzazione del vasto patrimonio scientifico prodotto dall’INGV.