TEMA: DOMANDE DI CONOSCENZA
Domande di conoscenza per il governo del territorio
ASSEGNISTA
Giovanni Borga
DOCENTI DI RIFERIMENTO:
Di Prinzio, Bianchin, docenti del gruppo "Filiera Sit"
Tutor interno:
prof. Luigi Di Prinzio
Tutor scientifico: ing. Massimo Rumor
Nell'ottica
di costituzione di un nuovo soggetto istituzionale con compiti legati alla gestione
dell'informazione territoriale, il
modulo della ricerca integrata relativo alle domande di conoscenza tratta nello specifico le probematiche connesse ai processi di monitoraggio della domanda informativa e alle possibilità di costituzione di
"dataset tematici" integrati formati da dati da sensori e da giacimenti informativi,
oltre all'esplorazione di tecniche basate sull'impiego dei DBMS per la definzione
dei modelli di incrocio tra la domanda e l'offerta.
Strategia della ricerca
La strategia di sviluppo della ricerca prende spunto dall'obiettivo principale che è la classificazione della
domanda di informazione. Il primo nodo da sciogliere risulta perciò essere l'analisi
di "cosa si intende" per domanda informativa, sia per avere gli elementi per definirne
un "modello" orientato alla sua strutturazione in una banca dati, sia per progettare
le ricerche e i colloqui necessari alla sua rilevazione. Parallelamente è necessario
uno "screening" iniziale "speditivo" per costituire un primo insieme di dati su
attività di governo/gestione in atto, normative di riferimento e soggetti coinvolti,
indispensabile per testare l'efficacia della base dati.
Dopo lo screening iniziale
si possono quindi individuare gli elementi principali della domanda informativa,
classificarli e registrarli all'interno della base dati ed effettuare alcune prime
interrogazioni collegando i dati sull'offerta e controllandone gli incroci.
Contestualmente al "raffinamento" e perfezionamento dei modelli interpretativi e
logici, la rilevazione della domanda deve essere integrata con indagini più sistematiche
e con colloqui diretti ad un panel significativo di operatori pubblici e privati
concentrando l'analisi in un'area geografica limitata per arrivare a coprire la
maggior parte delle tematiche applicative.
Successivamente, sfruttando questi
modelli, la ricerca entra nella fase di definizione di "pacchetti" tematici che,
integrando dati da sensori e giacimenti informativi "complementari", permettono
di derivare nuove importanti informazioni; i pacchetti così definiti o anche ri-definiti
sulla base di altri criteri possono essere raffrontati con la mappatura della domanda
informativa ottenendo un prospetto sinottico che ne evidenzi quanto la domanda stessa
sia soddisfatta.
L'ultimo prodotto della ricerca riguarda l'ideazione di un
sistema informativo che, messo a disposizione di una ipotetica agenzia per l'informazione
territoriale e pubblicato sulla rete internet, consentirebbe di mantenere la conoscenza
diretta del flusso che dalla produzione del dato territoriale porta al suo utilizzo.
Uno strumento di questo tipo va alimentato da una costante attività di monitoraggio
e, essendo consultabile dagli operatori che si occupano di governo del
territorio, può fornire le informazioni necessarie affinché le attività specifiche di ognuno
si avvalgano in maniera quanto più efficace possibile di quanto le tecnologie dell'informazione
geografica e ambientale possono offrire.
Elementi salienti della
ricerca
Un modello per classificare la domanda
Registrare la "domanda di informazione" con strumenti tecnologici come i sistemi
DBMS prevede che ogni elemento introdotto nel sistema sia definito nella sua struttura,
ovvero ne siano definite le caratteristiche costitutive. Come emerge da quanto già
svolto della ricerca, i caratteri costitutivi della domanda informativa sono analoghi
ad alcuni propri dell'offerta e sostanzialmente fanno capo a tre categorie:
* Caratteri semantici (per i contenuti);
* Caratteri spaziali (per la localizzazione
e il grado di risoluzione spaziale)
* Caratteri temporali (per le questioni
legate all'aggiornamento del dato)
Mentre per gli attributi spaziali e temporali
esistono specifiche già consolidate (cfr. ISO - Metadata) per quanto riguarda la
classificazione dei contenuti ci si scontra con un importante aspetto strettamente
legato all'ambiente informatico: l'attributo semantico risulta essere il più importante
attributo relazionale che lega domanda e offerta e va dunque pensato come insieme
di "parole chiave" piuttosto che come descrizione libera. La soluzione più idonea
risulta essere l'adozione di una lista finita di vocaboli come può essere un thesaurus.
Dall'analisi condotta si sono ritrovati esempi di thesaurus per il territorio e
per l'ambiente già in fase avanzata di definizione in diversi contesti soprattutto
istituzionali, tra i quali è stato scelto "GEMET", thesaurus multilingue dell'agenzia
europea per l'ambiente (EEA); esso è apparso il più interessante in particolare
per l'esistenza di diversi sistemi interni di classificazioni e gerarchie che si
possono rivelare molto utili in vista delle operazioni di definizione integrata
dei "pacchetti" informativi.
Primo screening
Per testare
l'efficacia dei modelli di classificazione scelti si è scelto di costituire un primo
insieme di informazioni ottenuto con procedure di tipo speditivo, ovvero con procedure
non sistematiche che consentano con poche risorse l'ottenimento di determinate informazioni.
Questo primo insieme di dati va poi integrato con metodologie estensive e sistematiche
che assicurano la copertura più ampia dell'analisi.
Per il primo screening
si è dunque scelta una ricerca basata su due prodotti sviluppati in ambiente web:
il "metadati" della provincia di Siena e quello della provincia di Treviso che in
sostanza sono dei repertori sistematici di banche dati geografiche e non geografiche
provvisti di un'interfaccia di consultazione in ambiente internet. Dai due "metadati"
è stato possibile estrapolare un primo elenco di piani e strumenti di governo del
territorio risalendo da questi ai quadri legislativi di riferimento e alla definizione
della domanda informativa generata.
Per il quadro ottenuto sono previste una
prima integrazione mediante analisi più sistematica per considerare le normative
naturalmente rimaste fuori dallo screening iniziale e una seconda attuata mediante
colloqui diretti ad operatori pubblici e privati opportunamente scelti mirata a
registrare quella domanda di informazione non considerata dal sistema delle norme.
Le basi dati integrateLa base dati della "domanda di conoscenza"
possiede alcuni "anelli" che la connettono a quelle dell'offerta di dati da sensori
e dell'offerta costituita dai giacimenti informativi. Inoltre il thesaurus GEMET
e alcune altri elementi del sistema vengono inseriti in un quarto database connesso
ai primi tre costituendo sostanzialmente la parte "condivisa" della banca dati integrata.
Dalla banca dati dei sensori la lista delle applicazioni legate ad ogni sensore
viene caratterizzata dal punto di vista semantico da una serie di "descrittori"
estratti da GEMET, così come avviene per l'elenco "dataset" della base dati sui
giacimenti nella quale il contenuto delle diverse risorse informative è descritto
mediante lo stesso dizionario terminologico. Queste due liste (applicazioni e dataset)
sono direttamente connesse alla base dati della domanda all'interno della quale
ogni elemento analizzato (sia emerso da un testo di legge, sia espresso da un soggetto)
dà origine ad una serie di "voci" classificate sempre utilizzando il set di vocaboli
del GEMET.
Nella banca dati della domanda dunque vengono predisposte le interrogazioni
per: 1) sfruttare i descrittori GEMET per incrociare domanda e offerta; 2) sfruttare
il sistema di classificazione di GEMET per accorpare le risorse informative in "pacchetti"
tematici e per orientati a particolari segmenti applicativi.
Temi
aperti e criticità
La ricerca, pur strutturata in un percorso
predefinito, porta inevitabilmente a scoprire nuove possibilità di approfondimento
sui diversi aspetti trattati ma deve necessariamente giungere ad una conclusione.
Rimangono per questo sul tavolo temi non sviluppati anche se di indiscutibile interesse.
Uno di questi è lo stesso impiego del thesaurus GEMET che risulta avere, pur essendo
ricco e ben strutturato, limiti provenienti dalla traduzione, dalla mancanza di
vocaboli piuttosto utilizzati e dalla discutibilità di alcune relazioni e classificazioni
utilizzate.
Altre criticità emergono dalle diverse basi dati sviluppate a più
mani che occorre connettere attraverso opportune relazioni e codifiche.
Altre
ancora nascono da aspetti più intrinsecamente legati alle informazioni contenute
della base dati ma non rientrano negli obiettivi di questo documento.
:: Stati di avanzamento ricerca -->