Datawarehouse

Monitoraggio e valutazione dello Stato di Salute - Metodologie di data-mining

YPC Yearly Prevalence Collection si propone di sperimentare, sviluppare e ingegnerizzare uno strumento di data mining applicabile alla grande quantità di dati generati dai flussi informativi delle Aziende sanitarie.L’obiettivo primario è di individuare interventi appropriati, cioè individualizzati per i bisogni dell’utenza ed al contempo rispettosi della necessità della comunità e delle sue risorse, per fornire prestazioni adeguate al cittadino ad un costo sostenibile.

Il Progetto YPC – Yearly Prevalence Colle è un sistema sviluppato dalla Sezione di Epidemiologia e Ricerca sui Servizi Sanitari dell’Istituto di Fisiologia Clinica del CNR su commessa della Società della Salute di Pisa.

YPC Yearly Prevalence Collection si propone di sperimentare, sviluppare e ingegnerizzare uno strumento di data mining applicabile alla grande quantità di dati generati dai flussi informativi delle Aziende sanitarie.

YPC permetterà di conoscere e valutare la domanda di prestazioni socio-sanitarie dei cittadini ed il loro stato di benessere/malessere ai fini di una corretta programmazione, che tenga conto del monitoraggio dei costi e dell’evoluzione dei bisogni di salute.

Tale strumento “open source” dovrà essere trasferibile alla rete nazionale delle Aziende sanitarie ed avere una qualità certificata rispetto alle attuali offerte di estrazione-elaborazione di conoscenza disponibili alle Direzioni aziendali

L’obiettivo primario è di individuare interventi appropriati, cioè individualizzati per i bisogni dell’utenza ed al contempo rispettosi della necessità della comunità e delle sue risorse, per fornire prestazioni adeguate al cittadino ad un costo sostenibile. Obiettivi secondari sono sia lo sviluppo della metodologia relativa alle problematiche informatiche di accesso a basi di dati diverse, al collegamento tra queste e alla definizione-gestione di un archivio integrato ed organizzato, sia la faciltà di accesso edi utilizzazione da parte della Aziende sanitarie nazionali, dei soggetti facenti parte della rete dei servizi, dei rappresentanti del governo locale e dei singoli cittadini delle comunità interessate allo sviluppo della “governance” della salute.

YPC si definisce sulla base della strutturazione dei flussi D.O.C. della Regione Toscana, mediante un set di tabellerelazionate per ciascuno dei flussi. Il set iniziale è dato da: Anagrafica Assistiti, Esenzioni per Patologia, Farmaci Erogati Direttamente, Prestazioni Ambulatoriali, Prestazioni Farmaceutiche, Dimissioni Ospedaliere, Mortalità, Dipendenze e Salute Mentale. Alla base c’è la costruzione di un’anagrafe assistiti completa ed affidabile in termini di qualità dei dati. I flussi informativi sono integrati con i dati di censimento Istat e con i dati di monitoraggio delle variabili ambientali forniti da Arpat e Arsia.

Struttura delle tabelle del Dataware House

L’obiettivo principale che ci si pone nel definire la struttura dal dataware house è quello di riportare tutti i soggetti di una area territoriale, raggruppati secondo la categoria di patologia prioritaria, caratteristica più saliente delle voci di spesa.

In particolare, in questa prima fase della sperimentazione, i comuni interessati SdS sono:

  • Calci
  • Cascina
  • Fauglia
  • Lorenzana
  • Orciano Pisano
  • Pisa
  • San Giuliano Terme
  • Vecchiano
  • Vicopisano

Si possono effettuare diverse analisi di interesse statistico:

Classificazione dei soggetti in grandi gruppi di patologie

Analisi dell’insieme degli assistiti in funzione delle caratteristiche raccolte, classi di età, genere, medico di famiglia, distretto di censimento, numerosità di prestazioni generate, spesa per prestazioni e per tutti gli incroci tra più caratteristiche
Analisi dell’intero percorso delle prestazioni originate da ogni singolo soggetto nell’anno attraverso l’analisi dei suoi contatti con il servizio sanitario
Incrociare i periodi di ricovero con le prestazioni di farmaceutica per rilevare la congruenza delle terapie farmaceutiche con le diagnosi alla degenza e diversificare i relativi costi
Analizzare la Odds Ratio delle persone residenti nel territorio della SdS Pisana per comune e grandi raggruppamenti di patologie.
Definito quindi l’insieme iniziale delle analisi,sono state definite anche le strutture del dataware house necessarie per consentire le elaborazioni statistiche, elaborazioni tutte riferite ad un anno solare.