It is now a matter of fact that lifestyle has implications and consequences on a person's general health. However, less consolidated and proven is the assumption that in addition to a lifestyle, mainly represented by nutrition and physical activity, variables that refer to the socio-economic area also affect. Education, unemployment, income, inequalities, poverty, crime, housing and social understanding, for example, are all elements that can have health affect. From this point of view, it can be significant to explore variables and statistical relationships between a person's lifestyle, well-being and quality of life, economic, social and health factors. The purpose is, through the application of statistical algorithms and Machine Learning (ML), to search for patterns, relationships, correlations, causality between the different socio-economic variables. In the current state of the art, ML algorithms allow to identify new predictive signals of the onset of certain diseases or to identify correlations not yet known between the results of various commonly prescribed clinical tests, pathologies and drugs administered. A predictive and preventive medicine also enables a therapeutic and behavioral personalization. Awareness of the patient can make him participate and aware in the faculty of being able to change his life conduct in an anticipatory phase, or in the initial stages of illness, to share the treatment process with the doctor who assists him. The proposed analysis must be carried out, albeit in an experimental, prototype and detailed manner, in the current state of the Italian healthcare context, technologies, organizations and existing regulations on data processing. The project described by this thesis is to create a prototype of a system that allows to predict the risk factors for health by searching for causality and correlations between the different psycho-physical conditions and the individual socio-economic situation. The achievement of this goal depends on the realization of some essential points: • identification of a starting clinical-medically data source (Electronic Health Record); • organization and people; • methods and technological tools for the collection of socio-economic data; • pre-processing and alignment of clinical and socio-economic data; • construction of a clinical and socio-economic dataset; • statistical analysis and ML approaches to search for causality and correlations between the different psycho-physical conditions and the individual socio-economic situation. As a first step, the thesis aims to grasp the difficulties and problems to collect a clinical and socio-economic dataset. The preliminary results, from the statistical analysis and ML approaches on this heterogeneous dataset, can lay the foundations for the development of a clinical decision support system that aims to provide preventive medicine. The contributions of this work to the state of the art are: • Creation of an intersection dataset of areas, in particular medical-socio-economic, on which to carry out longitudinal studies. The dataset was constructed by extrapolating the information from the general medicine EHRs of family doctors, combined with social variables, inspired by and attributable to the indices for Fair and Sustainable Wellbeing (BES) defined by ISTAT; • Statistical analysis on clinical and socio-economic variables (between the lifestyle, well-being and quality of life of the person and economic, social and health factors) to identify correlations between the different psycho-physical conditions and the socio-economic situation individual; • Preliminary estimate of a biological age sub-index with an ML model. The predictors are derived from lifestyle indicators and patient clinical characteristics extracted from the proposed EHR. The simultaneous analysis and comparison of the correlations applied to the relationship dataset produced shows, for some socio-economic variables, a significant correlation with the clinical variables. The coefficients are particularly high if calculated for age groups, over 50 years and especially in the 50-60 cluster age. The attend at a sport club and economic satisfaction have a high inverse (negative) correlation with the prescription of drugs: a high number of drugs prescribed is correlated with the non attend to a sport club and low economic satisfaction. More outcomes and prescribed diagnostic tests correspond to a generalized low trust toward people.

È ormai opinione consolidata che lo stile di vita comporta risvolti e conseguenze sullo stato di salute generale di una persona. Tuttavia, meno consolidato e dimostrato è l'assunto che oltre ad uno stile di vita, rappresentato principalmente da alimentazione ed attività fisica, incidono anche variabili che si riferiscono all’ambito socio-economico. L’istruzione, la disoccupazione, il reddito, le disparità, la povertà, la criminalità, la situazione abitativa e l’intesa sociale ad esempio sono tutti elementi che possono influire sulla salute. Da questo punto di vista può risultare significativo esplorare variabili e relazioni statistiche tra lo stile di vita, il benessere e la qualità di vita della persona, fattori economici, sociali e di salute. Lo scopo è, attraverso l’applicazione di algoritmi statistici e di Machine Learning (ML), ricercare pattern, relazioni, correlazioni, causalità tra le differenti variabili socio-economiche. Nello stato dell’arte corrente algoritmi di ML permettono di identificare nuovi segnali predittivi dell’insorgenza di alcune malattie o di individuare correlazioni non ancora note fra i risultati di diversi esami clinici comunemente prescritti, patologie e farmaci somministrati. Una medicina predittiva e preventiva abilita anche ad una personalizzazione terapeutica e comportamentale. Una presa di coscienza del paziente può renderlo partecipe e consapevole nella facoltà di poter modificare la sua condotta di vita in una fase anticipatoria, o nelle fasi iniziali di malattia di condividere il processo di cura con il medico che lo assiste. L’analisi proposta deve essere effettuata, seppur in maniera sperimentale, prototipale e circostanziata, allo stato attuale del contesto sanitario italiano, delle tecnologie, delle organizzazioni e delle normative esistenti sul trattamento dei dati. Il progetto descritto da questa tesi è quello di realizzare un prototipo di sistema che permetta di predirre i fattori di rischio per la salute andando a ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Il raggiungimento di questo obbiettivo dipende dalla realizzazione di alcuni punti essenziali: • individuazione di una sorgente dati clinico-medica di partenza (Electronic Health Record); • organizzazione e persone; • metodi e strumenti tecnologici per la raccolta dei dati socio-economici; • pre-elaborazione e allineamento dati clinici e socio-economici; • costruzione dataset clinico e socio economico; • analisi statistica ed approcci di ML per ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Come primo step, la tesi mira a cogliere le difficoltà e problematiche per collezionare un dataset clinico e socio-economico. I risultati preliminari, dell’analisi statistica ed approcci di ML su questo dataset eterogeneo, possono gettare le basi allo sviluppo di un sistema clinico di supporto alle decisioni che ha come obiettivo quello di erogare una medicina preventiva. I contributi di questo lavoro rispetto allo stato dell’arte sono: • Realizzazione di un dataset intersezione di ambiti, in particolare medico-socio economico, su cui effettuare studi longitudinali. Il dataset è stato costruito estrapolando le informazioni degli EHR di medicina generale dei medici di famiglia, unite a variabili sociali, ispirate e riconducibili agli indici per il Benessere Equo e Sostenibile (BES) definiti dall'ISTAT; • Analisi statistica su variabili cliniche e socio economiche (tra lo stile di vita, il benessere e la qualità di vita della persona e fattori economici, sociali e di salute) per individuare correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale; • Stima preliminare di un sub-indice di età biologica con un modello di ML. I pre-dittori vengono ricavati dagli indicatori sullo stile di vita e dalle caratteristichecliniche dei pazienti estratte dall’EHR proposto. L'analisi ed il confronto simultaneo delle correlazioni applicato al dataset di relazione realizzato, evidenzia, per alcune variabili socio-economiche, una significativa correlazione con le variabili di tipo cliniche. I coefficienti risultano particolarmente elevati se calcolati per fasce di età, oltre i 50 anni e soprattutto nel cluster 50-60 anni. La Retta per circolo sportivo e la Soddisfazione economica hanno un’alta correlazione inversa (negativa) con la prescrizione dei farmaci: un alto numero di farmaci prescritti è correlato con l’assenza della retta per il circolo sportivo e una bassa soddisfazione economica. Più esiti di esami diagnostici prescritti corrispondono ad una bassa fiducia generalizzata nelle persone.

Progettazione e analisi di EHR territoriali ed eterogenei per analisi socio-sanitarie

FERRI, ALESSANDRO
2021

Abstract

È ormai opinione consolidata che lo stile di vita comporta risvolti e conseguenze sullo stato di salute generale di una persona. Tuttavia, meno consolidato e dimostrato è l'assunto che oltre ad uno stile di vita, rappresentato principalmente da alimentazione ed attività fisica, incidono anche variabili che si riferiscono all’ambito socio-economico. L’istruzione, la disoccupazione, il reddito, le disparità, la povertà, la criminalità, la situazione abitativa e l’intesa sociale ad esempio sono tutti elementi che possono influire sulla salute. Da questo punto di vista può risultare significativo esplorare variabili e relazioni statistiche tra lo stile di vita, il benessere e la qualità di vita della persona, fattori economici, sociali e di salute. Lo scopo è, attraverso l’applicazione di algoritmi statistici e di Machine Learning (ML), ricercare pattern, relazioni, correlazioni, causalità tra le differenti variabili socio-economiche. Nello stato dell’arte corrente algoritmi di ML permettono di identificare nuovi segnali predittivi dell’insorgenza di alcune malattie o di individuare correlazioni non ancora note fra i risultati di diversi esami clinici comunemente prescritti, patologie e farmaci somministrati. Una medicina predittiva e preventiva abilita anche ad una personalizzazione terapeutica e comportamentale. Una presa di coscienza del paziente può renderlo partecipe e consapevole nella facoltà di poter modificare la sua condotta di vita in una fase anticipatoria, o nelle fasi iniziali di malattia di condividere il processo di cura con il medico che lo assiste. L’analisi proposta deve essere effettuata, seppur in maniera sperimentale, prototipale e circostanziata, allo stato attuale del contesto sanitario italiano, delle tecnologie, delle organizzazioni e delle normative esistenti sul trattamento dei dati. Il progetto descritto da questa tesi è quello di realizzare un prototipo di sistema che permetta di predirre i fattori di rischio per la salute andando a ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Il raggiungimento di questo obbiettivo dipende dalla realizzazione di alcuni punti essenziali: • individuazione di una sorgente dati clinico-medica di partenza (Electronic Health Record); • organizzazione e persone; • metodi e strumenti tecnologici per la raccolta dei dati socio-economici; • pre-elaborazione e allineamento dati clinici e socio-economici; • costruzione dataset clinico e socio economico; • analisi statistica ed approcci di ML per ricercare causalità e correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale. Come primo step, la tesi mira a cogliere le difficoltà e problematiche per collezionare un dataset clinico e socio-economico. I risultati preliminari, dell’analisi statistica ed approcci di ML su questo dataset eterogeneo, possono gettare le basi allo sviluppo di un sistema clinico di supporto alle decisioni che ha come obiettivo quello di erogare una medicina preventiva. I contributi di questo lavoro rispetto allo stato dell’arte sono: • Realizzazione di un dataset intersezione di ambiti, in particolare medico-socio economico, su cui effettuare studi longitudinali. Il dataset è stato costruito estrapolando le informazioni degli EHR di medicina generale dei medici di famiglia, unite a variabili sociali, ispirate e riconducibili agli indici per il Benessere Equo e Sostenibile (BES) definiti dall'ISTAT; • Analisi statistica su variabili cliniche e socio economiche (tra lo stile di vita, il benessere e la qualità di vita della persona e fattori economici, sociali e di salute) per individuare correlazioni tra le differenti condizioni psico-fisiche e la situazione socio-economico individuale; • Stima preliminare di un sub-indice di età biologica con un modello di ML. I pre-dittori vengono ricavati dagli indicatori sullo stile di vita e dalle caratteristichecliniche dei pazienti estratte dall’EHR proposto. L'analisi ed il confronto simultaneo delle correlazioni applicato al dataset di relazione realizzato, evidenzia, per alcune variabili socio-economiche, una significativa correlazione con le variabili di tipo cliniche. I coefficienti risultano particolarmente elevati se calcolati per fasce di età, oltre i 50 anni e soprattutto nel cluster 50-60 anni. La Retta per circolo sportivo e la Soddisfazione economica hanno un’alta correlazione inversa (negativa) con la prescrizione dei farmaci: un alto numero di farmaci prescritti è correlato con l’assenza della retta per il circolo sportivo e una bassa soddisfazione economica. Più esiti di esami diagnostici prescritti corrispondono ad una bassa fiducia generalizzata nelle persone.
It is now a matter of fact that lifestyle has implications and consequences on a person's general health. However, less consolidated and proven is the assumption that in addition to a lifestyle, mainly represented by nutrition and physical activity, variables that refer to the socio-economic area also affect. Education, unemployment, income, inequalities, poverty, crime, housing and social understanding, for example, are all elements that can have health affect. From this point of view, it can be significant to explore variables and statistical relationships between a person's lifestyle, well-being and quality of life, economic, social and health factors. The purpose is, through the application of statistical algorithms and Machine Learning (ML), to search for patterns, relationships, correlations, causality between the different socio-economic variables. In the current state of the art, ML algorithms allow to identify new predictive signals of the onset of certain diseases or to identify correlations not yet known between the results of various commonly prescribed clinical tests, pathologies and drugs administered. A predictive and preventive medicine also enables a therapeutic and behavioral personalization. Awareness of the patient can make him participate and aware in the faculty of being able to change his life conduct in an anticipatory phase, or in the initial stages of illness, to share the treatment process with the doctor who assists him. The proposed analysis must be carried out, albeit in an experimental, prototype and detailed manner, in the current state of the Italian healthcare context, technologies, organizations and existing regulations on data processing. The project described by this thesis is to create a prototype of a system that allows to predict the risk factors for health by searching for causality and correlations between the different psycho-physical conditions and the individual socio-economic situation. The achievement of this goal depends on the realization of some essential points: • identification of a starting clinical-medically data source (Electronic Health Record); • organization and people; • methods and technological tools for the collection of socio-economic data; • pre-processing and alignment of clinical and socio-economic data; • construction of a clinical and socio-economic dataset; • statistical analysis and ML approaches to search for causality and correlations between the different psycho-physical conditions and the individual socio-economic situation. As a first step, the thesis aims to grasp the difficulties and problems to collect a clinical and socio-economic dataset. The preliminary results, from the statistical analysis and ML approaches on this heterogeneous dataset, can lay the foundations for the development of a clinical decision support system that aims to provide preventive medicine. The contributions of this work to the state of the art are: • Creation of an intersection dataset of areas, in particular medical-socio-economic, on which to carry out longitudinal studies. The dataset was constructed by extrapolating the information from the general medicine EHRs of family doctors, combined with social variables, inspired by and attributable to the indices for Fair and Sustainable Wellbeing (BES) defined by ISTAT; • Statistical analysis on clinical and socio-economic variables (between the lifestyle, well-being and quality of life of the person and economic, social and health factors) to identify correlations between the different psycho-physical conditions and the socio-economic situation individual; • Preliminary estimate of a biological age sub-index with an ML model. The predictors are derived from lifestyle indicators and patient clinical characteristics extracted from the proposed EHR. The simultaneous analysis and comparison of the correlations applied to the relationship dataset produced shows, for some socio-economic variables, a significant correlation with the clinical variables. The coefficients are particularly high if calculated for age groups, over 50 years and especially in the 50-60 cluster age. The attend at a sport club and economic satisfaction have a high inverse (negative) correlation with the prescription of drugs: a high number of drugs prescribed is correlated with the non attend to a sport club and low economic satisfaction. More outcomes and prescribed diagnostic tests correspond to a generalized low trust toward people.
EHR; health; social; digital; IoT; IoMT; general practitioner; primary care; machine learning; well-being
cartelle cliniche elettroniche; EHR; BES; sociale; medicina generale; correlazione; età biologica; machine learning; sanità; digitale; cure primarie; benessere; assistenza territoriale
File in questo prodotto:
File Dimensione Formato  
tesi_Ferri.pdf

embargo fino al 31/12/2022

Descrizione: tesi_Ferri
Tipologia: Tesi di dottorato
Licenza: Creative commons
Dimensione 2.72 MB
Formato Adobe PDF
2.72 MB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11566/291125
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact