1 |
[pt] APLICAÇÃO DE TÉCNICAS DE APRENDIZADO DE MÁQUINA PARA A PREDIÇÃO DE INTERNAÇÕES DE ALTO CUSTO / [en] MACHINE LEARNING TO PREDICT HIGH-COST HOSPITALIZATIONSADRIAN MANRESA PEREZ 25 August 2020 (has links)
[pt] Empresas do ramo da Saúde vêm evoluindo seus modelos de gestão, desenvolvendo programas proativos para melhorar a qualidade e a eficiência dos seus serviços considerando informações históricas. Estratégias proativas buscam prevenir e detectar doenças precocemente e também melhorar os resultados das internações. Nesse sentido, uma tarefa desafiadora é identificar quais pacientes devem ser incluídos em programas proativos de saúde. Para isso, a previsão e a modelagem de variáveis relacionadas aos custos estão entre as abordagens mais amplamente utilizadas, uma vez que essas variáveis sào potenciais indicadores do risco, da gravidade e do consumo de recursos médicos de uma internação. A maioria das pesquisas nesta área têm como foco modelar variáveis de custo em uma perspectiva geral e prever variações de custos para períodos específicos. Por outro lado, este trabalho se concentra na previsão dos custos de um evento específico. Em particular, esta dissertação prescreve uma solução para a predição de internações de alto custo, visando dar apoio a gestores de serviços em saúde em suas ações proativas. Para esse fim, foi seguida a metodologia de pesquisa Design Science Research (DSR), aliada ao ciclo de vida de projeto de Ciência de Dados, sobre um cenário real de uma empresa de consultoria em saúde. Os dados fornecidos descrevem internações de pacientes através de suas características demográficas e do histórico de consumo de recursos médicos. Diferentes técnicas estatísticas e de Aprendizado de Máquina foram aplicadas, como Ridge Regression (RR), Least Absolute Shrinkage and Selection Operator (LASSO), Classification and Regression Trees (CART), Random Forest (RF) e Extreme Gradient Boosting (XGB). Os resultados experimentais evidenciaram que as técnicas RF e XGB apresentaram o melhor desempenho, atingindo AUCPR de 0,732 e 0,644, respectivamente. O modelo de predição da técnica RF foi capaz de detectar até 72 porcento, em média, das internações de alto custo com 33 porcento de precisão, o que representa 78,7 porcento do custo total gerado por tais internações. Além disso, os resultados monstraram que o uso de custo prévio e variáveis agregadas de consumo de recursos aumentaram a capacidade de predição do modelo / [en] Healthcare providers are evolving their management models, developing proactive programs to improve the quality and efficiency of their health services, considering the available historical information. Proactive strategies seek not only to prevent and detect diseases but also to enhance hospitalization outcomes. In this sense, one of the most challenging tasks is to identify which patients should be included in proactive health programs. To this end, forecasting and modeling cost-related variables are among the most widely used approaches for identifying such patients, since these variables are potential indicators of the patients hospitalization risk, their severity, and their medical resources consumption. Most of the existing research works in this area aim to model cost variables from an overall perspective and predict cost variations for specific periods. In contrast, this work focuses on predicting the costs of a particular event. Specifically, this thesis prescribes a solution for identifying high-cost hospitalizations, to support health service managers in their proactive actions. To this end, the Design Science Research (DSR) methodology was combined with the Data Science life cycle in a real scenario of a health consulting company. The data provided describes patients hospitalizations through their demographic characteristics and their medical resource consumption. Different statistical and Machine Learning techniques were used to predict high-cost hospitalizations, such as Ridge Regression (RR), Least Absolute Shrinkage and Selection Operator (LASSO), Classification and Regression Trees (CART), Random Forest (RF), and Extreme Gradient Boosting (XGB). The experimental results showed that RF and XGB presented the best performance, reaching an Area Under the Curve Precision-Recall (AUCPR) of 0.732 and 0.644, respectively. In the case of RF, the model was able to detect, on average, 72 percent of the high-cost hospitalizations with a 33 percent of Precision, which represents 78.7 percent of the total cost generated by the high-cost hospitalizations. Moreover, the obtained results showed that the use of prior cost and aggregated variables of resource consumption increased the model s ability to predict high-cost hospitalizations.
|
2 |
[en] PREDICTIVE MODELS FOR STUDENT ATTRITION IN PRIVATE GRADUATION: AN APPLICATION OF MACHINE LEARNING TO RELATIONSHIP MARKETING MANAGEMENT / [pt] MODELOS PREDITIVOS PARA EVASÃO DE ALUNOS NO ENSINO SUPERIOR PRIVADO: UMA APLICAÇÃO DE MACHINE LEARNING PARA GESTÃO DE MARKETING DE RELACIONAMENTOFRANCISCO COIMBRA CARNEIRO PEREIRA 04 January 2018 (has links)
[pt] Perdendo em média mais de 20 por cento da base de alunos todo semestre, a evasão de alunos no ensino superior privado representa um desafio para a gestão dessas instituições. Diferentes abordagens são utilizadas para combater este problema. Para a gestão de marketing de retenção, a identificação dos alunos é o primeiro passo necessário para aplicar uma estratégia de interação personalizada. Nesse sentido, este trabalho apresenta uma metodologia quantitativa para classificação de risco de evasão de alunos ativos. Baseado em dados históricos de alunos que evadiram ou se formaram, modelos gerados por algoritmos de machine learning foram calculados e comparados e, na sequência, utilizados para classificar alunos ativos. Por fim, estimou-se o lifetime value desses alunos para auxiliar na definição de estratégias de retenção. / [en] Losing more than 20 percent of its students each semester, the student attrition in private graduation courses challenges its institutions management. Different approaches to address this problem have been used. To retention marketing management the identification of students is the first necessary step to apply a personalized interaction strategy. In this sense, this work uses a quantitative methodology to classify its students by risk of attrition. Based in historic data of former students of an institution, models were generated by machine learning algorithms and its results compared. Then they were used to classify active students in the educational institution. Afterwards, their lifetime value were estimated in order to help in the definition of retention strategies.
|
3 |
[pt] ENSAIOS EM PREDIÇÃO DO TEMPO DE PERMANÊNCIA EM UNIDADES DE TERAPIA INTENSIVA / [en] ESSAYS ON LENGTH OF STAY PREDICTION IN INTENSIVE CARE UNITSIGOR TONA PERES 28 June 2021 (has links)
[pt] O tempo de permanência (LoS) é uma das métricas mais utilizadas
para avaliar o uso de recursos em Unidades de Terapia Intensiva (UTI). Esta
tese propõe uma metodologia estruturada baseada em dados para abordar
três principais demandas de gestores de UTI. Primeiramente, será proposto
um modelo de predição individual do LoS em UTI, que pode ser utilizado
para o planejamento dos recursos necessários. Em segundo lugar, tem-se
como objetivo desenvolver um modelo para predizer o risco de permanência
prolongada, o que auxilia na identificação deste tipo de paciente e assim
uma ação mais rápida de intervenção no mesmo. Finalmente, será proposto
uma medida de eficiência ajustada por case-mix capaz de realizar análises
comparativas de benchmark entre UTIs. Os objetivos específicos são:
(i) realizar uma revisão da literatura dos fatores que predizem o LoS em
UTI; (ii) propor uma metodologia data-driven para predizer o LoS individual
do paciente na UTI e o seu risco de longa permanência; e (iii) aplicar
essa metodologia no contexto de um grande conjunto de UTIs de diferentes
tipos de hospitais. Os resultados da revisão da literatura apresentaram os
principais fatores de risco que devem ser considerados em modelos de predição.
Em relação ao modelo preditivo, a metodologia proposta foi aplicada
e validada em um conjunto de dados de 109 UTIs de 38 diferentes hospitais
brasileiros. Este conjunto continha um total de 99.492 internações de 01 de
janeiro a 31 de dezembro de 2019. Os modelos preditivos construídos usando
a metodologia proposta apresentaram resultados precisos comparados com
a literatura. Estes modelos propostos têm o potencial de melhorar o planejamento
de recursos e identificar precocemente pacientes com permanência
prolongada para direcionar ações de melhoria. Além disso, foi utilizado o
modelo de predição proposto para construir uma medida não tendenciosa
para benchmarking de UTIs, que também foi validada no conjunto de dados
estudado. Portanto, esta tese propôs um guia estruturado baseado em dados
para gerar predições para o tempo de permanência em UTI ajustadas ao
contexto em que se deseja avaliar. / [en] The length of stay (LoS) in Intensive Care Units (ICU) is one of the
most used metrics for resource use. This thesis proposes a structured datadriven
methodology to approach three main demands of ICU managers.
First, we propose a model to predict the individual ICU length of stay,
which can be used to plan the number of beds and staff required. Second,
we develop a model to predict the risk of prolonged stay, which helps
identifying prolonged stay patients to drive quality improvement actions.
Finally, we build a case-mix-adjusted efficiency measure (SLOSR) capable
of performing non-biased benchmarking analyses between ICUs. To achieve
these objectives, we divided the thesis into the following specific goals: (i)
to perform a literature review and meta-analysis of factors that predict
patient s LoS in ICUs; (ii) to propose a data-driven methodology to predict
the numeric ICU LoS and the risk of prolonged stay; and (iii) to apply this
methodology in the context of a big set of ICUs from mixed-type hospitals.
The literature review results presented the main risk factors that should
be considered in future prediction models. Regarding the predictive model,
we applied and validated our proposed methodology to a dataset of 109
ICUs from 38 different Brazilian hospitals. The included dataset contained
a total of 99,492 independent admissions from January 01 to December
31, 2019. The predictive models to numeric ICU LoS and to the risk of
prolonged stay built using our data-driven methodology presented accurate
results compared to the literature. The proposed models have the potential
to improve the planning of resources and early identifying prolonged stay
patients to drive quality improvement actions. Moreover, we used our
prediction model to build a non-biased measure for ICU benchmarking,
which was also validated in our dataset. Therefore, this thesis proposed a
structured data-driven guide to generating predictions to ICU LoS adjusted
to the specific environment analyzed.
|
Page generated in 0.0673 seconds