Spelling suggestions: "subject:"predicao"" "subject:"medicao""
21 |
[pt] MODELOS DE SIMULAÇÃO PARA ANÁLISE DE INCERTEZA NA PREVISÃO DE PRODUÇÃO DE ÓLEO EM PLATAFORMAS DA BACIA DE CAMPOS / [en] SIMULATION MODELS FOR UNCERTAINTY ANALYSIS IN OIL PRODUCTION FORECASTING ON PLATFORMS IN THE CAMPOS BASINVITOR HUGO PINHEIRO MARQUES 06 November 2023 (has links)
[pt] A produção de petróleo possui alta relevância em âmbito brasileiro e
mundial. Por outro lado, a incerteza do setor presume alta variabilidade nas
previsões de produção de óleo, e exerce um impacto significativo nas decisões. O
estudo contempla analisar o cenário da bacia geográfica de Campos, em estudo de
caso aplicado em empresa nacional de óleo e gás, com objetivo de aprimorar a
previsão de produção de óleo. Para isso, são empregados métodos de simulação,
clusterização e previsão, sendo integrados com julgamento humano. Busca-se
inferir as incertezas inerentes às atividades, analisar os principais riscos envolvidos
e subsidiar a definição das metas de produção. Com esse intuito, foi desenvolvida
uma modelagem orientada a dados, por meio da criação de um simulador com
linguagem de programação em R. Os dados compreendem os anos de 2017 a 2021,
e a projeção é realizada para o ano de 2022. O modelo incorpora julgamento
humano durante o processo, permitindo que os especialistas realizem
modificações no resultado das previsões, agregando sua experiência e informações
exclusivas. A análise de série temporal avalia oito métodos de previsão, seu
resultado mostra que a entidade do potencial produtivo apresenta menor erro do
que na eficiência, e o método TBATs obteve o menor erro na predição. A análise
do planejamento das paradas e entrada dos novos poços é realizada por meio de
análise gráfica, observando os principais riscos relacionados. Por fim, o simulador
apresenta proposta para auxiliar na definição das metas de produção, ele verifica
a probabilidade para alcançar a meta com base nos resultados das simulações. / [en] Oil production has Brazilian and World importance. However, the
randomness of the sector results a high variability in oil production forecasts. This
variability has a significant impact on decisions. The study analyzes the
challenging scenario at geographic Campos basin, in a case applied in a national
energy company. The objective is to improve the risk analysis associated with the
achievement of oil production targets. Simulation, clustering, and time series
forecasting methods are employed, integrating into human judgment. It tries to
infer the uncertainties inherent of the activities to increase the accuracy of oil
production forecasts, analyze the main risks involved, and subsidize the definition
of production targets. A data-driven model is developed, creating a simulator with
R language. The data used the years 2017 to 2021, and the projection is made for
the year 2022. Human judgment is incorporated into the model during the process,
specifying the input parameters to enable experts to make modifications based on
the predictions, adding their unique experience and information. The time series
analysis eight prediction methods, the results show that the oil potential presents
less error than in the production efficiency, and TBATS was the prediction method
that obtained the lowest prediction error. The main risks related to the maintenance
planning and the entry of new wells are identified through graphical analysis.
Finally, the simulator presents a possible solution to help define production goals,
it verifies the probability of reaching the goal based on the simulation results.
|
22 |
[en] PREDICTING DRUG SENSITIVITY OF CANCER CELLS BASED ON GENOMIC DATA / [pt] PREVENDO A EFICÁCIA DE DROGAS A PARTIR DE CÉLULAS CANCEROSAS BASEADO EM DADOS GENÔMICOSSOFIA PONTES DE MIRANDA 22 April 2021 (has links)
[pt] Prever com precisão a resposta a drogas para uma dada amostra baseado em características moleculares pode ajudar a otimizar o desenvolvimento de drogas e explicar mecanismos por trás das respostas aos tratamentos. Nessa dissertação, dois estudos de caso foram gerados, cada um aplicando diferentes dados genômicos para a previsão de resposta a drogas. O estudo de caso 1 avaliou dados de perfis de metilação de DNA como um tipo de característica molecular que se sabe ser responsável por causar tumorigênese e modular a resposta a tratamentos. Usando perfis de metilação de 987 linhagens celulares do genoma completo na base de dados Genomics of Drug Sensitivity in Cancer (GDSC), utilizamos algoritmos de aprendizado de máquina para avaliar o potencial preditivo de respostas citotóxicas para oito drogas contra o câncer. Nós comparamos a performance de cinco algoritmos de classificação e quatro algoritmos de regressão representando metodologias diversas, incluindo abordagens tree-, probability-, kernel-, ensemble- e distance-based. Aplicando sub-amostragem artificial em graus variados, essa pesquisa procura avaliar se o treinamento baseado em resultados relativamente extremos geraria melhoria no desempenho. Ao utilizar algoritmos de classificação e de regressão para prever respostas discretas ou contínuas, respectivamente, nós observamos consistentemente excelente desempenho na predição quando os conjuntos de treinamento e teste consistiam em dados de linhagens celulares. Algoritmos de classificação apresentaram melhor desempenho quando nós treinamos os modelos utilizando linhagens celulares com valores de resposta a drogas relativamente extremos, obtendo valores de area-under-the-receiver-operating-characteristic-curve de até 0,97. Os algoritmos de regressão tiveram melhor desempenho quando treinamos os modelos utilizado o intervalo completo de valores de resposta às drogas, apesar da dependência das métricas de desempenho utilizadas.
O estudo de caso 2 avaliou dados de RNA-seq, dados estes comumente utilizados no estudo da eficácia de drogas. Aplicando uma abordagem de aprendizado semi-supervisionado, essa pesquisa busca avaliar o impacto da combinação de dados rotulados e não-rotulados para melhorar a predição do modelo. Usando dados rotulados de RNA-seq do genoma completo de uma média de 125 amostras de tumor AML rotuladas da base de dados Beat AML (separados por tipos de droga) e 151 amostras de tumor AML não-rotuladas na base de dados The Cancer Genome Atlas (TCGA), utilizamos uma estrutura de modelo semi-supervisionado para prever respostas citotóxicas para quatro drogas contra câncer. Modelos semi-supervisionados foram gerados, avaliando várias combinações de parâmetros e foram comparados com os algoritmos supervisionados de classificação. / [en] Accurately predicting drug responses for a given sample based on molecular features may help to optimize drug-development pipelines and explain mechanisms behind treatment responses. In this dissertation, two case studies were generated, each applying different genomic data to predict drug response. Case study 1 evaluated DNA methylation profile data as one type of molecular feature that is known to drive tumorigenesis and modulate treatment responses. Using genome-wide, DNA methylation profiles from 987 cell lines in the Genomics of Drug Sensitivity in Cancer (GDSC) database, we used machine-learning algorithms to evaluate the potential to predict cytotoxic responses for eight anti-cancer drugs. We compared the performance of five classification algorithms and four regression algorithms representing diverse methodologies, including tree-, probability-, kernel-, ensemble- and distance-based approaches. By applying artificial subsampling in varying degrees, this research aims to understand whether training based on relatively extreme outcomes would yield improved performance. When using classification or regression algorithms to predict discrete or continuous responses, respectively, we consistently observed excellent predictive performance when the training and test sets consisted of cell-line data. Classification algorithms performed best when we trained the models using cell lines with relatively extreme drug-response values, attaining area-under-the-receiver-operating-characteristic-curve values as high as 0.97. The regression algorithms performed best when we trained the models using the full range of drug-response values, although this depended on the performance metrics we used. Case study 2 evaluated RNA-seq data as one of the most popular molecular data used to study drug efficacy. By applying a semi-supervised learning approach, this research aimed to understand the impact of combining labeled and unlabeled data to improve model prediction. Using genome-wide RNA-seq labeled data from an average of 125 AML tumor samples in the Beat AML database (varying by drug type) and 151 unlabeled AML tumor samples in The Cancer Genome Atlas (TCGA) database, we used a semi-supervised model structure to predict cytotoxic responses for four anti-cancer drugs. Semi-supervised models were generated, while assessing several parameter combinations and were compared against supervised classification algorithms.
|
Page generated in 0.0229 seconds