• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 318
  • 28
  • 10
  • Tagged with
  • 357
  • 237
  • 57
  • 43
  • 41
  • 41
  • 35
  • 34
  • 31
  • 30
  • 29
  • 29
  • 27
  • 25
  • 24
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
231

Equações de predição de gasto energético de repouso por meio de dados gerados por avaliações de bioimpedância / Resting energy expenditure prediction equation using bioelectrical impedance assessment data

Bellafronte, Natália Tomborelli 07 February 2017 (has links)
Avaliar acuradamente o gasto energético de repouso (GER) é de extrema importância no suporte nutricional e a análise de composição corporal influencia seu valor. O estudo teve como objetivos desenvolver equações preditivas de GER por meio de dados de composição corporal obtidos por exame de bioimpedância eléctrica multifrequencial por espectroscopia (BIS); avaliar a adequação das fórmulas mais usuais de predição do GER; medir a correlação dos parâmetros gerados por BIS com o GER, analisar a concordância e a correlação dos dados gerados pelos aparelhos de bioimpedância de frequência simples (BIA) e BIS, além da concordância entre os métodos de classificação do estado nutricional por Índice de Massa Corporal (IMC) e por %MG (Porcentual de Massa Gorda) avaliada por BIA e BIS. Caracterizou-se como um estudo transversal observacional desenvolvido com brasileiros saudáveis, ambos os sexos, entre 20 e 40 anos de idade, estratificados em subgrupos pelo IMC (subnutrido, n=40; eutrófico, n=120; com sobrepeso, n=118 e com obesidade, n=114) e pelo %MG (baixa gordura, n=17; gordura adequada, n=101; excesso de gordura, n=91 e obesidade, n=183). O GER foi medido por calorimetria indireta (CI). Houve emprego do teste de correlação de Spearman e de Pearson e do gráfico de dispersão para avaliar as associações entre as variáveis e de modelos de regressão linear múltipla no desenvolvimento das equações, por método Stepwise. Aplicou-se o teste de BlandAltman, o coeficiente de correlação intraclasse, o teste de Wilcoxon e o coeficiente de correlação kappa para análise de concordância entre medidas e classificações e o teste de Mann-Whitney e Kruskal-Wallis para comparação entre os subgrupos (p<0,05). O GER predito foi considerado adequado quando se encontrou entre 90 e 110% do GER medido por CI. Desenvolveu-se uma equação para a amostra total por sexo e uma para cada categoria do IMC e do %MG e as mesmas apresentaram baixos valores de coeficientes de determinação (R2). As maiores correlações entre as variáveis independentes com o GER ocorreram para o peso, IMC, Massa Gorda7 (MG) e Massa de Tecido Adiposo. Todas as equações usuais avaliadas não foram capazes de predizer corretamente o GER em metade da amostra. As classificações do estado nutricional realizadas por meio do IMC e %MGBIA obtiveram concordância fraca com aquela por %MGBIS. A concordância entre BIA e BIS foi baixa: tecidos corporais de maior hidratação foram superestimados e os menos hidratados subestimados, por BIA frente a BIS, e os vieses entre os dois equipamentos foram maiores com o aumento do IMC. Assim, as equações desenvolvidas apresentaram baixo R2, impossibilitando sua aplicação no cenário clínico. Já as equações de predição do GER avaliadas exibiram baixa adequação, não se recomendando seu uso. A classificação do estado nutricional por meio do IMC subestima as quantidades de MG, sendo mais adequada a utilização de composição corporal para caracterização nutricional. BIA e BIS geram resultados distintos: o tamanho corporal aparece como um fator de confusão na distinção das massas corporais analisadas, mas, a distribuição e a quantidade de água corporal total apresentam-se como fatores limitantes de maior força / The accurate assessment of resting energy expenditure (REE) is extremely important in nutritional support for energy supply adjustment and body composition analysis plays a significant role in determining its value. The objectives of this thesis was to develop prediction equations of REE using body composition assessment data by bioelectrical impedance; assess the adequacy of the more usual prediction equations of REE against the measured value; measuring the correlation of the parameters generated by multifrequency spectroscopy bioelectrical impedance (BIS) in GER and analyze the agreement and correlation of data generated by bioelectrical impedance devices of simple frequency (BIA) and (BIS), in total sample and between subgroups stratified by body mass index (BMI) and body fat percentage (%BF), in addition to assess the agreement between the classification of nutritional state by BMI and %BF generated by BIA and BIS . This was an observational cross-sectional study with healthy Brazilians, both sexes, between 20 and 40 years old, stratified into subgroups by BMI (malnourished, n=40; eutrophic, n=120; overweight, n=118 and obese, n=114) and by %BF (low fat, n=17; suitable fat, n=101; excess fat, n=91 and obesity, n=183). There was the use of anthropometric and epidemiological parameters and those generated by BIS analysis in the equations\'s development. REE was measured by indirect calorimetry (IC). Employment Spearman correlation test and scatterplot to assess the associations between the variables and multiple linear regression models in the development of the equations. Application of Bland-Altman analysis, intraclass correlation coefficient, Wilcoxon test and kappa correlation coefficient for agreement analysis between measurements and classifications and the Mann-Whitney and Kruskal-Wallis test to compare the subgroups (p <0,05). Thus, an equation was developed for the total female sample and one for each of the last three categories of BMI and% BF, the same for males. The equations obtain low values of determination coefficient (R2). The highest correlations between the independent variables with REE occurred, for both females and males, with weight, BMI, BF and9 Adipose Tissue Mass. All the usual equations evaluated had low accuracy since none was able to correctly predict GER in 50% or more of the sample, either for the whole sample or stratified by BMI and %BF. The equations with the highest percentages of the sample within the adequacy limits were Owens, Henry-Rees and Livingston-Kohlstadt 2. The worst percentages of the sample within the adequacy limits were those of Ireton-Jones, FAO/WHO/UN 2 and Frankenfield 1. The nutritional status rankings performed through BMI and %BFBIA obtained weak agreement with that by %BFBIS, tending to classify the individual one or two levels below, underestimating the presence of %BF. The agreement between BIA and BIS was low since the equipment presented different results for all the variables, either in the total sample or in the stratified subgroups. The BIA against BIS underestimated the amounts related to the BF and total body water variables and overestimated those concerning the FFM and BCM. The biases between the two equipments were greater with the increase of BMI. Thus, the developed equations have low R2, which makes it impossible to apply them in the clinical setting. The most common and predictive GER prediction equations presented low accuracy, not proving to be adequate for use in clinical practice. The classification of nutritional status through BMI results in errors that compromise the approach of nutritional therapy, underestimating the amounts of BF and its deleterious potencies, so it is more appropriate to evaluate it through body composition. BIA and BIS generate different results, and body size appears as a confounding factor in the body mass distinction analyzed by BIA, but the distribution and amount of total body water is a limiting factor of greater strength for the BIA
232

Framework para sistema tutor adaptativo ao raciocínio crítico em contabilidade - STARCC / Framework for adaptive tutoring system for critical thinking in accounting - STARCC

Souza, Marcelo Cunha de 13 June 2019 (has links)
O desenvolvimento de habilidades cognitivas de análise, síntese e avaliação, diretamente ligadas à capacidade de raciocínio crítico, constitui um importante objetivo do processo educacional, há décadas a educação contábil é criticada pela deficiência de seus egressos na aquisição e no uso dessas habilidades. Algumas críticas estão diretamente relacionadas ao conteúdo tecnicista da formação (currículo), outras se referem à metodologia aplicada nas salas de aula (pedagogia). O cenário atual, de avanços tecnológicos, cria um ambiente de constantes mudanças a profissão contábil, sendo necessário que haja mudanças na forma e no conteúdo dos cursos para acompanhar essas mudanças. O corpo doutores e pesquisadores em Contabilidade, não é suficiente para protagonizar essa mudança, e o uso de tecnologias podem auxiliar. Diante desse cenário o presente estudo buscou identificar em que medida os sistemas tutores adaptativos auxiliam o estudante de Contabilidade no desenvolvimento das habilidades de raciocínio crítico, propondo um framework para desenvolvimento de Sistemas Tutores Adaptativos ao Raciocínio Crítico em Contabilidade (STARCC). Como resultado o presente estudo desenvolveu um método de classificação do nível de raciocínio crítico em estudantes da disciplina de História da Contabilidade, com base nos logs de acesso do sistema de apoio ao ensino; do processamento da linguagem natural dos textos produzidos para a disciplina; e no índice Flesch-Kincaid de legibilidade dos materiais produzidos. Analises demonstram que o modelo classifica os estudantes com acurácia de 86,20% em relação ao processo realizado por um professor. Entretanto os resultados precisam ser analisados com cuidado, dado que o modelo deve ser testado e melhorado em outras disciplinas e, em outro conjunto de dados, para que possa ser fonte confiável de classificação do nível de raciocínio crítico dos estudantes. Como sugestão de pesquisas futuras pode-se comparar os resultados do modelo de classificação, baseado em inteligência artificial, dessa pesquisa com os resultados de testes consagrados pela literatura, como por exemplo o California Critical Thinking Skills Test (CCTST); o Ennis-Weir Critical Thinking Essay Test (EWCTET). O framework STARCC, mostrou-se útil para elaboração de sistemas de apoio ao processo de ensino e aprendizagem no curso de História da Contabilidade e pesquisas futuras devem submetê-lo a testes em relação a atributos como: facilidade, utilidade e custo benefício em utilizá-lo / The development of cognitive abilities of analysis, synthesis and, evaluation, directly linked to the capacity for critical thinking, is an important objective of the educational process, for decades accounting education has been criticized for the deficiency of its graduates in the acquisition and use of these skills. Some criticisms are directly related to the technical content of the training (curriculum), others refer to the methodology applied in classrooms (pedagogy). The current scenario, of technological advances, creates an environment of constant changes in the accounting profession, being necessary that there are changes in the form and the content of the courses to follow these changes. The body doctors and researchers in Accounting are not enough to star in this change, and the use of technologies can help. Given this scenario, the present study sought to identify the extent to which adaptive tutors systems help the Accounting student in the development of critical reasoning skills, proposing a framework for the development of Adaptive Tutoring Systems for Critical Thinking in Accounting (STARCC). As a result the present study developed a method of classifying the level of critical reasoning in students of the discipline of Accounting History, based on the access logs of the teaching support system; of the processing of the natural language of the texts produced for the discipline; and the Flesch-Kincaid Index of readability of the materials produced. Analyzes show that the model classifies the students with an accuracy of 86.20% in relation to the process performed by a teacher. However, the results need to be carefully analyzed, since the model must be tested and improved in other disciplines and in another set of data so that it can be a reliable source of classification for students\' critical reasoning level. As a suggestion of future research, it is possible to compare the results of the artificial intelligence-based classification model of this research with the results of tests established in the literature, such as the California Critical Thinking Skills Test (CCTST); the Ennis-Weir Critical Thinking Essay Test (EWCTET). The STARCC framework has proved to be useful for the elaboration of support systems for the teaching and learning process in the course of Accounting History and future research should subject it to tests in relation to attributes such as ease, utility and cost benefit.
233

Predição genômica de híbridos simples de milho / Genomic prediction of maize single-crosses

Mendes, Marcela Pedroso 24 February 2015 (has links)
Métodos de predição podem aumentar consideravelmente a eficiência dos programas de melhoramento de milho. O objetivo deste estudo foi predizer a performance de 250 híbridos simples de milho avaliados em múltiplos ambientes utilizando a informação de marcadores moleculares. Para isso, 50 linhagens endogâmicas provenientes de diferentes populações foram cruzadas com cinco linhagens elite, também endogâmicas, para obtenção dos 250 híbridos simples. As matrizes moleculares das linhagens e dos híbridos foram obtidas a partir da genotipagem das 55 linhagens com 614 marcadores AFLP. Os híbridos simples foram avaliados para produção de grãos em 13 ambientes. A predição dos híbridos foi realizada utilizando o modelo misto BLUP considerando diferentes coeficientes de parentesco e similaridade no estado na predição dos efeitos das capacidades geral e específica de combinação dos genitores. As médias preditas dos híbridos a partir de cada coeficiente foram correlacionadas com as médias fenotípicas para obtenção da acurácia de predição. A predição também foi realizada utilizando o modelo de seleção genômica ampla RR-BLUP. Nesse caso, a matriz molecular dos híbridos foi utilizada diretamente no modelo misto de estimação dos efeitos dos marcadores e da contribuição de cada um deles para o valor genético dos híbridos. Foram realizadas validações cruzadas entre e dentro de ambientes e entre e dentro de grupos de híbridos relacionados a fim de verificar os efeitos do tamanho da população de treinamento (N), número de marcas (NM), interação híbridos x ambientes (H x A) e da estrutura da população na estimativa da acurácia de predição. A predição genômica foi comparada com a seleção fenotípica quanto à eficiência em identificar híbridos superiores em um esquema de melhoramento de milho. Todos os coeficientes de parentesco e similaridade no estado apresentaram elevadas estimativas de acurácia, contudo foi possível observar considerável superioridade dos coeficientes Wang e Rogers Modificado tanto na predição quanto na seleção dos híbridos superiores, demonstrando o potencial dessas metodologias como ferramentas a serem utilizadas nos programas de melhoramento de milho. Os resultados da predição utilizando o modelo de seleção genômica ampla indicaram que o aumento de N e NM não alteraram significativamente as estimativas de acurácia. As estimativas da acurácia na validação cruzada dentro de ambientes foram superiores às obtidas entre ambientes, inferindo que o efeito da interação H x A foi expressivo. Também foram observadas estimativas de acurácia expressivamente maiores para populações de treinamento e validação compostas por híbridos relacionados. Em todos os casos, as estimativas de acurácia apresentaram amplos intervalos em função da amostra de híbridos utilizada nas populações de treinamento e validação, indicando que a seleção genômica pode não ser eficiente dependendo da população amostrada. Os resultados deste estudo sugerem que a predição genômica é uma ferramenta para aumentar a eficiência da seleção nos programas de melhoramento se utilizada de forma adequada pelo melhorista, considerando os efeitos de estrutura de população e interação H x A de forma a maximizar a acurácia e, consequentemente, o sucesso da predição. / Prediction using molecular markers information can greatly increase the efficiency of maize breeding programs. This study aimed to predict the performance of maize single-crosses evaluated in multiple environments and using molecular markers information. Five inbred lines used as testers were crossed to 50 inbred lines from multiple populations to obtain 250 maize single-crosses. 614 AFLP markers were used to asses molecular matrices of the inbred lines and single-crosses. The 250 single-crosses were evaluated for grain yield in 13 environments. Genomic prediction was performed using the mixed model BLUP considering different genomic relationship and similarity in state coefficients to predict the effect of general and specific combining abilities of the parents. Predicted means from each coefficient were correlated with phenotypic means for obtaining prediction accuracy. Genomewide prediction was also performed using the linear regression model RR-BLUP in the estimation of markers genotypic values and its contribution to hybrids genetic values. Cross-validations between and within environments and between and within groups of related single-crosses were performed to verify the effects of training population size (N), number of markers (NM), genotype-by-environment interaction (G x E) and population structure in estimating accuracy. Genomic prediction was compared with phenotypic selection in efficiency of selecting better hybrids in a maize breeding program. All relationship coefficients and similarity in state coefficients showed high values of accuracy, however we observed superiority of Wang relationship coefficient and Modified Rogers similarity coefficient both in predicting and in identifying the best single-crosses, showing the potential of these approaches as tools to be used in maize breeding programs. Genomewide prediction results showed that increasing N and NM did not led to higher accuracy estimates. Predicted accuracies of cross validation analysis within environments were higher than between environments, indicating that the effect of G x E interaction was significant. Greater accuracies were achieved when training and validation set were from related single-crosses. In all scenarios, wide intervals of accuracy were found, meaning that genomic prediction may not be effective depending on the sample used. Therefore, the results of this study suggest that genomic prediction is a tool to increase the efficiency of selection in breeding programs if used properly by breeders, considering the population structure and G x E interaction effect so as to reduce sample problems and maximize accuracy and hence the success of prediction.
234

Análise do controle glicêmico e de marcadores laboratoriais de função renal para a predição de crescimento fetal em gestantes com diabetes mellitus tipo 1 / Analysis of glycemic control and renal function laboratory markers in pregnant women with type 1 diabetes mellitus for prediction of fetal growth

Codarin, Rodrigo Rocha 21 March 2018 (has links)
Introdução: O Diabetes mellitus tipo 1 (DM1) cursa com produção ausente ou irrisória de insulina e é a forma responsável pelos casos mais graves de distúrbios glicêmicos. O DM1 exerce forte influência sobre o crescimento fetal. Enquanto a hiperglicemia estimula o crescimento fetal devido à hiperinsulinemia, nas pacientes com vasculopatias a placentação inadequada pode levar o feto à restrição. Objetivos: identificar alterações de crescimento fetal e avaliá-las quanto a sua associação com o controle glicêmico materno e de marcadores laboratoriais de função renal. Métodos: foram avaliadas, de forma prospectiva em coorte observacional, 60 gestantes com DM1 que iniciaram o pré-natal no primeiro trimestre. A associação entre a classificação de peso ao nascimento com as seguintes variáveis foi analisada: média glicêmica, frequência de hipo e hiperglicemia, frequência de hipo e hiperglicemia grave, hemoglobina glicada, frutosamina, ácido úrico, creatinina e proteinúria de 24 horas. A predição do crescimento fetal também foi estudada. Resultados: Desvios do crescimento fetal em pacientes com DM1 ocorreram em 41% dos casos (n=25). Observou-se que 10% das gestações resultaram em PIG (n=6) e 31%, em GIG (n=19). Níveis aumentados de média glicêmica (p =0,006), baixa frequência de hipoglicemias (p = 0,027) e alta frequência de hiperglicemias (p = 0,014) se associaram a GIG no terceiro trimestre. Em todos os trimestres, valores séricos mais elevados de ácido úrico, creatinina e proteinúria de 24hs, se associaram de maneira significativa, ao grupo PIG. Foi construído um modelo, com taxa de acerto de 80.3%, para a predição de crescimento fetal com os valores de terceiro trimestre da média glicêmica e da creatinina. Conclusões: Foram identificadas variáveis relacionadas ao controle glicêmico materno e à marcadores laboratoriais de função renal que se associaram a alterações no crescimento fetal. Usando algumas dessas variáveis foi possível construir um modelo para predição do crescimento fetal com boa acurácia / Introduction. Diabetes mellitus type 1 (DM1) is described as absent or negligible production of insulin and it is responsible for the most severe cases of glycemic disorders. DM1 has a strong influence on fetal growth. In pregnant women the hyperglycemia stimulates fetal growth, and the vasculopathy influences the placentation process, which may lead to growth restriction. Objective. To identify fetal growth disorders and their association with maternal glycemic control and laboratory markers of renal function. Methods. Sixty pregnant women with DM1 were prospectively followed from the first trimester in an observational cohort. The association between birthweight classification with the following parameter were investigated: glycemic mean, frequency of hypo and hyperglycemia, frequency of severe hyper and hypoglycemia, glycated hemoglobin, fructosamine, uric acid, creatinine and proteinuria of 24 hours. The prediction of fetal growth was also investigated. Results. Abnormal fetal growth was observed in 41% (n= 25). Large for gestational age (LGA) was observed in 31.7% (n=19) and small for gestational age (SGA) in 10% (n= 6). High values of glycemic mean (p = 0.006), low frequency of hypoglycemia (p = 0.027) and high frequency of hyperglycemia (p = 0.014) were significantly associated with LGA fetal growth in the third trimester. In all trimesters, the SGA fetal growth was significantly associated with higher serum values of uric acid, creatinine and proteinuria of 24 hours. The prediction model for fetal growth, using values of glycemic mean and creatinine, was significant in the third trimester with an accuracy of 80.3%. Conclusions. The maternal glycemic control and the laboratory markers of renal function associated with the fetal growth disorders in pregnancies with DM1 were identified. Using these parameters it was possible to predict with a good accuracy the fetal growth in DM1
235

Algoritmos evolutivos para predição de estruturas de proteínas / Evolutionary algorithms, to proteins structures prediction

Lima, Telma Woerle de 01 September 2006 (has links)
A Determinação da Estrutura tridimensional de Proteínas (DEP) a partir da sua seqüência de aminoácidos é importante para a engenharia de proteínas e o desenvolvimento de novos fármacos. Uma alternativa para este problema tem sido a aplicação de técnicas de computação evolutiva. As abordagens utilizando Algoritmos Evolutivos (AEs) tem obtido resultados relevantes, porém estão restritas a pequenas proteínas, com dezenas de aminoácidos e a algumas classes de proteínas. Este trabalho propõe a investigação de uma abordagem utilizando AEs para a predição da estrutura terciária de proteínas independentemente do seu tamanho e classe. Os resultados obtidos demonstram que apesar das dificuldades encontradas a abordagem investigada constitue-se em uma alternativa em relação aos métodos clássicos de determinação da estrutura terciária das proteínas. / Protein structure determination (DEP) from aminoacid sequences is very importante to protein engineering and development of new drugs. Evolutionary computation has been aplied to this problem with relevant results. Nevertheless, Evolutionary Algorithms (EAs) can work with only proteins with few aminoacids and some protein classes. This work proposes an approach using AEs to predict protein tertiary structure independly from their size and class. The obtained results show that, despite of the difficulties that have been found, the investigate approach is a relevant alternative to classical methods to protein structure determination.
236

Predição de RNAs não codificantes e sua aplicação na busca do componente RNA da telomerase / Noncoding RNA prediction and its application in the telomerase RNA component searching

Lima, Ariane Machado 20 December 2006 (has links)
RNAs não codificantes (ncRNAs) têm ganho crescente prestígio nos últimos anos devido a recentes e contínuas descobertas revelando sua diversidade e importância. Porém, a identificação dessas moléculas ainda é um problema em aberto. Em particular, Plasmodium falciparum é um desafio para a pesquisa de ncRNAs, onde poucos foram identificados até o momento. P. falciparum é o parasita que causa uma malária humana letal. A descoberta de novos ncRNAs neste organismo pode auxiliar no desenvolvimento de novos tratamentos. Este trabalho faz um estudo sobre técnicas computacionais para a predição de ncRNAs e, utilizando como objeto de estudo P. falciparum, propõe uma metodologia de predição que seja aplicável inclusive a genomas com viés composicional. A ênfase deste estudo foi a predição de ncRNAs família-específicos, utilizando o componente RNA da telomerase como objeto de estudo. Este é um importante RNA que, devido à sua alta taxa de mutação, é de difícil identificação. Este RNA ainda não foi identificado em P. falciparum. No entanto, evidências biológicas indicam que este RNA é presente, funcional e deve ser essencial ao parasita, caracterizando-se como um alvo de drogas. Além disso, foi realizado um trabalho preliminar sobre a predição de ncRNAs em geral em P. falciparum utilizando uma abordagem comparativa. / Noncoding RNAs (ncRNAs) have been receiving increasing prestige in the last years due to recent and continuous discoveries revealing their diversity and importance. However, the identification of these molecules is still an open problem. In particular, Plasmodium falciparum is a challenge for the ncRNA research, in which few ncRNAs have been identified. P. falciparum is the parasite that causes a lethal human malaria. The discovery of new ncRNAs in this organism may help in the development of new treatments. This work does a research of computational techniques for the ncRNA prediction and, by using P. falciparum as target, proposes a prediction methodology which is also applicable to compositionally biased genomes. The emphasis of this study was the prediction of family-specific ncRNAs, by using the telomerase RNA component as target. This is an important RNA that has a high mutation rate, being difficult to predict. This RNA has not been identified in P. falciparum, yet. However, biological evidences indicate this RNA is present, functional and might be essential for the parasite, being a drug target. In addition, this work presents preliminary results about the prediction of general ncRNAs in P. falciparum by using a comparative approach.
237

Predição de séries temporais por similaridade / Similarity-based time series prediction

Parmezan, Antonio Rafael Sabino 07 April 2016 (has links)
Um dos maiores desafios em Mineração de Dados é a integração da informação temporal ao seu processo. Esse fato tem desafiado profissionais de diferentes domínios de aplicação e recebido investimentos consideráveis da comunidade científica e empresarial. No contexto de predição de Séries Temporais, os investimentos se concentram no subsídio de pesquisas destinadas à adaptação dos métodos convencionais de Aprendizado de Máquina para a análise de dados na qual o tempo constitui um fator importante. À vista disso, neste trabalho é proposta uma nova extensão do algoritmo de Aprendizado de Máquina k-Nearest Neighbors (kNN) para predição de Séries Temporais, intitulado de kNN - Time Series Prediction with Invariances (kNN-TSPI ). O algoritmo concebido difere da versão convencional pela incorporação de três técnicas para obtenção de invariância à amplitude e deslocamento, invariância à complexidade e tratamento de casamentos triviais. Como demonstrado ao longo desta dissertação de mestrado, o uso simultâneo dessas técnicas proporciona ao kNN-TSPI uma melhor correspondência entre as subsequências de dados e a consulta de referência. Os resultados de uma das avaliações empíricas mais extensas, imparciais e compreensíveis já conduzidas no tema de predição de Séries Temporais evidenciaram, a partir do confronto de dez métodos de projeção, que o algoritmo kNN-TSPI, além de ser conveniente para a predição automática de dados a curto prazo, é competitivo com os métodos estatísticos estado-da-arte ARIMA e SARIMA. Por mais que o modelo SARIMA tenha atingido uma precisão relativamente superior a do método baseado em similaridade, o kNN-TSPI é consideravelmente mais simples de ajustar. A comparação objetiva e subjetiva entre algoritmos estatísticos e de Aprendizado de Máquina para a projeção de dados temporais vem a suprir uma importante lacuna na literatura, a qual foi identificada por meio de uma revisão sistemática seguida de uma meta-análise das publicações selecionadas. Os 95 conjuntos de dados empregados nos experimentos computacionais juntamente com todas as projeções analisadas em termos de Erro Quadrático Médio, coeficiente U de Theil e taxa de acerto Prediction Of Change In Direction encontram-se disponíveis no portal Web ICMC-USP Time Series Prediction Repository. A presente pesquisa abrange também contribuições e resultados significativos em relação às propriedades inerentes à predição baseada em similaridade, sobretudo do ponto de vista prático. Os protocolos experimentais delineados e as diversas conclusões obtidas poderão ser usados como referência para guiar o processo de escolha de modelos, configuração de parâmetros e aplicação dos algoritmos de Inteligência Artificial para predição de Séries Temporais. / One of the major challenges in Data Mining is integrating temporal information into process. This difficulty has challenged professionals several application fields and has been object of considerable investment from scientific and business communities. In the context of Time Series prediction, these investments consist majority of grants for designed research aimed at adapting conventional Machine Learning methods for data analysis problems in which time is an important factor. We propose a novel modification of the k-Nearest Neighbors (kNN) learning algorithm for Time Series prediction, namely the kNN - Time Series Prediction with Invariances (kNN-TSPI). Our proposal differs from the literature by incorporating techniques for amplitude and offset invariance, complexity invariance, and treatment of trivial matches. These three modifications allow more meaningful matching between the reference queries and Time Series subsequences, as we discuss with more details throughout this masters thesis. We have performed one of the most comprehensible empirical evaluations of Time Series prediction, in which we faced the proposed algorithm with ten methods commonly found in literature. The results show that the kNN-TSPI is appropriate for automated short-term projection and is competitive with the state-of-the-art statistical methods ARIMA and SARIMA. Although in our experiments the SARIMA model has reached a slightly higher precision than the similarity based method, the kNN-TSPI is considerably simpler to adjust. The objective and subjective comparisons of statistical and Machine Learning algorithms for temporal data projection fills a major gap in the literature, which was identified through a systematic review followed by a meta-analysis of selected publications. The 95 data sets used in our computational experiments, as well all the projections with respect to Mean Squared Error, Theils U coefficient and hit rate Prediction Of Change In Direction are available online at the ICMC-USP Time Series Prediction Repository. This work also includes contributions and significant results with respect to the properties inherent to similarity-based prediction, especially from the practical point of view. The outlined experimental protocols and our discussion on the usage of them, can be used as a guideline for models selection, parameters setting, and employment of Artificial Intelligence algorithms for Time Series prediction.
238

MDAPSP - Uma arquitetura modular distribuída para auxílio à predição de estruturas de proteínas / MDAPSP - A modular distributed architecture to support the protein structure prediction

Oliveira, Edvard Martins de 09 May 2018 (has links)
A predição de estruturas de proteínas é um campo de pesquisa que busca simular o enovelamento de cadeias de aminoácidos de forma a descobrir as funções das proteínas na natureza, um processo altamente dispendioso por meio de métodos in vivo. Inserida no contexto da Bioinformática, é uma das tarefas mais computacionalmente custosas e desafiadoras da atualidade. Devido à complexidade, muitas pesquisas se utilizam de gateways científicos para disponibilização de ferramentas de execução e análise desses experimentos, aliado ao uso de workflows científicos para organização de tarefas e disponibilização de informações. No entanto, esses gateways podem enfrentar gargalos de desempenho e falhas estruturais, produzindo resultados de baixa qualidade. Para atuar nesse contexto multifacetado e oferecer alternativas para algumas das limitações, esta tese propõe uma arquitetura modular baseada nos conceitos de Service Oriented Architecture (SOA) para oferta de recursos computacionais em gateways científicos, com foco nos experimentos de Protein Structure Prediction (PSP). A Arquitetura Modular Distribuída para auxílio à Predição de Estruturas de Proteínas (MDAPSP) é descrita conceitualmente e validada em um modelo de simulação computacional, no qual se pode identificar suas capacidades, detalhar o funcionamento de seus módulos e destacar seu potencial. A avaliação experimental demonstra a qualidade dos algoritmos propostos, ampliando a capacidade de atendimento de um gateway científico, reduzindo o tempo necessário para experimentos de predição e lançando as bases para o protótipo de uma arquitetura funcional. Os módulos desenvolvidos alcançam boa capacidade de otimização de experimentos de PSP em ambientes distribuídos e constituem uma novidade no modelo de provisionamento de recursos para gateways científicos. / PSP is a scientific process that simulates the folding of amino acid chains to discover the function of a protein in live organisms, considering that its an expensive process to be done by in vivo methods. PSP is a computationally demanding and challenging effort in the Bioinformatics stateof- the-art. Many works use scientific gateways to provide tools for execution and analysis of such experiments, along with scientific workflows to organize tasks and to share information. However, these gateways can suffer performance bottlenecks and structural failures, producing low quality results. With the goal of offering alternatives to some of the limitations and considering the complexity of the topics involved, this thesis proposes a modular architecture based on SOA concepts to provide computing resources to scientific gateways, with focus on PSP experiments. The Modular Distributed Architecture to support Protein Structure Prediction (MDAPSP) is described conceptually and validated in a computer simulation model that explain its capabilities, detail the modules operation and highlight its potential. The performance evaluation presents the quality of the proposed algorithms, a reduction of response time in PSP experiments and prove the benefits of the novel algorithms, establishing the basis for a prototype. The new modules can optmize the PSP experiments in distributed environments and are a innovation in the resource provisioning model for scientific gateways.
239

Aumento da eficiência do cálculo da energia de van der Waals em algoritmos genéticos para predição de estruturas de proteínas / Enhance the Van der Waals energy efficiency calculi in genetic algorithms for protein structure prediction

Bonetti, Daniel Rodrigo Ferraz 31 March 2010 (has links)
As proteínas são moléculas presentes nos seres vivos e essenciais para a vida deles. Para entender a função de uma proteína, devese conhecer sua estrutura tridimensional (o posicionamento correto de todos os seus átomos no espaço). A partir da estrutura de uma proteína vital de um organismo causador de uma doença é possível desenvolver fármacos para o tratamento da doença. Para encontrar a estrutura de uma proteína, métodos biofísicos, como Cristalografia de Raio-X e Ressonância Nuclear Magnética têm sido empregados. No entanto, o uso desses métodos tem restrições práticas que impedem a determinação de várias estruturas de proteínas. Para contornar essas limitações, métodos computacionais para o problema de predição da estrutura da proteína (PSP, Protein Structure Prediction) têm sido investigados. Várias classes de métodos computacionais têm sido desenvolvidas para o problema de PSP. Entre elas, as abordagens ab initio são muito importantes, pois não utilizam nenhuma informação prévia de outras estruturas de proteínas para fazer o PSP, apenas a sequência de aminoácidos da proteína e o gráfico de Ramachandran são empregados. O PSP ab initio é um problema combinatorial que envolve relativamente grandes instâncias na prática, por exemplo, as proteínas em geral têm centenas ou milhares de variáveis para determinar. Para vencer esse entrave, metaheurísticas como os Algoritmos Genéticos (AGs) têm sido investigados. As soluções geradas por um AG são avaliadas pelo cálculo da energia potencial da proteína. Entre elas, o cálculo da interação da energia de van der Waals é custoso computacionalmente tornando o processo evolutivo do AG muito lento mesmo para proteínas pequenas. Este trabalho investiga técnicas para reduzir significativamente o tempo de execução desse cálculo. Basicamente, foram propostas modificações de técnicas de paralelização utilizando MPI e OpenMP para os algoritmos resultantes. Os resultados mostram que o cálculo pode ser 1.500 vezes mais rápido para proteínas gigantes quando aplicadas as técnicas investigadas neste trabalho / Proteins are molecules present in the living organism and essential for their life. To understand the function of a protein, its threedimensional structure (the correct positions of all its atoms in the space) should be known. From the structure of a vital protein of an organism that causes a human disease, it is possible to develop medicines for treatment of the disease. To find a protein structure, biophysical methods, as Crystallography of X-Ray and Magnetic Nuclear Resonance, have been employed. However, the use of those methods have practical restrictions that impede the determination of several protein structures. Aiming to overcome such limitation, computational methods for the problem of protein structure prediction (PSP) has been investigated. Several classes of computational methods have been developed for PSP. Among them, ab initio approaches are very important since they use no previous information from other protein structure, only the sequence of amino acids of the protein and the Ramachandran graph are employed. The ab initio PSP is a combinatorial problem that involves relatively large instances in practice, i. e. proteins in general have hundreds or thousands of variables to be determined. To deal with such problem, metaheuristics as Genetic Algorithms (GAs) have been investigated. The solutions generated by a GA are evaluated by the calculus of the potencial energies of the protein. Among them, the calculation of the interaction of van der Waals energy is computationally intense making the evolutionary process of a GA very slow even for non-large proteins. This work investigated techniques to significantly reduce the running time for that calculus. Basically, we proposed modifications parallelization of the resultant algorithm using MPI and OpenMP techniques. The results show that such calculus can be 1.500 times faster when applying the techniques investigated in this work for large proteins
240

Algoritmo evolutivo de muitos objetivos para predição ab initio de estrutura de proteínas / Multiobjective evolutionary algorithm with many tables to ab initio protein structure prediction

Brasil, Christiane Regina Soares 10 May 2012 (has links)
Este trabalho foca o desenvolvimento de algoritmos de otimização para o problema de PSP puramente ab initio. Algoritmos que melhor exploram o espaço de potencial de soluções podem, em geral, encontrar melhores soluções. Esses algoritmos podem beneficiar ambas abordagens de PSP, tanto o modelo ab initio quanto os baseados em conhecimento a priori. Pesquisadores tem mostrado que Algoritmos Evolutivos Multiobjetivo podem contribuir significativamente no contexto do problema de PSP puramente ab initio. Neste contexto, esta pesquisa investiga o Algoritmo Evolutivo Multiobjetivo baseado em Tabelas aplicado ao PSP puramente ab initio, que apresenta interessantes resultados para proteínas relativamente simples. Por exemplo, um desafio para o PSP puramente ab initio é a predição de estruturas com folhas-. Para trabalhar com tais proteínas, foi desenvolvido procedimentos computacionalmente eficientes para estimar energias de ligação de hidrogênio e solvatação. Em geral, estas não são consideradas no PSP por abordagens que combinam métodos de otimização e conhecimento a priori. Considerando somente van der Waals e eletrostática, as duas energias de interação que mais contribuem para a definição da estrutura de uma proteína, com as energias de ligação de hidrogênio e solvatação, o problema de PSP tem quatro objetivos. Problemas combinatórios (tais como o PSP), com mais de três objetivos, geralmente requerem métodos específicos capazes de lidar com muitos critérios. Para resolver essa limitação, este trabalho propõe um novo método para a otimização dos muitos objetivos, chamado Algoritmo Evolutivo Multiobjetivo com Muitas Tabelas (AEMMT). Esse método executa uma amostragem mais adequada do espaço de funções objetivo e, portanto, pode mapear melhor as regiões promissoras deste espaço. A capacidade de lidar com muitos objetivos capacita o AEMMT a utilizar melhor a informação oriunda das energias de solvatação e de ligação de hidrogênio, e então predizer estruturas com folhas- e algumas proteínas relativamente mais complexas. Do ponto de vista computacional, o AEMMT é um novo método que lida com muitos objetivos (mais de dez) encontrando soluções relevantes / This work focuses on the development of optimization algorithms for the purely ab initio Protein Structure Prediction (PSP) problem. Algorithms that better explore the space of potential solutions can in general find better solutions. Such algorithms can benefit both ab initio and template-based PSP, that uses priori knowledge. Researches have shown that Multiobjective evolutionary algorithms can contribute significantly in the context of purely ab initio PSP. In this context, this research investigates the Multiobjective Evolutionary Algorithm based on Tables applied to purely ab initio PSP, which has shown interesting results for relatively simple proteins. For example, one challenge for purely ab initio PSP is the prediction of structures with -sheets. To work with such proteins, this research has developed computationally efficient procedures to estimate hydrogen bond and solvation energies. In general, they are not considered by PSP approaches combining optimization methods with priori knowledge. Only by considering van der Waals and electrostatic, the two interaction energies that mostly contribute to defining a protein structure, and the hydrogen bond and solvation energies, the PSP problem has four objectives. Combinatorial problems (such as the PSP) with more than three objective usually require specific methods capable of dealing with many goals. To address this limitation, we propose a new method for many objective optimization, called Multiobjective Evolutionary Algorithm with Many Tables (MEAMT). This method performs a more adequate sampling of the space of objective functions and, therefore, can better map the promising regions of this space. The ability of dealing with many objectives enables the MEANT to better use information generated by solvation and hydrogen bond energies, and then predict structures with -sheets and some relatively complex proteins. From the computational point of view, the MEAMT is a new method for dealing with many objectives (more than ten) finding relevant solutions

Page generated in 0.0432 seconds