• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 580
  • 38
  • 15
  • 13
  • 13
  • 12
  • 8
  • 7
  • 6
  • 6
  • 6
  • 6
  • 4
  • 4
  • 1
  • Tagged with
  • 635
  • 635
  • 382
  • 350
  • 315
  • 128
  • 107
  • 83
  • 81
  • 68
  • 67
  • 61
  • 56
  • 55
  • 54
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

Tendência temporal e fatores determinantes da anemia em crianças menores de cinco anos no Estado de Pernambuco

Pedrosa Leal, Luciana 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T22:57:28Z (GMT). No. of bitstreams: 2 arquivo3061_1.pdf: 6013169 bytes, checksum: 8ee0d40a199c498b6a59422298dacea4 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / No Brasil, poucos estudos representativos permitem avaliar a tendência da anemia e de seus fatores de risco em crianças menores de cinco anos. Entre esses estudos se encontram as Pesquisas Estaduais de Saúde e Nutrição de Pernambuco. Nesse sentido, esta tese objetivou analisar a tendência da anemia e de seus fatores determinantes em crianças de 6-59 meses de idade no Estado de Pernambuco, com base nos inquéritos epidemiológicos dos anos de 1997 e 2006, que se caracterizam como estudos transversais e analíticos. A população se constituiu por crianças de 6-59 meses e a amostra foi de 777 e 1403 crianças nos inquéritos de 1997 e 2006, respectivamente. A análise multivariada foi realizada a partir de um modelo hierárquico, utilizando a regressão de Poisson com variância robusta. Como produtos desta tese foram desenvolvidos três artigos científicos, o primeiro, um artigo de revisão sistemática sobre os fatores determinantes da anemia e/ou deficiência de ferro em crianças; o segundo apresenta os fatores associados da anemia em crianças nas áreas urbana e rural do Estado de Pernambuco no ano de 2006 e o terceiro, baseando-se em um modelo conceitual, analisa a tendência da anemia e de seus fatores associados em crianças de Pernambuco, entre os inquéritos de 1997 e 2006. Na revisão sistemática os fatores mais citados foram: idade da criança, escolaridade materna, renda familiar, diarréia, área geográfica, índice de riqueza do domicílio, peso ao nascer, indicador altura/idade, indicador peso/altura, etnia, sexo, densidade de ferro e calorias provenientes do leite de vaca. Os resultados dos artigos originais evidenciaram uma redução de 19,3% (40,9% para 32,8%) na prevalência no estado e de 16,7% (37,8% para 31,5%) e 28,8% (51,4% para 36,6%) nas áreas urbana e rural, respectivamente. No inquérito do ano de 2006, para a área urbana as variáveis que determinaram significantemente a anemia foram: escolaridade materna, bens de consumo, número de crianças menores de cinco anos, tratamento da água de beber, idade e anemia materna e idade da criança. Na área rural apenas a idade materna e a idade da criança permaneceram como determinantes significantes da anemia. No Estado de Pernambuco, a idade da mãe abaixo de 20 anos e a idade da criança entre 6-23 meses foram os principais fatores associados à determinação da anemia no estado nos inquéritos de 1997 e de 2006. Além destas variáveis, a área rural, renda familiar menor que 2 salários mínimos, falta de tratamento da água de beber e a diarréia permaneceram no modelo final do inquérito do ano de 1997. Menores escores de condição de moradia e de posse de bens de consumo e a falta de tratamento da água de beber foram as variáveis que permaneceram no modelo do inquérito de 2006. No Estado de Pernambuco a prevalência de anemia apresentou uma tendência decrescente. Contudo, a anemia ainda se caracteriza como um grave problema de saúde pública. O estudo de seus determinantes aqui apresentado vem contribuir para o planejamento de estratégias efetivas para o seu controle
62

Tendência Temporal da Anemia em Pré-escolares de Creches do Recife-PE: 1999-2008

de Araújo Queiroz, Elânia 31 January 2012 (has links)
Made available in DSpace on 2014-06-12T23:04:33Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2012 / A anemia ferropriva representa a mais comum e mais grave deficiência de micronutrientes em todo o mundo. Essa deficiência nutricional acomete principalmente crianças jovens, mulheres em idade reprodutiva e gestantes. Esse estudo teve como objetivo verificar a tendência temporal da anemia em pré-escolares de creches públicas e privadas do Recife no período de 1999 a 2008. Foram realizados dois cortes transversais, seqüenciais, envolvendo amostras aleatórias de crianças menores de cinco anos, de ambos os sexos, nos quais foram avaliadas as concentrações de hemoglobina (Hb), variáveis antropométricas e demográficas. O tamanho da amostra para o ano de 1999 foi calculado utilizando-se uma estimativa de prevalência de anemia de 40%. Para o ano de 2008 partiu-se de uma estimativa de 50% de inadequação no consumo de alimentos ricos em ferro. Foram classificadas como anêmicas as crianças que apresentaram concentrações de hemoglobina abaixo de 11,0 g/dL, considerando-se a faixa etária do estudo. Foram estudadas 278 e 318 crianças para o ano de 1999 e 2008, respectivamente. A prevalência da anemia (Hb < 11,0 g/dL) em 2008 foi de 15,1% (IC 95% 11,3 19,5), menor do que a prevalência encontrada em 1999 [42,1% (IC 95% 36,2% - 48,1%)], observando-se uma redução relativa de 179 % no período estudado, com impacto significativo no grau de intensidade da anemia que passou de moderada (7,0 g/dL > Hb < 9,0 g/dL) a leve (9,0 g/dL > Hb < 11,0 g/dL). A redução da anemia não sofreu influência da distribuição por sexo (p = 0,43), nem do estado antropométrico (p = 0,74). No entanto crianças menores de 36 meses apresentaram redução mais acentuada na prevalência da anemia (p=0,00). A anemia nas creches do Recife apresentou tendência de forte declínio em termos de prevalência, grau de intensidade, sobretudo em crianças jovens no período e contexto estudados. Essa tendência de declínio observada vem confirmar o caráter de redução dessa carência nutricional que vem sendo descrito em outros espaços geográficos e em grupos populacionais similares. Esse comportamento de redução acentuada poderia ser atribuído às mudanças na estrutura econômica e social que o país tem vivenciado e, de forma mais específica, às estratégias de prevenção e controle desenhadas pelo Ministério da Saúde no combate à anemia carencial, a exemplo da fortificação obrigatória de farinhas de trigo e milho e o Programa Nacional de Suplementação de ferro
63

Previsão de séries temporais utilizando pools de preditores criados a partir do particionamento da série e da divisão da tarefa de previsão

VILA NOVA FILHO, Sérgio René Pessoa 28 August 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-04-22T19:11:22Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Sérgio René Pessoa Vila Nova Filho.pdf: 10289306 bytes, checksum: 7f8f4add31df1fd1cdafa9afd295d41d (MD5) / Made available in DSpace on 2016-04-22T19:11:22Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Sérgio René Pessoa Vila Nova Filho.pdf: 10289306 bytes, checksum: 7f8f4add31df1fd1cdafa9afd295d41d (MD5) Previous issue date: 2015-08-28 / A análise de séries temporais é uma importante área de estudo em diversos domínios. Grande parte das pesquisas em análise de séries temporais objetivam encontrar um modelo de previsão que utiliza dados passados da série para prever o seu valor no futuro, e então utiliza-o para a tomada de decisões. Algumas séries temporais apresentam padrões de comportamento que se repetem ao longo dela, tais padrões possuem tamanhos variados e podem ser utilizados para auxiliar a previsão. Esta dissertação propõe um sistema para previsão de séries temporais baseado em dois métodos principais: o primeiro consiste em particionar a série a fim de separar seus padrões de comportamento, o segundo divide a tarefa de previsão nas subtarefas de estimar o sentido da série no futuro e na de estimar o próximo valor a partir da previsão do sentido e do comportamento anterior da série. Para cada uma dessas divisões, é treinado um preditor especialista na tarefa de predição e no padrão de comportamento contido na partição. Para realizar um estudo comparativo, foram utilizadas quatro séries temporais, sendo duas financeiras e duas bastante utilizadas em estudos recentes. Quatro métricas foram usadas para avaliar o modelo proposto, e seus resultados foram comparados às performances dos modelos de Rede Neural Multilayer Perceptron (MLP) e Máquina de Vetor de Suporte para Regressão (SVR), além de modelos de estudos recentes. Também foram analisados os impactos da variação de cada parâmetro do sistema proposto com relação ao desempenho da previsão. O modelo proposto apresentou desempenho superior aos outros modelos avaliados, nas quatro séries. / Time series analysis is an important area of study in many expertise fields. Great part of the researches in time series analysis aims to find a prediction model, which analyzes the past data to predict the series future value, and then use it to make decisions. Some series exhibit behaviors patterns that repeat along it, such patterns have different sizes and could be used to help the forecast. This dissertation proposes a system to predict the future values of a time series, using two main methods: the first consist on partitioning the series, to segregate behaviour patterns, the second divides the prediction task in the subtasks of estimating the series future direction and the subtask of estimating the series future value from the direction forecast and the past values of the series. For each one of these divisions, a predictor is trained and becomes a specialist on the prediction subtask and in the behaviour pattern of the partition. To perform a comparative study, four time series were used, two are financial time series and two are used in many recent researches. Four performance metrics were used to evaluate, and the results were compared to the results of the Neural Network model (MLP) and the Support Vector Machine for Regression model (SVR), as well as other published studies models. The impacts of the variation of the models parameters on the prediction performance were analyzed as well. The proposed model presented better performance than the compared models on the four series evaluated.
64

Impondo mais restrições ao modelo de apreçamento vetorial com séries temporais

Moza, Luiz Gustavo Campos 27 April 2015 (has links)
Submitted by LUIZ GUSTAVO MOZA (gustavomoza@gmail.com) on 2015-05-29T15:36:44Z No. of bitstreams: 1 MCP_send.pdf: 680259 bytes, checksum: e66adf3e460a5e9ac1f5e329b620babc (MD5) / Approved for entry into archive by BRUNA BARROS (bruna.barros@fgv.br) on 2015-06-01T12:22:52Z (GMT) No. of bitstreams: 1 MCP_send.pdf: 680259 bytes, checksum: e66adf3e460a5e9ac1f5e329b620babc (MD5) / Approved for entry into archive by Marcia Bacha (marcia.bacha@fgv.br) on 2015-06-12T19:14:41Z (GMT) No. of bitstreams: 1 MCP_send.pdf: 680259 bytes, checksum: e66adf3e460a5e9ac1f5e329b620babc (MD5) / Made available in DSpace on 2015-06-12T19:14:55Z (GMT). No. of bitstreams: 1 MCP_send.pdf: 680259 bytes, checksum: e66adf3e460a5e9ac1f5e329b620babc (MD5) Previous issue date: 2015-04-27 / This work is dedicated to the empirical exercise of generating more restrictions on an asset pricing model with time series developed by Hansen and Singleton JPE 1983. The restrictions go from a simple qualitative increase in the studied assets to a proposed extension derived from a consistent estimator of the stochastic discount factor. Estimates found for the relative risk aversion of the representative agent are as expected, in most cases, reaching values already found in literature, besides the fact that these values are economically plausible. The theoretical extension proposal did not achieve the expected results beacause it seems to improve the systemic estimation marginally. / Este Trabalho se Dedica ao exercício empírico de gerar mais restrições ao modelo de apreçamento de ativos com séries temporais desenvolvido por Hansen e Singleton JPE 1983. As restrições vão, desde um simples aumento qualitativo nos ativos estudados até uma extensão teórica proposta a partir de um estimador consistente do fator estocástico de desconto. As estimativas encontradas para a aversão relativa ao risco do agente representativo estão dentro do esperado, na maioria dos casos, já que atingem valores já encontrados na literatura além do fato destes valores serem economicamente plausíveis. A extensão teórica proposta não atingiu resultados esperados, parecendo melhorar a estimação do sistema marginalmente.
65

Reconhecimento de padrões e tipificação de perfis de consumo: contribuições para a melhoria da gestão na distribuição de energia elétrica

Ferreira, Adonias Magdiel Silva 15 May 2015 (has links)
Submitted by LIVIA FREITAS (livia.freitas@ufba.br) on 2015-10-13T13:02:10Z No. of bitstreams: 1 Tese Adonias versão_final.pdf: 1744155 bytes, checksum: b438067f8dc9b59662b5d5bed7dbf459 (MD5) / Approved for entry into archive by LIVIA FREITAS (livia.freitas@ufba.br) on 2015-10-13T13:02:25Z (GMT) No. of bitstreams: 1 Tese Adonias versão_final.pdf: 1744155 bytes, checksum: b438067f8dc9b59662b5d5bed7dbf459 (MD5) / Made available in DSpace on 2015-10-13T13:02:25Z (GMT). No. of bitstreams: 1 Tese Adonias versão_final.pdf: 1744155 bytes, checksum: b438067f8dc9b59662b5d5bed7dbf459 (MD5) / Os consumidores residenciais apresentam uma diversidade de hábitos no uso da energia elétrica e um dos maiores desafios é o de prever a demanda a fim de equalizar a oferta com o consumo. Neste sentido, o desenvolvimento de métodos de agrupamento baseados no reconhecimento de padrões de consumo é de fundamental importância no gerenciamento da eficiência do setor elétrico. O objetivo deste trabalho é propor um método constituído de dois algoritmos: um aplicável a séries temporais univariadas e outro aplicável a séries temporais multivariadas, ambos desenvolvidos para o reconhecimento de padrões de séries temporais com o mesmo número de pontos amostrados e para o mesmo período de observação. Os dados estão relacionados aos programas de eficiência energética implementados por duas empresas distribuidoras de energia elétrica, e em ambos os casos, a substituição de refrigeradores se referiu às residências de consumidores de baixa renda das distribuidoras. Os dados foram coletados diretamente dos refrigeradores das unidades consumidoras antes (caso I) e depois (caso II) da substituição dos equipamentos. Refrigeradores novos foram doados às unidades consumidoras em substituição aos equipamentos antigos com menores recursos tecnológicos e prazos de vida útil esgotados. Dentre as opções indicadas pelo Protocolo Internacional para Medição e Verificação de Performance (PIMVP), este trabalho se enquadra na Opção B. A coleta de dados teve como alvo as medições das grandezas da potência elétrica e temperatura associadas aos refrigeradores, e respectivamente, os sistemas de medição SAGA 2000 e Termohigrômetro Extech RHT 10 foram utilizados nos períodos antes e após substituição. O algoritmo FCM (Fuzzy C-Means) foi utilizado como referência comparativa tanto para a versão univariada quanto para a versão multivariada, sendo que, para a versão multivariada, foi adotada uma versão modificada do FCM baseada em uma métrica de similaridade que utiliza componentes principais (Similarity Principal Componente Analysis – SPCA). Na versão univariada, antes das substituições (caso I), o método proposto e o FCM tiveram, respectivamente, um índice global de silhueta (medida da qualidade de agrupamento) de 0,28 e 0,25. Após as substituições (caso II) dos refrigeradores, ambos métodos reconheceram a existência de apenas um grupo e padrões semelhantes. Na versão multivariada, no caso I, o método proposto teve o índice global de silhueta de 0,19, e no caso II, o índice global de silhueta foi de 0,46. Os índices obtidos pelo método FCM no caso I e no caso II, respectivamente, foram de -0,12 e 0,21. O método proposto apresentou uma identificação de uma maior diversidade de padrões; o reconhecimento da sazonalidade através de uma abordagem multicritérios; o melhoramento da tomada de decisão através de uma melhor classificação dos perfis de consumidores heterogêneos; e a definição do número de clusters através de uma abordagem baseada em grupos semi-hierárquica, revelando-se assim como uma importante contribuição para o estado-da-arte. A partir dos desafios e resultados obtidos neste trabalho, são sugeridas possibilidades de trabalhos futuros que incorporem análises para a previsão de diferentes dinâmicas temporais, período de amostragem e incerteza de medição. / The Residential customers have a diversity of habits in the use of electric power and one of the biggest challenges is to forecast demand in order to equalize the supply to consumption. In this sense, the development of clustering methods based on the recognition of patterns of consumption is of fundamental importance in managing the electricity sector efficiency. The objective of this work is to propose a method consists of two algorithms: one applicable to univariate time series and another applicable to multivariate time series, both developed for the recognition of time series patterns with the same number of sample points for the same period observation. The data are related to energy efficiency programs implemented by two distributors of electricity, and in both cases, the replacement of refrigerators referred to the homes of low-income consumers of the distributors. Data were collected directly from the refrigerators of consumer units before (case I) and after (case II) of the equipment replacement. New refrigerators were donated to consumer units to replace old equipment with lower technological resources and exhausted useful lives. Among the options listed by the International Protocol for Performance Measurement and Verification (IPMVP), this work fits in option B. The data collection had how target the measurements of quantities of electric power and temperature associated with refrigerators, and respectively, the measurement systems SAGA 2000 and Thermohygrometer Extech RHT 10 were used in the periods before and after replacement. The FCM (Fuzzy C-Means) algorithm was used as a comparative reference for both version (univariate and multivariate), being that to the multivariate was used a modified version of the FCM, based on a similarity metric that uses principal component (Similarity Principal Component Analysis - SPCA). In the univariate version before the replacement (case I), the proposed method and FCM have, respectively, a global silhouette index (clustering quality measurement) of 0.28 and 0.25. After replacements of refrigerators (case II), both methods have recognized the existence of only one group and similar patterns. In the multivariate version, in the case I, the proposed method had the global silhouette index of 0.19, and in the case II, the global silhouette index was 0.46. The index obtained by the FCM method in case I and case II, respectively, were -0.12 and 0.21. The proposed method showed an identification of a greater diversity of patterns; recognition of the seasonality by a multi-criteria approach; improvement of decision-making, through better classification of heterogeneous consumer profiles; and the definition of the number of clusters through an approach based on semi-hierarchical cluster, revealing itself as an important contribution to the state of the art. From the challenges and results of this study, possibilities for future work incorporating analysis for predicting different temporal dynamics, sampling period and measurement uncertainty are suggested.
66

Modelos híbridos baseados em enxame de partículaspara previsão de séries temporais

PETRY, Gustavo Galvão 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:51:33Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / Este trabalho investiga a otimização de Redes Neurais Artificiais (RNA) por métodos baseados em Enxame de Partículas (PSO) para a resolução do problema de previsão de séries temporais. O PSO, apesar de ser uma técnica linear, quando hibridizado com uma técnica não linear, como as redes neurais artificiais, formam um sistema híbrido inteligente (SHI) com um poderoso mecanismo de busca global(exploração) e local (explotação) capaz de capturar as características não lineares presentes em problemas complexos do mundo real. O problema de previsão de séries temporais é abordado através de diferentes modelos de otimização por enxame de partículas, que visam a ajustar os parâmetros livres das RNAs, ora de forma isolada, ora em conjunto com algoritmos de aprendizagem comumente encontrados na literatura. Cada um dos sistemas híbridos inteligentes baseados em PSO age de forma distinta para modelar o fenômeno gerador da série, sendo seu desempenho testado de acordo com um conjunto de cinco métricas robustas para análise de comportamento dos modelos na previsão de séries temporais. Diversos experimentos foram realizados sobre um conjunto de cinco séries temporais de complexidades distintas, sendo duas naturais (série de Manchas Solares e Série de Medidas de Brilho de uma Estrela) e três econômico-financeiras (série das cotações das ações da Petrobras, Índice Dow Jones Industrial Average, e Índice Standard & Poor 500), e os resultados obtidos com os modelos fundamentados em PSO são analisados e comparados com outros métodos clássicos baseados em redes neurais artificiais isoladas e com redes neurais conjugadas com algoritmos genéticos. Os experimentos com modelos baseados em enxames de partículas obtiveram bom desempenho quando comparados com técnicas já consolidadas na literatura (RNA e AG+RNA), mostrando-se capazes de auxiliar de forma significativa na resolução do problema de previsão
67

Classicação de séries temporais utilizando diferentes representações de dados e ensembles / Time series classification using multiple representations and ensembles

Giusti, Rafael 23 August 2017 (has links)
Dados temporais são ubíquos em quase todas as áreas do conhecimento humano. A área de aprendizado de máquina tem contribuído para a mineração desse tipo de dados com algoritmos para classificação, agrupamento, detecção de anomalias ou exceções e detecção de padrões recorrentes, dentre outros. Tais algoritmos dependem, muitas vezes, de uma função capaz de expressar um conceito de similaridade entre os dados. Um dos mais importantes modelos de classificação, denominado 1-NN, utiliza uma função de distância para comparar uma série temporal de interesse a um conjunto de referência, atribuindo à primeira o rótulo da série de referência mais semelhante. Entretanto, existem situações nas quais os dados temporais são insuficientes para identificar vizinhos de acordo com o conceito associado às classes. Uma possível abordagem é transportar as séries para um domínio de representação no qual atributos mais relevantes para a classificação são mais claros. Por exemplo, uma série temporal pode ser decomposta em componentes periódicas de diferentes frequências e amplitudes. Para muitas aplicações, essas componentes são muito mais significativas na discriminação das classes do que a evolução da série ao longo do tempo. Nesta Tese, emprega-se diversidade de representações e de distâncias para a classificação de séries temporais. Com base na escolha de uma representação de dados adequada para expor as características discriminativas do domínio, pode-se obter classificadores mais fiéis ao conceitoalvo. Para esse fim, promove-se um estudo de domínios de representação de dados temporais, visando identificar como esses domínios podem estabelecer espaços alternativos de decisão. Diferentes modelos do classificador 1-NN são avaliados isoladamente e associados em ensembles de classificadores a fim de se obter classificadores mais robustos. Funções de distância e domínios alternativos de representação são também utilizados neste trabalho para produzir atributos não temporais, denominados atributos de distâncias. Esses atributos refletem conceitos de vizinhança aos exemplos do conjunto de treinamento e podem ser utilizados para treinar modelos de classificação que tipicamente não são eficazes quando treinados com as observações originais. Nesta Tese mostra-se que atributos de distância permitem obter resultados compatíveis com o estado-da-arte. / Temporal data are ubiquitous in nearly all areas of human knowledge. The research field known as machine learning has contributed to temporal data mining with algorithms for classification, clustering, anomaly or exception detection, and motif detection, among others. These algorithms oftentimes are reliant on a distance function that must be capable of expressing a similarity concept among the data. One of the most important classification models, the 1-NN, employs a distance function when comparing a time series of interest against a reference set, and assigns to the former the label of the most similar reference time series. There are, however, several domains in which the temporal data are insufficient to characterize neighbors according to the concepts associated to the classes. One possible approach to this problem is to transform the time series into a representation domain in which the meaningful attributes for the classifier are more clearly expressed. For instance, a time series may be decomposed into periodic components of different frequency and amplitude values. For several applications, those components are much more meaningful in discriminating the classes than the temporal evolution of the original observations. In this work, we employ diversity of representation and distance functions for the classification of time series. By choosing a data representation that is more suitable to express the discriminating characteristics of the domain, we are able to achieve classification that are more faithful to the target-concept. With this goal in mind, we promote a study of time series representation domains, and we evaluate how such domains can provide alternative decision spaces. Different models of the 1-NN classifier are evaluated both isolated and associated in classification ensembles in order to construct more robust classifiers. We also use distance functions and alternative representation domains in order to extract nontemporal attributes, known as distance features. Distance features reflect neighborhood concepts of the instances to the training samples, and they may be used to induce classification models which are typically not as efficient when trained with the original time series observations. We show that distance features allow for classification results compatible with the state-of-the-art.
68

Classicação de séries temporais utilizando diferentes representações de dados e ensembles / Time series classification using multiple representations and ensembles

Rafael Giusti 23 August 2017 (has links)
Dados temporais são ubíquos em quase todas as áreas do conhecimento humano. A área de aprendizado de máquina tem contribuído para a mineração desse tipo de dados com algoritmos para classificação, agrupamento, detecção de anomalias ou exceções e detecção de padrões recorrentes, dentre outros. Tais algoritmos dependem, muitas vezes, de uma função capaz de expressar um conceito de similaridade entre os dados. Um dos mais importantes modelos de classificação, denominado 1-NN, utiliza uma função de distância para comparar uma série temporal de interesse a um conjunto de referência, atribuindo à primeira o rótulo da série de referência mais semelhante. Entretanto, existem situações nas quais os dados temporais são insuficientes para identificar vizinhos de acordo com o conceito associado às classes. Uma possível abordagem é transportar as séries para um domínio de representação no qual atributos mais relevantes para a classificação são mais claros. Por exemplo, uma série temporal pode ser decomposta em componentes periódicas de diferentes frequências e amplitudes. Para muitas aplicações, essas componentes são muito mais significativas na discriminação das classes do que a evolução da série ao longo do tempo. Nesta Tese, emprega-se diversidade de representações e de distâncias para a classificação de séries temporais. Com base na escolha de uma representação de dados adequada para expor as características discriminativas do domínio, pode-se obter classificadores mais fiéis ao conceitoalvo. Para esse fim, promove-se um estudo de domínios de representação de dados temporais, visando identificar como esses domínios podem estabelecer espaços alternativos de decisão. Diferentes modelos do classificador 1-NN são avaliados isoladamente e associados em ensembles de classificadores a fim de se obter classificadores mais robustos. Funções de distância e domínios alternativos de representação são também utilizados neste trabalho para produzir atributos não temporais, denominados atributos de distâncias. Esses atributos refletem conceitos de vizinhança aos exemplos do conjunto de treinamento e podem ser utilizados para treinar modelos de classificação que tipicamente não são eficazes quando treinados com as observações originais. Nesta Tese mostra-se que atributos de distância permitem obter resultados compatíveis com o estado-da-arte. / Temporal data are ubiquitous in nearly all areas of human knowledge. The research field known as machine learning has contributed to temporal data mining with algorithms for classification, clustering, anomaly or exception detection, and motif detection, among others. These algorithms oftentimes are reliant on a distance function that must be capable of expressing a similarity concept among the data. One of the most important classification models, the 1-NN, employs a distance function when comparing a time series of interest against a reference set, and assigns to the former the label of the most similar reference time series. There are, however, several domains in which the temporal data are insufficient to characterize neighbors according to the concepts associated to the classes. One possible approach to this problem is to transform the time series into a representation domain in which the meaningful attributes for the classifier are more clearly expressed. For instance, a time series may be decomposed into periodic components of different frequency and amplitude values. For several applications, those components are much more meaningful in discriminating the classes than the temporal evolution of the original observations. In this work, we employ diversity of representation and distance functions for the classification of time series. By choosing a data representation that is more suitable to express the discriminating characteristics of the domain, we are able to achieve classification that are more faithful to the target-concept. With this goal in mind, we promote a study of time series representation domains, and we evaluate how such domains can provide alternative decision spaces. Different models of the 1-NN classifier are evaluated both isolated and associated in classification ensembles in order to construct more robust classifiers. We also use distance functions and alternative representation domains in order to extract nontemporal attributes, known as distance features. Distance features reflect neighborhood concepts of the instances to the training samples, and they may be used to induce classification models which are typically not as efficient when trained with the original time series observations. We show that distance features allow for classification results compatible with the state-of-the-art.
69

Predição do número mensal de casos de dengue por modelos de séries temporais / Forecasting of the monthly number of dengue cases by a time series model.

Lizzi, Elisangela Aparecida da Silva 22 June 2012 (has links)
Introdução: A dengue é uma doença infecciosa causada por um arbovírus relatada em regiões tropicais e subtropicais. Os maiores números de casos costumam ocorrer nos períodos quentes e chuvosos do ano, que favorecem as condições para o desenvolvimento do vetor da doença, o mosquito Aedes aegypti. Modelos estatísticos podem ser úteis para a compreensão das variações mensais dos números de casos registrados da doença e podem trazer razoáveis predições dos números mensais de casos em um período subsequente a uma série temporal estudada. Métodos: Esta dissertação trata de um estudo ecológico com componente de série temporal. Foram usados registros mensais de casos confirmados de dengue, entre os anos de 1998 a 2008, obtidos do Sistema de Informação de Agravos de Notificação (SINAN), de dois municípios do interior paulista (Ribeirão Preto e Campinas). Modelos estatísticos de séries temporais foram utilizados para descrever o comportamento das séries de dados e predizer o número esperado de casos da doença em um período subsequente. Utilizou-se modelos de Box & Jenkins, ou seja, o modelo SARIMA (Seasonal Autoregressive Integrated Moving Average) com extensões (modelo SARIMAX) que permitem incorporar covariáveis como as temperaturas máxima, média e mínima e a precipitação média a cada mês. Utilizou-se o critério de Akaike (AIC) para a comparação entre diferentes especificações dos modelos. A partir dos modelos ajustados aos dados, foram obtidas predições mensais para o ano de 2009, sendo estas comparadas com os valores observados. Resultados: Sem considerar a inclusão de covariáveis, o melhor modelo para os dados de Campinas foi o SARIMA(2,1,2)(1,1,1)12 , e para os dados de Ribeirão Preto o melhor foi o SARIMA(2,1,3)(1,1,1)12 (modelos com menores valores de AIC). Ao incorporar nos modelos as variáveis climáticas, observou-se um melhor ajuste para o município de Campinas, o modelo SARIMAX(1,1,1)(1,1,1)12 que inclui a precipitação observada nos 2 meses antecedentes às ocorrências mensais de casos de dengue e a temperatura mínima registrada nos 3 meses antecedentes. No município de Ribeirão Preto, o modelo que mostrou-se mais adequado aos dados foi o SARIMAX(1,1,1)(0,1,1)12 que inclui precipitação observada nos 3 meses antecedentes às ocorrências mensais de casos de dengue e a temperatura mínima registrada em um mês anterior. As predições mensais obtidas para o ano de 2009 mostraram-se razoavelmente próximas àquelas observadas, em ambos municípios. Conclusões: Os resultados do presente estudo, em adição a resultados da literatura, evidenciam que os números de componentes autorregressivos e de média móvel adequados ao ajustes de modelos SARIMA variam de uma população a outra, sugerindo diferentes padrões temporais da doença de acordo com características locais. Comparações entre valores preditos e observados sugerem que os modelos SARIMA são ferramentas úteis para predição do número de casos de dengue. Sugere-se que os modelos utilizados nesta dissertação sejam utilizados por serviços municipais de saúde para a vigilância da doença, o que pode trazer benefícios em programas de prevenção e planejamentos de serviços públicos. / Introduction: Dengue is an infection disease which is caused by an arbovirus related to tropical and subtropical region. Most cases usually occur on warm and rainy weathers of the years that facilitate the conditions of the development vector of the disease, the Aedes Aegypti mosquito. Statistical models can be very useful to comprehend the monthly variations of the number of registered cases of the disease, and they might bring reasonable predictions to the monthly number of cases in a subsequent period to a studied time series. Metodology: This dissertation is about ecologic study with a time series component. It was used monthly registry of confirmed dengue cases, between 1998 and 2008 years, obtained by the Information Center of Notification Diseases (ICND), out of two cities in the state of São Paulo (Campinas and Ribeirão Preto). Statistic time series models were used to describe the data series behavior and to predict the average number of disease cases in the subsequent period. We used the Box & Jenkins model, that in, the SARIMA (Seasonal Autoregressive Integrated Moving Average) model, with extensions (SARIMAX model) that allow to incorporate co-variables to the maximum, mean and minimum temperatures and the average monthly precipitation. We used the Akaike criterio (AIC) for comparison between different model specifications. From the fit data models, we obtained monthly predictions to the 2009 year, being compared to the observed data. Results: Without considerating the inclusion of the covariables, the best model for Campinas data was the SARIMA(2,1,2)(1,1,1)12, and for Ribeirão Preto data the best was SARIMA(2,1,3)(1,1,1)12 (smaller AIC values models). As we incorporate the climate variables in the models, we observe that the best fit for Campinas city was the SARIMAX(1,1,1)1,1,1)12 that includes the observed precipitation in 2 months before the monthly dengue cases and the minimum registered temperature in 3 months before. In Ribeirão Preto city, the most adequate model was the SARIMAX(1,1,1)(0,1,1)12 that includes the observed precipitation in 3 months before the monthly dengue case occurrence and the minimum temperature in one month before. The monthly prediction obtained for 2009 year show reasonably close to the observed, in both cities. Conclusion: The results of this study, in addition to the literature results, show that the adequate number of autoregressive and moving average components fitted in SARIMA models, vary between one population and other, suggesting different disease time patterns according to local characteristics. Comparing predict and observed values suggest that the SARIMA models are useful tools to predict the number of dengue cases. We suggest that the models in this dissertation be used in city health services to surveillance the disease, which may bring benefits for prevention programs and public service planning.
70

Séries temporais e estudos sobre comportamento de pavimentos / Contribution to pavement performance modelling

Pontes Filho, Glauco 03 May 1999 (has links)
Esse trabalho relata e discute resultados obtidos em uma tentativa para mostrar que séries temporais podem ser úteis e eficientes para identificar informações sobre características de comportamento de pavimento ao longo do tempo em que é submetido às solicitações de cargas provenientes de tráfego de eixos de veículos. Os dados e informações utilizadas foram obtidas por observações sobre o comportamento de um trecho experimental de via que liga o trevo de Assaí a Pau D\'Alho, no nordeste do estado do Paraná. Os dados foram manuseados em computador através do método para busca de funções para estimativa de valores de elementos de séries temporais \"Autoregressive lntegrated Moving Average\" para obter informações sobre o comportamento de índice para expressar o \"estado de pavimento\". / The results obtained on trying to show that time series should be useful and efficient in identifying information on the behavior of pavements submitted to vehicle axle load traffic were reported and discussed. The data and inputs used were obtained from observing the experimental road segment Assai to Pau D\'Alho in Northeast of Parana State (Brazil). The data were processed in computers using the \"Autoregressive lntegrated Moving Average\" method to search for estimating values functions for components of time series and obtain information on a pavement performance index.

Page generated in 0.073 seconds