Spelling suggestions: "subject:"faltantes"" "subject:"saltantes""
11 |
Imputa??o de dados em experimentos fatoriais 2?Oliveira, Jord?nia Furtado de 27 April 2017 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-09-05T19:22:20Z
No. of bitstreams: 1
JordaniaFurtadoDeOliveira_DISSERT.pdf: 977757 bytes, checksum: 1ee1444f855c47f4b9e1c80e2d6d0012 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-09-13T21:19:07Z (GMT) No. of bitstreams: 1
JordaniaFurtadoDeOliveira_DISSERT.pdf: 977757 bytes, checksum: 1ee1444f855c47f4b9e1c80e2d6d0012 (MD5) / Made available in DSpace on 2017-09-13T21:19:07Z (GMT). No. of bitstreams: 1
JordaniaFurtadoDeOliveira_DISSERT.pdf: 977757 bytes, checksum: 1ee1444f855c47f4b9e1c80e2d6d0012 (MD5)
Previous issue date: 2017-04-27 / Experimentos fatoriais completos e fracionados com dois n?veis s?o muito usados
em diversas ?reas do conhecimento e, especialmente na ind?stria. Para analisar tais
experimentos ? necess?rio que todas as combina??es planejadas de tratamentos sejam
executadas e as respostas sejam obtidas. No entanto, na pr?tica, muitos experimentos
deixam de ser completados devido a problemas de log?stica, tempo, ou limita??es
do or?amento. Esses experimentos s?o chamados de incompletos. Com o intuito de
analisar adequadamente tais experimentos, diferentes m?todos s?o propostos na literatura.
Este trabalho tem o objetivo de apresentar, comparar e fazer reflex?es cr?ticas
de m?todos para estimar dados perdidos em experimentos fatoriais com dois n?veis. / Two-level full and fractional factorial designs are widely used in various fields,
especially in industry. To analyze such experiments it is necessary that all planned
treatment combinations are performed and the responses are obtained. However, in
practice, many experiments fail to be completed due to logistical problems, time or
budget constraints. These experiments are called incomplete. To properly analyze
such experiments, diferent methods are proposed in the literature. This study aims to
present, compare and make critical re
ections about methods for estimating missing
data in two-level factorial experiments.
|
12 |
Distance estimation for mixed continuous and categorical data with missing valuesAzevedo, Glauco Gomes de 04 June 2018 (has links)
Submitted by Glauco Gomes de Azevedo (glaucogazevedo@gmail.com) on 2018-08-28T20:54:50Z
No. of bitstreams: 1
dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2018-09-10T19:38:08Z (GMT) No. of bitstreams: 1
dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5) / Made available in DSpace on 2018-09-12T17:39:51Z (GMT). No. of bitstreams: 1
dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5)
Previous issue date: 2018-06-04 / Neste trabalho é proposta uma metodologia para estimar distâncias entre pontos de dados mistos, contínuos e categóricos, contendo dados faltantes. Estimação de distâncias é a base para muitos métodos de regressão/classificação, tais como vizinhos mais próximos e análise de discriminantes, e para técnicas de clusterização como k-means e k-medoids. Métodos clássicos para manipulação de dados faltantes se baseiam em imputação pela média, o que pode subestimar a variância, ou em métodos baseados em regressão. Infelizmente, quando a meta é a estimar a distância entre observações, a imputação de dados pode performar de modo ineficiente e enviesar os resultados na direção do modelo. Na proposta desse trabalho, estima-se a distância dos pares diretamente, tratando os dados faltantes como aleatórios. A distribuição conjunta dos dados é aproximada utilizando um modelo de mistura multivariado para dados mistos, contínuos e categóricos. Apresentamentos um algoritmo do tipo EM para estimar a mistura e uma metodologia geral para estimar a distância entre observações. Simulações mostram que um método proposto performa tanto dados simulados, como reais. / In this work we propose a methodology to estimate the pairwise distance between mixed continuous and categorical data with missing values. Distance estimation is the base for many regression/classification methods, such as nearest neighbors and discriminant analysis, and for clustering techniques such as k-means and k-medoids. Classical methods for handling missing data rely on mean imputation, that could underestimate the variance, or regression-based imputation methods. Unfortunately, when the goal is to estimate the distance between observations, data imputation may perform badly and bias the results toward the data imputation model. In this work we estimate the pairwise distances directly, treating the missing data as random. The joint distribution of the data is approximated using a multivariate mixture model for mixed continuous and categorical data. We present an EM-type algorithm for estimating the mixture and a general methodology for estimating the distance between observations. Simulation shows that the proposed method performs well in both simulated and real data.
|
13 |
Propuesta para reducir el plazo de entrega de vehículos nuevos en una empresa del sector automotrizCanales Medina, Valeria Milagros, Dolorier Montani, Zenón Max January 2015 (has links)
Es una empresa con más de 12 años de experiencia en el mercado automotriz, dedicada a la comercialización de autos, camiones y buses y a brindar servicio de Post Venta, fundada en Chile en 1986 para representar la distribución de vehículos Hyundai, inicio operaciones en Perú el 02 de mayo del 2003, consiguiendo una gran participación de Hyundai en el mercado peruano, es actualmente la segunda marca más vendida del Perú, según informe de ARAPER a Noviembre de 2013.
En Perú las oficinas principales se encuentran en Lima, contamos con 8 sucursales en Lima y 2 en provincias, Trujillo y Piura, combinando estrategias con nuestra Red de Concesionarios a nivel nacional para alcanzar cubrir las expectativas de nuestros clientes.
La participación de Hyundai en el mercado sigue creciendo cada año, sus diferentes modelos responden a diferentes exigencias cumpliendo con las variables que el parque automotor requiere: confort, calidad y precio.
La sólida red de concesionarios a nivel nacional, la presencia de la marca en el Perú por más de 12 años y la garantía de 3 años o 100 mil Km (vehículos pasajeros), son actores muy importantes para asegurar la inversión de sus clientes y el respaldo de la marca.
Actualmente la empresa presenta problemas de demoras en los plazos de entregas que trae como consecuencia sanciones por incumplimiento, problemas de espacio, elevados costo de almacenaje, mal pronóstico de la demanda, restricciones en el sistema, errores de inventario, y principalmente insatisfacción al cliente.
Mediante un análisis de la situación y los procesos nos permitió realizar investigaciones para la realización del proyecto, los cuales nos permitieron identificar algunas causas de las cuales son: Gestión de placas únicas de rodaje demasiados largos establecidos por la Asociación Automotriz del Perú aprox. 15 días calendario como mínimo y en la mala operación en el traslado y almacenaje de los automóviles, viendo reflejado también en los altos costos logísticos en la que incurre la empresa.
En la presente investigación se pretende identificar los problemas relevantes y mediante propuestas encontrar una solución con el fin de disminuir el plazo de entrega de los automóviles nuevos.
It is a company with over 12 years experience in the automotive market, dedicated to the marketing of cars, trucks and buses and providing after sales service, founded in Chile in 1986 to represent the distribution of Hyundai vehicles, began operations in Peru May 2, 2003, achieving a great participation of Hyundai in the Peruvian market, is currently the second best-selling brand of Peru, according to a November report Araper 2013.
In Peru's main offices are in Lima, we have 8 branches in Lima and 2 in provinces, Trujillo and Piura, combining strategies with our dealer network nationwide to achieve meet the expectations of our customers.
Hyundai's participation in the market continues to grow every year, different models respond to different requirements in compliance with the fleet variables required: comfort, quality and price.
The strong network of dealers nationwide, the brand presence in Peru for over 12 years and 3 year warranty or 100,000 kilometers (passenger vehicles) are very important players to ensure customer investment and support the brand.
Currently the company has problems of delays in delivery times which results in sanctions for non-space problems, high storage costs, poor demand forecasting, restrictions on the system, inventory errors, and especially customer dissatisfaction.
Through an analysis of the situation and processes allowed us to conduct research for the project, which allowed us to identify some causes of which are: Management of unique shooting too long established by the Automotive Association of Peru plates approx. At least 15 calendar days and in bad operation in the transfer and storage of cars, watching also reflected in the high logistics costs incurred by the company.
In this research it is to identify relevant problems and find a solution through proposals in order to reduce the delivery of new cars.
|
14 |
Techniques for indexing large and complex datasets with missing attribute values. / Técnicas de indexação de grandes conjuntos de dados complexos com valores de atributos faltantes.Brinis, Safia 18 July 2016 (has links)
Due to the increasing amount and complexity of data processed in real world applications, similarity search became a vital task to store and retrieve such data. However, missing attribute values are very frequent and metric access methods (MAMs), designed to support similarity search, do not operate on datasets when attribute values are missing. Currently, the approach to use the existing indexing techniques on datasets with missing attribute values just use an indicator to identify the missing values and employ a traditional indexing technique. Although, this approach can be applied over multidimensional indexing techniques, it is impractical for metric access methods. This dissertation presents the results of a research conducted to identify and deal with the issues related to indexing and querying datasets with missing values in metric spaces. An empirical analysis of the metric access methods when applied on incomplete datasets leads us to identify two main issues: distortion of the internal structure of the index when data are missing at random and skew of the index structure when data are not missing at random. Based on those findings, a new variant of the Slim-tree access method, called Hollow-tree, is presented. It employs new techniques that are capable to handle missing data issues when missingness is ignorable. The first technique includes a set of indexing policies that allow to index objects with missing attribute values and prevent distortions to occur in the internal structure of the indexes. The second technique targets the similarity queries to improve the query performance over incomplete datasets. This technique employs the fractal dimension of the dataset and the local density around the query object to estimate an ideal radius able to achieve an accurate query answer, considering data with missing values as a potential response. Results from experiments with a variety of real and synthetic datasets show that Hollow-tree achieves nearly 100% of precision and recall for Range queries and more than 90% for k Nearest Neighbor queries, while Slim-tree access method deteriorates with the increasing amount of missing values. The results confirm that the indexing technique helps to establish consistency in the index structure and the searching technique achieves a remarkable performance. When combined, the new techniques allow to explore properly all the available data even with high amounts of missing attribute values. As they are independent of the underlying access method, they can be adopted by a broad range of metric access methods, allowing to extend the class of MAMs. / O crescimento em quantidade e complexidade dos dados processados e armazenados torna a busca por similaridade uma tarefa fundamental para tratar esses dados. No entanto, atributos faltantes ocorrem freqüentemente, inviabilizando os métodos de acesso métricos (MAMs) projetados para apoiar a busca por similaridade. Assim, técnicas de tratamento de dados faltantes precisam ser desenvolvidas. A abordagem mais comum para executar as técnicas de indexação existentes sobre conjuntos de dados com valores faltantes é usar um indicador de valores faltantes e usar as técnicas de indexação tradicionais. Embora, esta técnica seja útil para os métodos de indexação multidimensionais, é impraticável para os métodos de acesso métricos. Esta dissertação apresenta os resultados da pesquisa realizada para identificar e lidar com os problemas de indexação e recuperação de dados em espaços métricos com valores faltantes. Uma análise experimental dos MAMs aplicados a conjuntos de dados incompletos identificou dois problemas principais: distorção na estrutura interna do índice quando a falta é aleatória e busca tendenciosa na estrutura do índice quando o processo de falta não é aleatório. Uma variante do MAM Slim-tree, chamada Hollow-tree foi proposta com base nestes resultados. A Hollow-tree usa novas técnicas de indexação e de recuperação de dados com valores faltantes quando o processo de falta é aleatório. A técnica de indexação inclui um conjunto de políticas de indexação que visam a evitar distorções na estrutura interna dos índices. A técnica de recuperação de dados melhora o desempenho das consultas por similaridade sobre bases de dados incompletas. Essas técnicas utilizam o conceito de dimensão fractal do conjunto de dados e a densidade local da região de busca para estimar um raio de busca ideal para obter uma resposta mais correta, considerando os dados com valores faltantes como uma resposta potencial. As técnicas propostas foram avaliadas sobre diversos conjuntos de dados reais e sintéticos. Os resultados mostram que a Hollow-tree atinge quase 100% de precisão e revocação para consultas por abrangência e mais de 90% para k vizinhos mais próximos, enquanto a Slim-tree rapidamente deteriora com o aumento da quantidade de valores faltantes. Tais resultados indicam que a técnica de indexação proposta ajuda a estabelecer a consistência na estrutura do índice e a técnica de busca pode ser realizada com um desempenho notável. As técnicas propostas são independentes do MAM básico usado e podem ser aplicadas em uma grande variedade deles, permitindo estender a classe dos MAMs em geral para tratar dados faltantes.
|
15 |
INFLUÊNCIA DAS MUDANÇAS CLIMÁTICAS NA PRODUTIVIDADE DE GRÃOSMerelles, Leonardo Rodrigues de Oliveira 27 March 2018 (has links)
Submitted by admin tede (tede@pucgoias.edu.br) on 2018-05-28T19:09:38Z
No. of bitstreams: 1
LEONARDO RODRIGUES DE OLIVEIRA MERELLES.pdf: 1239497 bytes, checksum: cf674b2af1fe982136ca8ff2e1740f37 (MD5) / Made available in DSpace on 2018-05-28T19:09:38Z (GMT). No. of bitstreams: 1
LEONARDO RODRIGUES DE OLIVEIRA MERELLES.pdf: 1239497 bytes, checksum: cf674b2af1fe982136ca8ff2e1740f37 (MD5)
Previous issue date: 2018-03-27 / Understanding how climate change influences crop yield contributes to the forecasting
of its consequences and assists in the management of agribusiness and food security. In
this study, partial least squares regression (PLSR) was used to quantify the contribution
of climate change to soybean and corn yield. To verify the accuracy of the model, the
time series regression was applied. The Central-West and South regions of Brazil were
considered for the modeling of grain yield using precipitation, temperature, humidity,
evapotranspiration and carbon dioxide levels between 1980 and 2016 as predictors. In
both regions, the main contributor to increased grain yield was the increase in carbon
dioxide levels, and the main contributor to the reduction of productivity was air humidity,
suggesting that climate change is influencing grain yield. The results confirm climate
change, indicating that farmers and decision makers should work on other variables that
control productivity, such as genetic improvement and agricultural management practices. / Compreender como as mudanças climáticas influenciam na produtividade agrícola contribui
com a previsibilidade de suas consequências e auxilia na gestão do agronegócio e
da segurança alimentar. Neste estudo, foi utilizada a regressão por mínimos quadrados
parciais (PLSR) para quantificar as contribuições das mudanças climáticas na produtividade
da soja e do milho. Para verificar a qualidade de ajuste do modelo foi aplicada a
regressão de séries temporais. As regiões Centro-Oeste e Sul do Brasil foram consideradas
para a condução da modelagem da produtividade de grãos, utilizando como variáveis
preditoras a precipitação, temperatura, umidade, evapotranspiração e os níveis de dióxido
de carbono, entre os anos de 1980 a 2016. Nas duas regiões, o principal contribuinte para o
incremento da produtividade de grãos foi o aumento nos níveis de dióxido de carbono e
o principal contribuinte para a redução da produtividade foi a umidade do ar, sugerindo
que as mudanças climáticas estão influenciando na produtividade de grãos. Os resultados
confirmam as mudanças climáticas, indicando que agricultores e tomadores de decisões
deverão atuar em outras variáveis que controlam a produtividade, como melhoramento
genético e práticas de gestão agrícola.
|
16 |
Boclusterização na análise de dados incertos / Biclustering on uncertais data analysisFrança, Fabricio Olivetti de 17 August 2018 (has links)
Orientador: Fernando Jose Von Zuben / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-17T09:17:50Z (GMT). No. of bitstreams: 1
Franca_FabricioOlivettide_D.pdf: 3983253 bytes, checksum: 6b0d30018574ad5a6e0cce05c34606b8 (MD5)
Previous issue date: 2010 / Resumo: O processo de aquisição de dados está sujeito a muitas fontes de incerteza e inconsistência. Essas incertezas podem fazer com que os dados se tornem ruidosos ou impedir a aquisição dos mesmos, gerando o problema de dados faltantes. A maioria das ferramentas utilizadas para tratar tais problemas age de forma global em relação às informações da base de dados e ignora o efeito que o ruído pode ter na análise desses. Esta tese tem como objetivo explorar as propriedades do processo de biclusterização, que faz uma análise local dos dados, criando múltiplos modelos de imputação de dados que buscam minimizar o erro de predição dos valores faltantes na base de dados. Primeiramente, é proposto um novo algoritmo de biclusterização com um melhor desempenho que outras abordagens utilizadas atualmente, enfatizando a capacidade dos biclusters em gerar modelos com ruído reduzido. Em seguida, é proposta uma formulação de otimização quadrática para, utilizando os modelos locais gerados pelo bicluster, imputar os valores faltantes na base de dados. Os resultados obtidos indicam que a utilização da biclusterização ajuda a reduzir o erro de predição da imputação, além de fornecer condições favoráveis a uma análise a posteriori das informações contidas nos dados / Abstract: The data acquisition process is subject to many inconsistencies and uncertainties. These uncertainties may produce noisy data or even provoke the absence of some of them, thus leading to the missing data problem. Most procedures used to deal with such problem act in a global manner, relatively to the dataset, and ignore the noise e_ect on such analysis. The objective of this thesis is to explore the properties of the so called biclustering method, which performs a local data analysis, creating several imputation models for the dataset in order to minimize the prediction error estimating missing values of the dataset. First, it is proposed a new biclustering algorithm with a better performance than the one produced by other traditional approaches, with emphasis on the noise reduction capability of the models generated by the biclusters. Next, it is proposed the formulation of a quadratic optimization problem to impute the missing data by means of the local models engendered by a set of biclusters. The obtained results show that the use of biclustering helps to reduce the prediction error of data imputation, besides providing some interesting conditions for an a posteriori analysis of the dataset / Doutorado / Engenharia de Computação / Doutor em Engenharia Elétrica
|
17 |
Tratamento de dados faltantes empregando biclusterização com imputação múltipla / Treatment of missing data using biclustering with multiple imputationVeroneze, Rosana, 1982- 18 August 2018 (has links)
Orientadores: Fernando José Von Zuben, Fabrício Olivetti de França. / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-18T15:42:38Z (GMT). No. of bitstreams: 1
Veroneze_Rosana_M.pdf: 1996086 bytes, checksum: d4be557c3ffb4512e37232c537c78721 (MD5)
Previous issue date: 2011 / Resumo: As respostas fornecidas por sistemas de recomendação podem ser interpretadas como dados faltantes a serem imputados a partir do conhecimento dos dados presentes e de sua relação com os dados faltantes. Existem variadas técnicas de imputação de dados faltantes, sendo que o emprego de imputação múltipla será considerado neste trabalho. Também existem propostas alternativas para se chegar à imputação múltipla, sendo que se propõe aqui a biclusterização como uma estratégia eficaz, flexível e com desempenho promissor. Para tanto, primeiramente é realizada a análise de sensibilidade paramétrica do algoritmo SwarmBcluster, recentemente proposto para a tarefa de biclusterização e já adaptado, na literatura, para a realização de imputação única. Essa análise mostrou que a escolha correta dos parâmetros pode melhorar o desempenho do algoritmo. Em seguida, o SwarmBcluster é estendido para a implementação de imputação múltipla, sendo comparado com o bem-conhecido algoritmo NORM. A qualidade dos resultados obtidos é mensurada através de métricas diversas, as quais mostram que a biclusterização conduz a imputações múltiplas de melhor qualidade na maioria dos experimentos / Abstract: The answers provided by recommender systems can be interpreted as missing data to be imputed considering the knowledge associated with the available data and the relation between the available and the missing data. There is a wide range of techniques for data imputation, and this work is concerned with multiple imputation. Alternative approaches for multiple imputation have already been proposed, and this work takes biclustering as an effective, flexible and promising strategy. To this end, firstly it is performed a parameter sensitivity analysis of the SwarmBcluster algorithm, recently proposed to implement biclustering and already adapted, in the literature, to accomplish single imputation of missing data. This analysis has indicated that a proper choice of parameters may significantly improve the performance of the algorithm. Secondly, SwarmBcluster was extended to implement multiple imputation, being compared with the well-known NORM algorithm. The quality of the obtained results is computed considering diverse metrics, which reveal that biclustering guides to imputations of better quality in the majority of the experiments / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica
|
18 |
Techniques for indexing large and complex datasets with missing attribute values. / Técnicas de indexação de grandes conjuntos de dados complexos com valores de atributos faltantes.Safia Brinis 18 July 2016 (has links)
Due to the increasing amount and complexity of data processed in real world applications, similarity search became a vital task to store and retrieve such data. However, missing attribute values are very frequent and metric access methods (MAMs), designed to support similarity search, do not operate on datasets when attribute values are missing. Currently, the approach to use the existing indexing techniques on datasets with missing attribute values just use an indicator to identify the missing values and employ a traditional indexing technique. Although, this approach can be applied over multidimensional indexing techniques, it is impractical for metric access methods. This dissertation presents the results of a research conducted to identify and deal with the issues related to indexing and querying datasets with missing values in metric spaces. An empirical analysis of the metric access methods when applied on incomplete datasets leads us to identify two main issues: distortion of the internal structure of the index when data are missing at random and skew of the index structure when data are not missing at random. Based on those findings, a new variant of the Slim-tree access method, called Hollow-tree, is presented. It employs new techniques that are capable to handle missing data issues when missingness is ignorable. The first technique includes a set of indexing policies that allow to index objects with missing attribute values and prevent distortions to occur in the internal structure of the indexes. The second technique targets the similarity queries to improve the query performance over incomplete datasets. This technique employs the fractal dimension of the dataset and the local density around the query object to estimate an ideal radius able to achieve an accurate query answer, considering data with missing values as a potential response. Results from experiments with a variety of real and synthetic datasets show that Hollow-tree achieves nearly 100% of precision and recall for Range queries and more than 90% for k Nearest Neighbor queries, while Slim-tree access method deteriorates with the increasing amount of missing values. The results confirm that the indexing technique helps to establish consistency in the index structure and the searching technique achieves a remarkable performance. When combined, the new techniques allow to explore properly all the available data even with high amounts of missing attribute values. As they are independent of the underlying access method, they can be adopted by a broad range of metric access methods, allowing to extend the class of MAMs. / O crescimento em quantidade e complexidade dos dados processados e armazenados torna a busca por similaridade uma tarefa fundamental para tratar esses dados. No entanto, atributos faltantes ocorrem freqüentemente, inviabilizando os métodos de acesso métricos (MAMs) projetados para apoiar a busca por similaridade. Assim, técnicas de tratamento de dados faltantes precisam ser desenvolvidas. A abordagem mais comum para executar as técnicas de indexação existentes sobre conjuntos de dados com valores faltantes é usar um indicador de valores faltantes e usar as técnicas de indexação tradicionais. Embora, esta técnica seja útil para os métodos de indexação multidimensionais, é impraticável para os métodos de acesso métricos. Esta dissertação apresenta os resultados da pesquisa realizada para identificar e lidar com os problemas de indexação e recuperação de dados em espaços métricos com valores faltantes. Uma análise experimental dos MAMs aplicados a conjuntos de dados incompletos identificou dois problemas principais: distorção na estrutura interna do índice quando a falta é aleatória e busca tendenciosa na estrutura do índice quando o processo de falta não é aleatório. Uma variante do MAM Slim-tree, chamada Hollow-tree foi proposta com base nestes resultados. A Hollow-tree usa novas técnicas de indexação e de recuperação de dados com valores faltantes quando o processo de falta é aleatório. A técnica de indexação inclui um conjunto de políticas de indexação que visam a evitar distorções na estrutura interna dos índices. A técnica de recuperação de dados melhora o desempenho das consultas por similaridade sobre bases de dados incompletas. Essas técnicas utilizam o conceito de dimensão fractal do conjunto de dados e a densidade local da região de busca para estimar um raio de busca ideal para obter uma resposta mais correta, considerando os dados com valores faltantes como uma resposta potencial. As técnicas propostas foram avaliadas sobre diversos conjuntos de dados reais e sintéticos. Os resultados mostram que a Hollow-tree atinge quase 100% de precisão e revocação para consultas por abrangência e mais de 90% para k vizinhos mais próximos, enquanto a Slim-tree rapidamente deteriora com o aumento da quantidade de valores faltantes. Tais resultados indicam que a técnica de indexação proposta ajuda a estabelecer a consistência na estrutura do índice e a técnica de busca pode ser realizada com um desempenho notável. As técnicas propostas são independentes do MAM básico usado e podem ser aplicadas em uma grande variedade deles, permitindo estender a classe dos MAMs em geral para tratar dados faltantes.
|
19 |
Investigación y análisis de las masillas de relleno para la reintegración de lagunas cerámicas arqueológicasLastras Pérez, Montserrat 20 July 2011 (has links)
Una de las características más comunes en los objetos cerámicos arqueológicos recuperados son las lagunas. Es por ello que de entre las distintas fases que intervienen en la restauración de cerámica arqueológica la reintegración formal sea una de las más importantes, aportando estabilidad y proporcionándole una correcta legibilidad a la pieza. A lo largo de la historia y en la actualidad se han venido empleando variados materiales para la reposición de faltantes en cerámica arqueológica. En la actualidad la investigación de nuevos materiales ofrece al campo de la restauración innumerables productos, siendo los tradicionales poco a poco sustituidos. Esta tesis plantea el estudio de las masillas empleadas en la reposición de faltantes en cerámica arqueológica desde la visión del comportamiento a corto, medio y largo plazo. La tesis se divide en tres partes muy diferenciadas a la vez que complementarias entre sí: un primer bloque donde se realiza una revisión histórica sobre los tratamientos de conservación de cerámica arqueológica. Un segundo bloque donde se ahonda en los criterios, procesos y materiales empleados a lo largo de la historia en los tratamientos de restauración, en concreto el tratamiento de lagunas. Y un tercer bloque experimental donde se expone la metodología de la investigación y los resultados obtenidos tras los diversos ensayos de envejecimientos a los que se han expuesto las distintas masillas experimentadas. / Lastras Pérez, M. (2007). Investigación y análisis de las masillas de relleno para la reintegración de lagunas cerámicas arqueológicas [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/11224
|
20 |
Técnicas de diagnóstico para modelos lineares generalizados com medidas repetidas / Diagnostics for generalized linear models for repeated measures data with missing valuesDamiani, Lucas Petri 10 May 2012 (has links)
A literatura dispõe de métodos de diagnóstico para avaliar o ajuste de modelos lineares generalizados (MLGs) para medidas repetidas baseado em equações de estimação generalizada (EEG). No entanto, tais métodos não contemplam a distribuição binomial nem bancos de dados com observações faltantes. O presente trabalho generalizou os métodos já desenvolvidos para essas duas situações. Na construção de gráficos de probabilidade meio-normal com envelope simulado para a distribuição binomial, foi proposto um método para geração de variáveis aleatórias com distribuição marginal binomial correlacionadas, baseado na convolução de variáveis com distribuição de Poisson independentes. Os métodos de diagnóstico desenvolvidos foram aplicados em dados reais e simulados. / Literature provides diagnostic methods to assess the fit of generalized linear models (GLM) for repeated measures based on generalized estimating equations (GEE). Still, such methods do not include the binomial distribution or databases with missing observations. This work generalizes the methods already developed for these two situations. A method for generating random variables with correlated marginal binomial distributions based on convolution of independent Poisson random variables has been proposed for the construction of half-normal probability plots. The diagnostic methods developed were applied to real and simulated data.
|
Page generated in 0.0635 seconds