Global ETD Search

81	Avaliação de padrões para implementação de modelos de dados orientados a objetos em bancos de dados relacionais. / Patterns evaluation for implementation of object-oriented data models into relational databases. July Any Martinez de Rizzo 11 November 2010 (has links) A questão da implementação de modelos de dados que utilizam a orientação a objetos constitui-se, ainda, em um assunto não totalmente consolidado. Dessa forma, nesta dissertação realiza-se uma sistematização relativa à implementação de um banco de dados relacional representado por um diagrama de classes. Este trabalho apresenta como foco principal uma avaliação de métricas do mapeamento de três tipos de relacionamento de um modelo orientado a objetos, Herança, Agregação/Composição e Associação, quando aplicados a um modelo relacional de banco de dados. Para isso, foram avaliados ao todo sete padrões de mapeamento desses relacionamentos para a modelagem relacional, sendo dois padrões de Herança, dois de Agregação e dois de Associação, além de análise de estudos empíricos relacionados ao tema. Ambas as formas de modelagem, relacional e orientada a objetos, são compatíveis quando analisadas suas modelagens conceituais. Assim, avalia-se a adequação da implementação dos modelos orientados a objetos em um banco de dados relacional após a aplicação dos padrões de mapeamento. Como resultado deste trabalho, é apresentada uma proposta de análise de métricas da aplicação dos padrões de mapeamento em um modelo apropriado para implementação em um banco de dados relacional. Algumas das métricas avaliadas são desnormalização, método de armazenamento lógico alinhado à estratégia de indexação, alta disponibilidade e uso de métodos de replicação, custo de acesso a dados, espaço em disco e flexibilidade e custo de manutenção. / Implementation of object-oriented data models constitutes in a not fully consolidated subject yet. Thus, this work performs an evaluation about a relational database implementation represented by a class diagram. The main focus of this paper is to present a systematic metric evaluation for the mapping of three relationships types of an object-oriented model, Inheritance, Aggregation / Composition and Association, when applied to a relational database model. For this purpose, seven mapping patterns that transform these relationships into a relational model notation were evaluated, two patterns of Inheritance, two of Aggregation, and two of Association, besides the analysis of empirical studies related to the topic. Both forms of modeling, relational and object-oriented, are considered compatible when their conceptual modeling is analyzed. So this paper evaluates the adequation of the object-oriented models implementation in a relational database after the appliance of the mapping standards. As a result of this work, it is presented an analysis of metrics proposal from the mapping patterns application in a suitable model for implementation in a relational database. Some of the evaluated metrics are denormalization, logical storage method aligned to indexing strategy, high availability and use of replication methods, cost of access to data, disk space and flexibility and maintenance costs. Banco de dados Implementação Mapeamento Métricas de avaliação Modelagem Padrões Database Evaluation metrics Implementation Mapping Modeling Patterns
82	Uma proposta de desenvolvimento de métricas para a rede da Unipampa Nascimento, Tiago Belmonte 25 July 2013 (has links) Submitted by Sandro Camargo (sandro.camargo@unipampa.edu.br) on 2015-05-09T19:15:36Z No. of bitstreams: 1 107110009.pdf: 1750995 bytes, checksum: 7c771ac4e6d9517bfe5c709731c3743e (MD5) / Made available in DSpace on 2015-05-09T19:15:36Z (GMT). No. of bitstreams: 1 107110009.pdf: 1750995 bytes, checksum: 7c771ac4e6d9517bfe5c709731c3743e (MD5) Previous issue date: 2013-07-25 / Um dos maiores desafios da implantação da Universidade Federal do Pampa como uma instituição pública de ensino superior no interior do Rio Grande do Sul é a estruturação de sua rede de dados. Devido às suas peculiaridades a rede de computadores da UNIPAMPA necessita de controles eficientes para garantir sua operação com estabilidade e segurança. Dessa forma, torna-se imprescindível o uso de sistemas confiáveis de comunicação que interliguem todas estas unidades descentralizadas. Em geral, a confiabilidade dos sistemas de comunicação pode ser melhorada em três grandes frentes de ação. 1) manipulação e codificação da informação, 2) melhoria de recursos como potência e banda nos canais de comunicação físicos 3) levantamento de métricas nos pontos de transmissão e recepção. A fim de colaborar neste processo, nosso trabalho consistiu na elaboração de uma proposta do uso de métricas na política de segurança desta rede, tornando mais eficiente a detecção de vulnerabilidades e a orientação de novas políticas de segurança e investimentos. As 10 métricas apresentadas e o método que foi utilizado para gerá-las podem ser aplicados em qualquer rede com características similares à rede da Unipampa. / One of the biggest challenges in the implementation of the University of Pampa as a public university in the countryside of the state of Rio Grande do Sul is the structure of its data network. Due to its peculiarities, the Unipampa's computer network needs efficient controls to ensure operations with stability and safety. Thus, it ecomes essential to use reliable communication systems that interconnect all these decentralized units. In general, the reliability of communication systems can be improved in three major areas of action. 1) anipulation and encoding of information, 2) improving resources such as power and bandwidth in communication physical channels 3) survey metrics at points of transmission and reception. Aiming to contribute in this process, our research consisted in elaborating a proposal of metric use in the security policy of this network, making the vulnerability detection more efficient as well as the orientation of new policies of safety and investment. The 10 metrics and presented method was used to generate them may be applied in any network with similar characteristics to the network of Unipampa. CNPQ::ENGENHARIAS Métricas de segurança Redes de computadores Segurança de redes Security metrics Computer networks Network security
83	Avaliação de padrões para implementação de modelos de dados orientados a objetos em bancos de dados relacionais. / Patterns evaluation for implementation of object-oriented data models into relational databases. Rizzo, July Any Martinez de 11 November 2010 (has links) A questão da implementação de modelos de dados que utilizam a orientação a objetos constitui-se, ainda, em um assunto não totalmente consolidado. Dessa forma, nesta dissertação realiza-se uma sistematização relativa à implementação de um banco de dados relacional representado por um diagrama de classes. Este trabalho apresenta como foco principal uma avaliação de métricas do mapeamento de três tipos de relacionamento de um modelo orientado a objetos, Herança, Agregação/Composição e Associação, quando aplicados a um modelo relacional de banco de dados. Para isso, foram avaliados ao todo sete padrões de mapeamento desses relacionamentos para a modelagem relacional, sendo dois padrões de Herança, dois de Agregação e dois de Associação, além de análise de estudos empíricos relacionados ao tema. Ambas as formas de modelagem, relacional e orientada a objetos, são compatíveis quando analisadas suas modelagens conceituais. Assim, avalia-se a adequação da implementação dos modelos orientados a objetos em um banco de dados relacional após a aplicação dos padrões de mapeamento. Como resultado deste trabalho, é apresentada uma proposta de análise de métricas da aplicação dos padrões de mapeamento em um modelo apropriado para implementação em um banco de dados relacional. Algumas das métricas avaliadas são desnormalização, método de armazenamento lógico alinhado à estratégia de indexação, alta disponibilidade e uso de métodos de replicação, custo de acesso a dados, espaço em disco e flexibilidade e custo de manutenção. / Implementation of object-oriented data models constitutes in a not fully consolidated subject yet. Thus, this work performs an evaluation about a relational database implementation represented by a class diagram. The main focus of this paper is to present a systematic metric evaluation for the mapping of three relationships types of an object-oriented model, Inheritance, Aggregation / Composition and Association, when applied to a relational database model. For this purpose, seven mapping patterns that transform these relationships into a relational model notation were evaluated, two patterns of Inheritance, two of Aggregation, and two of Association, besides the analysis of empirical studies related to the topic. Both forms of modeling, relational and object-oriented, are considered compatible when their conceptual modeling is analyzed. So this paper evaluates the adequation of the object-oriented models implementation in a relational database after the appliance of the mapping standards. As a result of this work, it is presented an analysis of metrics proposal from the mapping patterns application in a suitable model for implementation in a relational database. Some of the evaluated metrics are denormalization, logical storage method aligned to indexing strategy, high availability and use of replication methods, cost of access to data, disk space and flexibility and maintenance costs. Banco de dados Database Evaluation metrics Implementação Implementation Mapeamento Mapping Métricas de avaliação Modelagem Modeling Padrões Patterns
84	Métricas para los procesos de gestión e ingeniería de proyectos de desarrollo de software para una PYME Vidal Lara, René Luis January 2013 (has links) Magíster en Tecnologías de la Información / El objetivo general del presente trabajo de tesis de grado es diseñar un conjunto de métricas para una Pyme (Amisoft) con el objetivo de permitir controlar de forma integral los aspectos relevantes de los proyectos y procesos de desarrollo de software. Amisoft es una empresa de tecnologías de la información con 15 años en el mercado que actualmente cuenta con más de 40 profesionales dedicados a proyectos de desarrollo y mantenimiento de software, y que siguen procesos formales de desarrollo. Desde hace un par de años Amisoft se vio en la necesidad de formalizar sus procesos tanto de desarrollo como de gestión de proyectos de software, motivado por el crecimiento alcanzado, así como también por las exigencias del mercado en el cual participa. Sin embargo una vez institucionalizados los procesos, se evidenció la necesidad de contar con información de sus procesos y de cuál es el desempeño de los proyectos de tal modo de permitir mejorar la toma de decisiones y acceder realmente a la mejora continua que se ha planteado. Debido a esta necesidad existente, se apreció la oportunidad de implementar un área de proceso de medidas y análisis que permitiera entregar información sobre el avance de los proyectos, la calidad del producto y el rendimiento del proceso. Esta información ayudaría a establecer líneas bases de calidad y desempeño que permitirían plantear objetivos de mejora que estuvieran alineados con los objetivos estratégicos establecidos por Amisoft. Por lo tanto el principal reto fue diseñar un conjunto de métricas que dieran respuesta a las necesidades de información de la empresa. Esto implicó definir procesos para la definición, recolección, almacenamiento y análisis de las métricas. Se estudiaron algunas métricas que han sido probadas empíricamente y publicadas en la literatura científica. Se adaptaron e incorporaron las metodologías GQM (Goal Question Metric) y PSM (Practical Software Measurement) como referencia para el proyecto. El proyecto de tesis involucró la ejecución de tres proyectos pilotos que permitieron probar las métricas en la práctica, ajustarlas, y poder realizar las conclusiones para el presente trabajo. Como complemento a este trabajo de tesis se describen cuáles deberían ser los trabajos futuros para continuar mejorando el área de medidas y análisis. Se concluye que el trabajo realizado permitió identificar los principales problemas que tenían los procesos y los proyectos. Dichos problemas hacían que los proyectos se volvieran lentos, costosos y con una calidad subsanada vía constantes re trabajos. Esto generaba en la empresa pérdida de competitividad, ingresos y deterioro de la reputación. La mejora en los problemas identificados permitirá revertir esta situación y colocar a Amisoft en una nueva posición competitiva dentro de la industria de TI. Software computacional - Evaluación Ingeniería de software Control de procesos Pequeñas empresas -- Chile Métricas
85	Avaliação do desempenho de busca de imagens por conteúdo em redes de computadores: uma proposta de reengenharia com aplicação a imagens médicas / Performance evaluation of images by content search in computer networking Oliveira, Fabio Brussolo de 27 February 2012 (has links) O objetivo deste trabalho é avaliar a recuperação de imagem por conteúdo (CBIR - Content-based Image Retrieval) em uma rede de computadores, estabelecendo-se métricas de controle que otimizem a utilização da rede e ao mesmo tempo garanta melhor qualidade na resposta. Prevê-se a recuperação de imagens baseada em consulta por similaridade, combinando-se o extrator de características com a função de distância. O desenvolvimento é realizado em uma linguagem de programação independente da plataforma e de âmbito de internet, utilizado Java, desenvolvendo-se uma API (Application Programming Interface), visando, em especial, a reutilização de código, o que implica na diminuição do tempo de desenvolvimento. O trabalho demonstra a utilização de estruturas de indexação sequencial, comparada com a estrutura de indexação de árvore \"Slim-tree\". A principal contribuição deste trabalho é a análise e a utilização de métricas na rede de computadores em um projeto de CBIR. / The objective of this study is to evaluate the Content-based Image Retrieval (CBIR) in a computer network, establishing control metrics that optimize the use of network while ensuring better quality in the response. It is expected that images are going to be recovered based on queries that are similar, combining the features extractor with the distance function. The development environment is an independent language of the platform and of the Internet scope, using Java, that has developed an Application Programming Interfaces (API), aiming primarily the code reuse, which implies a decrease in the development time. This thesis demonstrates the use of sequential indexing structures compared to the tree index structure \"Slim-tree\". The main contribution of this thesis is the analysis and utilization of metrics in a computer network project in CBIR. API API CBIR CBIR Internet Internet Java Java Métricas de rede Metrics network Network computers Rede de computadores
86	Uso de invertebrados bentônicos na avaliação da qualidade da água da bacia do Alto Atibaia (SP) / Use of benthic invertebrate in water quality assessment of Atibaia river basin (São Paulo, State) Fidalgo, Vanessa Hermida 05 February 2007 (has links) Devido à importância do uso de bioindicadores para avaliação da qualidade ambiental e às vantagens do emprego de macroinvertebrados bentônicos para este fim, estes organismos foram utilizados para avaliar a qualidade da água da bacia do alto Atibaia (SP) em oito pontos de amostragem: 3 no rio Atibainha, 3 no rio Cachoeira e 2 no rio Atibaia. Foram amostrados o canal, a margem deposicional e a margem erosional, sendo coletadas três unidades amostrais em cada ambiente de cada ponto, com auxílio do amostrador Hess (rede de 500 μm e área de 678,9 cm2) ou pegador Petersen modificado (área de pegada de 325 cm2). Foram coletadas amostras de sedimento com pegador Petersen modificado em aço inox para análise de granulometria, resíduos totais, voláteis e fixos e umidade. Este trabalho está dividido em três capítulos. No primeiro, a análise da fauna evidenciou que os pontos de cabeceira e à jusante dos reservatórios dos rios Atibainha e Cachoeira tenderam a apresentar riqueza e diversidade menores que os pontos de localização intermediária. Já nos pontos situados no rio Atibaia, a fauna respondeu à deterioração da qualidade da água, refletindo um gradiente ambiental. No segundo capítulo, visando à utilização de técnicas de avaliação rápida para facilitar a análise e interpretação de dados, foram aplicadas vinte e uma métricas biológicas. Dentre todas as métricas testadas, as que evidenciaram o gradiente ambiental presente na bacia estudada, com restrito coeficiente de variação no ponto referência foram riqueza e diversidade de famílias, densidade total, riqueza de EPT e ETO, porcentagem de Táxons de Diptera (exceto Tanytarsini) e não insetos, BMWP JUNQ" e IBBJ. No terceiro capítulo, com a finalidade de contribuir para a elaboração de um plano de monitoramento de avaliação rápida para a bacia do Alto Atibaia (SP), concluiu-se que, com a metodologia empregada, a margem erosional seria o habitat que melhor corresponderia à media ou somatória para o ponto, pelo menos durante o período de estiagem. / Due to importance of the use of bioindicators to assess environmental quality and the advantages of employing benthic macroinvertebrates for this purpose, these organisms were used to assess the water quality of the Atibaia river basin (SP) in eight sites: 3 in the Atibainha river, 3 in the Cachoeira river, and 2 in the Atibaia river. Channel, depositional margin and erosional margin were sampled. Three replicates were collected in each habitat using a Hess sampler (678.9 cm2, 500μm mesh) or modified Petersen grab (325 cm2). Sediment samples were collected with a stainless steel modified Petersen grab for analysis of granulometry, humidity and total, volatile and fixed residues. This study is divided in three chapters. In the first, the fauna showed that headwater and downstream reservoir sites of Cachoeira and Atibainha rivers presented lower richness and diversity than intermediate sites. In the sampling sites of the Atibaia river, the fauna responded to the water quality decline, reflecting an environmental gradient. In the second chapter, aiming the utilization of rapid assessment techniques to facility data analysis and interpretation, twenty one biological metrics were applied. Metrics that evidence the environmental gradient of the basin, with restricted variation coefficient, were richness and diversity of families, total density, richness of EPT and ETO, percent of Diptera taxa and noninsects, BMWP JUNQ" and IBBJ. In the third chapter, aiming to contribute to the development of a rapid assessment monitoring plan for the Atibaia river basin, according to the methodology employed, it was concluded that the erosional margin was the habitat that showed the best correspondence with the average or sum of the sites, at least during the dry season. Amostragem de habitats Avaliação biológica Biological assessment Biological metrics Habitat sampling Métricas biológicas Rios Rivers Zoobenthos Zoobentos
87	Análise da paisagem da área de Proteção Ambiental Estadual do Rio Pandeiros, MG : subsídios para o manejo e conservação da fauna Dias, Lívia Caroline César 20 February 2017 (has links) Submitted by Aelson Maciera (aelsoncm@terra.com.br) on 2017-08-30T18:07:03Z No. of bitstreams: 1 DissLCCD.pdf: 4056126 bytes, checksum: ed6319985f95cfa7a1084a7fd08bef23 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-09-25T18:11:08Z (GMT) No. of bitstreams: 1 DissLCCD.pdf: 4056126 bytes, checksum: ed6319985f95cfa7a1084a7fd08bef23 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-09-25T18:11:15Z (GMT) No. of bitstreams: 1 DissLCCD.pdf: 4056126 bytes, checksum: ed6319985f95cfa7a1084a7fd08bef23 (MD5) / Made available in DSpace on 2017-09-25T18:15:52Z (GMT). No. of bitstreams: 1 DissLCCD.pdf: 4056126 bytes, checksum: ed6319985f95cfa7a1084a7fd08bef23 (MD5) Previous issue date: 2017-02-20 / Outra / The advancement of human occupation and the evolution of its many activities have put many ecosystems at risk. The loss of native vegetation to agricultural practices has resulted in the fragmentation of habitats, which has serious consequences for biodiversity. Protected areas exist to try to avoid these interferences, but enforcement is not always effective and can avoid impacts. This scenario makes fundamental the analysis of the landscape of protected areas in macro-scale in order to try to predict and to reverse the impacts resulting from the expansion of the anthropic occupation. In view of these considerations, this dissertation aimed to obtain information about the landscape of the State Environmental Protection Area Rio Pandeiros (PSA Pandeiros), through the use of structural indexes of the landscape. The information was inserted and analyzed in Geographic Information Systems (GIS). The landscape structure was evaluated through the land use and land cover dynamics of PSA Pandeiros in 1995 and 2015. The evaluation of priority areas for PSA conservation was evaluated through the application of landscape metrics based on the results of the use and coverage evaluation from the land. And the evaluation of the location of ecological corridors for the PSA area was carried out based on the analysis of PSA connectivity potential from the results of the landscape metrics. The results showed that agricultural activities have strong influence structure of the landscape, mainly the pasture. The advancement of agricultural practices has made the landscape of the PSA suffer some degree of fragmentation which if not controlled will have serious consequences for the local biodiversity. The PSA still presents some fragments that have been considered high conservation areas due to their size and shape, are essential areas for actions that encourage the protection of the PSA. The analysis of the location of the ecological corridors showed that the proposed corridors are located in conservation priority areas and, therefore, their consolidation is necessary so that the fragmentation process of the PSA begins to be reversed and that the PSA may in the near future have A more connected landscape to ensure the 26 species of medium and large mammals found in the PSA and all the biodiversity that is interconnected. / O avanço da ocupação humana e a evolução de suas inúmeras atividades têm colocado diversos ecossistemas em perigo. A perda de vegetação nativa para práticas agrícolas tem resultado na fragmentação dos habitats o que gera graves consequências para a biodiversidade. As áreas Protegidas existem para tentar evitar estas interferências, mas nem sempre a fiscalização é efetiva e consegue evitar os impactos. Esse cenário torna fundamental a análise da paisagem de áreas protegidas em macro escala de forma a tentar prever e reverter os impactos resultantes da expansão da ocupação antrópica. Diante dessas considerações, esta dissertação teve como objetivo a obtenção de informações sobre a paisagem da Área de Proteção Ambiental Estadual do Rio Pandeiros (APA Pandeiros), por meio da utilização de índices estruturais da paisagem. As informações foram inseridas e analisadas em Sistemas de Informação Geográfica (SIG). A estrutura da paisagem foi avaliada através da dinâmica de uso e cobertura da terra da APA Pandeiros em 1995 e 2015. A avaliação de áreas prioritárias para conservação da APA foi avaliada através da aplicação de métricas da paisagem baseadas nos resultados da avaliação do uso e cobertura da terra. E a avaliação da localização de corredores ecológicos para a área da APA foi realizada baseada na análise do potencial de conectividade da APA a partir dos resultados das métricas da paisagem. Os resultados mostraram que as atividades agrícolas têm forte influência estrutura da paisagem, principalmente a pastagem. O avanço das práticas agrícolas fez com que a paisagem da APA sofresse certo grau de fragmentação que caso não seja controlado trará sérias consequências para a biodiversidade local. A APA ainda apresenta alguns fragmentos que foram considerados como áreas de alta prioridade para a conservação devido ao seu formato e tamanho, são áreas essenciais para ações que incentivem a proteção da APA. A análise da localização dos corredores ecológicos mostrou que os corredores propostos estão localizados em áreas prioritárias para a conservação e dessa forma, a sua consolidação é necessária para que o processo de fragmentação da APA comece a ser revertido e que a APA possa num futuro próximo ter uma paisagem mais conectada a fim de assegurar as 26 espécies de mamíferos de médio e grande porte encontrada na APA e toda a biodiversidade que está interligada. Dinâmica temporal Fragmentação Métricas da paisagem Conectividade Biodiversidade Temporal dynamics Fragmentation Landscape metrics Connectivity Biodiversity CIENCIAS BIOLOGICAS
88	Avaliação da qualidade de funções de similaridade no contexto de consultas por abrangência / Quality evaluation of similarity functions for range queries Stasiu, Raquel Kolitski January 2007 (has links) Em sistemas reais, os dados armazenados tipicamente apresentam inconsistências causadas por erros de gra a, abreviações, caracteres trocados, entre outros. Isto faz com que diferentes representações do mesmo objeto do mundo real sejam registrados como elementos distintos, causando um problema no momento de consultar os dados. Portanto, o problema investigado nesta tese refere-se às consultas por abrangência, que procuram encontrar objetos que representam o mesmo objeto real consultado . Esse tipo de consulta não pode ser processado por coincidência exata, necessitando de um mecanismo de consulta com suporte à similaridade. Para cada consulta submetida a uma determinada coleção, a função de similaridade produz um ranking dos elementos dessa coleção ordenados pelo valor de similaridade entre cada elemento e o objeto consulta. Como somente os elementos que são variações do objeto consulta são relevantes e deveriam ser retornados, é necessário o uso de um limiar para delimitar o resultado. O primeiro desa o das consultas por abrangência é a de nição do limiar. Geralmente é o especialista humano que faz a estimativa manualmente através da identi - cação de elementos relevantes e irrelevantes para cada consulta e em seguida, utiliza uma medida como revocação e precisão (R&P). A alta dependência do especialista humano di culta o uso de consultas por abrangência na prática, principalmente em grandes coleções. Por esta razão, o método apresentado nesta tese tem por objetivo estimar R&P para vários limiares com baixa dependência do especialista humano. Como um sub-produto do método, também é possível selecionar o limiar mais adequado para uma função sobre uma determinada coleção. Considerando que as funções de similaridade são imperfeitas e que apresentam níveis diferentes de qualidade, é necessário avaliar a função de similaridade para cada coleção, pois o resultado é dependente dos dados. Um limiar para uma coleção pode ser totalmente inadequado para outra coleção, embora utilizando a mesma função de similaridade. Como forma de medir a qualidade de funções de similaridade no contexto de consultas por abrangência, esta tese apresenta a discernibilidade. Trata-se de uma medida que de ne a habilidade da função de similaridade de separar elementos relevantes e irrelevantes. Comparando com a precisão média, a discernibilidade captura variações que não são percebidas pela precisão média, o que mostra que a discernibilidade é mais apropriada para consultas por abrangência. Uma extensa avaliação experimental usando dados reais mostra a viabilidade tanto do método de estimativas como da medida de discernibilidade para consultas por abrangência. / In real systems, stored data typically have inconsistencies caused by typing errors, abbreviations, transposed characters, amongst others. For this reason, di erent representations of the same real world object are stored as distinct elements, causing problems during query processing. In this sense, this thesis investigates range queries which nd objects that represent the same real world object being queried . This type of query cannot be processed by exact matching, thus requiring the support for querying by similarity. For each query submitted to a given collection, the similarity function produces a ranked list of all elements in this collection. This ranked list is sorted decreasingly by the similarity score value with the query object. Only the variations of the query object should be part of the result as only those items are relevant. For this reason, it is necessary to apply a threshold value to properly split the ranking. The rst challenge of range queries is the de nition of a proper threshold. Usually, a human specialist makes the estimation manually through the identi cation of relevant and irrelevant elements for each query. Then, he/she uses measures such as recall and precision (R&P). The high dependency on the human specialist is the main di culty related to use of range queries in real situations, specially for large collections. In this sense, the method presented in this thesis has the objective of estimating R&P at several thresholds with low human intervention. As a by-product of this method, it is possible to select the optimal threshold for a similarity function in a given collection. Considering the fact that the similarity functions are imperfect and vary in quality, it is necessary to evaluate the similarity function for each collection as the result is domain dependent. A threshold value for a collection could be totally inappropriate for another, even though the same similarity function is applied. As a measure of quality of similarity functions for range queries, this thesis introduces discernability. This is a measure to quantify the ability of the similarity function in separating relevant and irrelevant elements. Comparing discernability and mean average precision, the rst one can capture variations that are not noticed by precision-based measures. This property shows that discernability presents better results for evaluating similarity functions for range queries. An extended experimental evaluation using real data shows the viability of both, the estimation method and the discernability measure, applied to range queries. Recuperacao : Informacao Métricas : Similaridade Banco : Dados Quality evaluation Similarity queries Similarity function Range queries Threshold estimation
89	Automatizando o processo de estimativa de revocação e precisão de funções de similaridade / Automatizing the process of estimating recall and precision of similarity functions Santos, Juliana Bonato dos January 2008 (has links) Os mecanismos tradicionais de consulta a bases de dados, que utilizam o critério de igualdade, têm se tornado ineficazes quando os dados armazenados possuem variações tanto ortográficas quanto de formato. Nesses casos, torna-se necessário o uso de funções de similaridade ao invés dos operadores booleanos. Os mecanismos de consulta por similaridade retornam um ranking de elementos ordenados pelo seu valor de similaridade em relação ao objeto consultado. Para delimitar os elementos desse ranking que efetivamente fazem parte do resultado pode-se utilizar um limiar de similaridade. Entretanto, a definição do limiar de similaridade adequado é complexa, visto que este valor varia de acordo com a função de similaridade usada e a semântica dos dados consultados. Uma das formas de auxiliar na definição do limiar adequado é avaliar a qualidade do resultado de consultas que utilizam funções de similaridade para diferentes limiares sobre uma amostra da coleção de dados. Este trabalho apresenta um método automático de estimativa da qualidade de funções de similaridade através de medidas de revocação e precisão computadas para diferentes limiares. Os resultados obtidos a partir da aplicação desse método podem ser utilizados como metadados e, a partir dos requisitos de uma aplicação específica, auxiliar na definição do limiar mais adequado. Este processo automático utiliza métodos de agrupamento por similaridade, bem como medidas para validar os grupos formados por esses métodos, para eliminar a intervenção humana durante a estimativa de valores de revocação e precisão. / Traditional database query mechanisms, which use the equality criterion, have become inefficient when the stored data have spelling and format variations. In such cases, it's necessary to use similarity functions instead of boolean operators. Query mechanisms that use similarity functions return a ranking of elements ordered by their score in relation to the query object. To define the relevant elements that must be returned in this ranking, a threshold value can be used. However, the definition of the appropriated threshold value is complex, because it depends on the similarity function used and the semantics of the queried data. One way to help to choose an appropriate threshold is to evaluate the quality of similarity functions results using different thresholds values on a database sample. This work presents an automatic method to estimate the quality of similarity functions through recall and precision measures computed for different thresholds. The results obtained by this method can be used as metadata and, through the requirements of an specific application, assist in setting the appropriated threshold value. This process uses clustering methods and cluster validity measures to eliminate human intervention during the process of estimating recall and precision. Banco : Dados Recuperacao : Informacao Métricas : Similaridade Cluster validity Clustering Similarity functions Recall Precision
90	Soft skills do programador de software: abordagem conceitual e definição de métricas para identificação automática no contexto de um sistema de juiz online / Soft skills of software programmer: conceptual approach and definition of metrics for automatic identification in the context of an online judge system Silva, Maria Helynne Lima 27 March 2015 (has links) Soft skills are characteristics associated with an individual’s personality. They are relevant to professional qualification because they improve the performance at work. Since they are important, Information Technology companies need to understand the soft skills to each role in software development process. Additionally, during the hiring process these companies need to identify soft skills in candidates to find out which one of them have the required characteristics to fit the available jobs. However, soft skills identification is a hard task because it takes time to know an individual’s behavior and normally uses interviews or recommendations. Therefore, we notice a lack of automatic approaches in this context. This dissertation proposes a strategy to minimize the problem of soft skills identification. The strategy focus on the role of software programmers and it aims to find ways to automatically identify soft skills of individuals in this role. To do so, we propose a set of metrics that evaluate soft skills. We collect the metrics from an online judge system, according to its users’ performance and activities. To evaluate the metrics, we conduct an empirical study regarding 56 students of programming courses. Our results indicate that the metrics to identify Analytical and solving problems skills, Attention to details, Fast learning and Persistence are satisfactory. On the other hand, Communication and Work independently skills did not reach significant results. / Soft skills são características associadas a personalidade de um indivíduo. Consideradas relevantes para compor o perfil de um profissional qualificado, elas melhoram o desempenho no trabalho. Diante de sua importância, empresas de Tecnologia da Informação precisam entender quais soft skills são necessárias para cada papel no processo de desenvolvimento de software. Além disso, durante o processo de contratação, essas empresas precisam identificar soft skills em candidatos a fim de descobrir quais deles possuem as características exigidas para os cargos disponíveis. No entanto, a identificação de soft skills é uma tarefa difícil, pois exige conhecer um indivíduo e seu comportamento por um tempo. Normalmente também requer esforços como entrevistas e recomendações, tendo sido observada a falta de abordagens automáticas nesse contexto. Esta dissertação propõe uma estratégia para minimizar o problema da identificação de soft skills. Tal estratégia foca no papel do programador de software e tem como objetivo encontrar formas para identificar automaticamente soft skills de indivíduos nesse papel. Para isso, propomos um conjunto de métricas que pontuam soft skills. Coletamos essas métricas a partir de um juiz online, de acordo com o desempenho e atividades de usuários no sistema. Para avaliar as métricas propostas, conduzimos um estudo empírico envolvendo 56 estudantes de cursos de programação. Nossos resultados indicam que as métricas para identificar as soft skills Análise e resolução de problemas, Atenção a detalhes, Aprendizagem rápida e Persistência são satisfatórias. Por outro lado, as métricas relativas às soft skills de Comunicação e Trabalho independente não alcançaram resultados significativos. Soft skills Programador - Software Métricas Programmer-Software Metrics

Search results