Global ETD Search

1	[en] CLUSTERING VIBRATION DATA FROM OIL WELLS THROUGH UNSUPERVISED NEURAL NETWORK / [pt] CLUSTERIZAÇÃO DE DADOS DE VIBRAÇÃO NA PERFURAÇÃO DE POÇOS DE PETRÓLEO ATRAVÉS DE REDES NEURAIS NÃO SUPERVISIONADAS BRUNO ROMANELLI MENECHINI ESTEU 14 August 2015 (has links) [pt] A perfuração de poços de petróleo em águas profundas tem como objetivo atingir o melhor ponto de extração de óleo e gás natural presentes em reservatórios a alguns milhares de metros no fundo do mar. Um melhor entendimento da dinâmica de perfuração através da análise de parâmetros operacionais em tempo real é importante para otimizar os processos de perfuração e reduzir seus tempos de operação. Com esse objetivo, operadoras de petróleo têm realizado grandes investimentos no desenvolvimento de ferramentas de medição e transmissão de parâmetros durante a perfuração, tais como, entre outros, o peso sobre broca, rotação da coluna e vazão do fluido de perfuração. Dentre as vantagens em se monitorar estes dados em tempo real, destaca-se a otimização de parâmetros operacionais buscando obter uma taxa de penetração satisfatória com o menor gasto de energia possível. Em uma perfuração rotativa, essa energia é muitas vezes parcialmente dissipada devido à vibração da coluna causada pela interação entre broca e formação. Nesta dissertação, com o objetivo de extrair características comuns que pudessem vir a ajudar na otimização da atividade de perfuração, foi utilizada uma técnica de redes neurais não supervisionadas para análise de uma extensa base de dados levantados ao longo de campanhas de perfuração de poços em um mesmo campo de petróleo. Os dados de campo analisados foram obtidos ao longo de perfurações de poços verticais, exclusivamente empregando brocas tipo PDC e exibindo elevados níveis de vibração torcional. O estudo realizado a partir de registros de parâmetros de perfuração, características dos poços e respostas de vibração obtidas em tempo real por ferramentas de poço, e empregando o código de mineração de dados WEKA e a plataforma computacional de análise TIBCO Spotfire, permitiu a determinação de uma curva de desgaste de broca e a influência das ferramentas de navegação no nível de severidade de vibração ao longo da perfuração. / [en] Drilling oil wells in deep waters aims to achieve the best point of extraction of oil and natural gas reservoirs present in a few thousand meters in the seabed. A better understanding of the drilling dynamics through the analysis of real time operation parameters is important to optimize drilling process and reduce operation time. For this purpose petroleum operator companies have been made great investments in developing tools that measure and transmit parameters during drilling operation, such as the weight on bit, pipes rotation per minute and drilling fluid flow. Among the advantages to monitor this real time data there is the operational parameters optimization looking for the least expenditure of energy as possible. In a rotary drilling operation this energy is often lost partially due to column vibration caused by the interaction between bit and formation.In this master s thesis in order to extract common features that could help on the drilling operation optimization a technique using unsupervised neural networks for analyze an extensive database which was built over drilling campaigns in a big oil field . The field data analyzed were obtained during drilling vertical wells exclusively employing PDC bits and presented high levels of torcional vibration. The study was made from drilling parameters records, wells characteristics and vibration responses obtained in real time by downhole tools. Employing the WEKA data mining code and the computing analysis platform TIBCO potfire it was possible determine a bit wear curve and the real influence of navigation tools on the severity levels of vibration during drilling operations. [pt] PERFURACAO [en] DRILLING [pt] CLUSTERIZACAO [en] CLUSTERING [pt] VIBRACAO [en] VIBRATION [pt] REDES NEURAIS NAO SUPERVISIONADAS
2	[en] STRUCTURE OF ELECTRICITY WHITE TARIFF IN BRAZIL: CRITICAL ANALYSIS AND PROPOSAL OF METHODOLOGY / [pt] ESTRUTURA DA TARIFA BRANCA DE ENERGIA ELÉTRICA NO BRASIL: ANÁLISE CRÍTICA E PROPOSIÇÃO METODOLÓGICA DANILO FEBRONI BAPTISTA 13 July 2017 (has links) [pt] Essa dissertação de mestrado teve dois objetivos principais. O primeiro foi avaliar a metodologia atual de determinação de preços para tarifa branca de energia elétrica. O segundo foi propor uma nova metodologia, baseada na simulação e otimização do parâmetro kz, com a inserção de variáveis voltadas para a observação do equilíbrio econômico e financeiro da tarifa, a modicidade tarifária. De acordo com a estrutura tarifária brasileira, a tomada de decisão equivocada no tocante à regulamentação da tarifa branca poderá acarretar em consequências deletérias para a tarifa de energia, caso sejam concedidos benefícios indevidos a consumidores, ou por outro lado, ser uma barreira impeditiva para a migração, que causaria o fracasso da nova modalidade. Para o desenvolvimento do trabalho foi utilizada uma metodologia de clusterização das curvas de carga por tipo e desenvolvido uma metodologia baseada em parâmetros da regulamentação atual e variáveis fundamentadas em experiências internacionais de tarifação horo-sazonal na baixa tensão. A aplicação da metodologia foi realizada pela simulação do parâmetro kz, com a obtenção das respectivas tarifas (fora de ponta, intermediária e ponta), para cada kz simulado foram calculadas as variáveis do modelo por tipologia e, na sequência, realizada a otimização da variável kz pela observação dos resultados consolidados das tipologias do subgrupo. Concluiu-se com esse estudo que a metodologia atual não observa parâmetros relevantes para a determinação dos preços da tarifa branca e que as distorções possuem maior impacto absoluto no subgrupo residencial e maior impacto relativo na classe industrial. A metodologia proposta demonstrou-se consistente na obtenção das relações de preços da tarifa branca e, oportunamente, poderá contribuir para o aprimoramento da nova modalidade tarifária. / [en] This Master s thesis has two main goals. The first is to assess the current method for determining the electrical energy white tariff prices. The second is to propose a new methodology based on simulation and optimization of the kz parameter with the inclusion of new variables, aiming at the the economic and financial balance of the tariff, considering the fact that its adoption by the utility clientes is not at all compulsory. According to the Brazilian tariff structure, making wrong decision regarding the regulation of the white tariff may result in harmful consequences not only for the energy tariff, but also for the distribution utility. To develop the thesis it was used a clustering methodology by type of load curves and applied parameters based on international experiences that has used such kind of tariff. The methodology was carried out by simulation of the kz parameter, obtaining the white tariffs, for each simulated kz value. the model variables by type were then calculated. Finally, the optimal kz value was obtained by observing the consolidated results of the subgroup typologies. It is concluded from this study that the current methodology does not consider relevant parameters for the determination of the white tariffs prices and that distortions have greater absolute impact on residential subgroup and greater relative impact on the industrial class. The proposed methodology proved to be consistent in getting the price ratios of the white tariff and, in due course, can contribute to the improvement of the new tariff structure. [pt] METROLOGIA [en] METROLOGY [pt] MODULACAO [en] MODULATION [pt] CLUSTERIZACAO [en] CLUSTERING [pt] TARIFA BRANCA [pt] PERFIL DE CURVA DE CARGA
3	[en] FACIAL FEATURES DETECTION BASED ON FERNS / [pt] DETECÇÃO DE CARACTERÍSTICAS FACIAIS UTILIZANDO FERNS FABIOLA ALVARES RODRIGUES DE SOUZA MAFFRA 18 January 2010 (has links) [pt] Nas últimas décadas, a área de detecção da face e suas características tem recebido bastante atenção da comunidade científica dada sua importância em diversas aplicações, tais como, reconhecimento de faces, interação humanocomputador, reconhecimento de expressões faciais, segurança, etc. Esta dissertação propõe a utilização de um classificador baseado em FERNS no treinamento e reconhecimento de pontos característicos a fim de possibilitar a detecção das características da face. São revistas, brevemente, as principais abordagens utilizadas na detecção de características faciais e a teoria de reconhecimento de pontos característicos utilizando os FERNS. Também é apresentada uma implementação de um detector de características da face baseado nos FERNS e os resultados obtidos. O método proposto conta com uma fase de treinamento offline durante a qual diversas vistas dos pontos característicos extraídos de uma imagem de treinamento são sintetizadas e utilizadas no treinamento dos FERNS. A detecção das características da face é realizada nas imagens obtidas, em tempo real, de diversos pontos de vista e sob diferentes condições de iluminação. / [en] Over the last decades, face detection and facial features detection have received a great deal of attention from the scientific community, since these tasks are essential for a number of important applications, such as face recognition, face tracking, human-computer interaction, face expression recognition, security, etc. This work proposes the use of a classifier based on FERNS to recognize interest points across images and then detect and track the facial features. We begin with a brief review of the most common approaches used in facial features detection and also the theory around the FERNS. In addition, an implementation of the facial features detection based on FERNS is present to provide results and conclusions. The method proposed here relies on an offline training phase during which multiple views of the keypoints to be matched are synthesized and used to train the FERNS. The facial features detection is performed on images acquired in real-time from many different viewpoints and under different lighting conditions. [pt] SEGMENTACAO [en] SEGMENTATION [pt] TREINAMENTO [en] TRAINING [pt] RASTREAMENTO [en] TRACEABILITY [pt] CLUSTERIZACAO [en] CLUSTERING
4	[pt] EXPLORANDO NOVOS MÉTODOS PARA REALIZAR BAGGING COM AMORTECIMENTO EXPONENCIAL / [en] EXPLORING NEW METHODS TO PERFORM BAGGING WITH EXPONENTIAL SMOOTHING DAVID SOUZA PINTO 07 December 2020 (has links) [pt] Métodos de amortecimento exponencial são formulações versáteis para a previsão de séries temporais univariadas, desenvolvidas na década de 1960. Modelos mais recentes têm feito uso do bagging para melhorar a qualidade das previsões. Um destes, o BaggedETS, desenvolvido em 2016, trouxe melhorias na qualidade de previsão e está disponível na biblioteca forecast para R. Uma proposta posterior, BaggedClusterETS, adicionou uma etapa de clustering e validação para tratar o efeito da covariância associada ao uso do bagging, resultando em ganhos adicionais de performance. Este trabalho explora três extensões dos métodos supracitados e seus efeitos: o primeiro estuda os efeitos do maximum entropy bootstrap na realização do BaggedETS. O segundo explora diferentes medidas de dissimilaridade para construir os clusters do BaggedClusterETS. O terceiro emprega uma versão simplificada do BaggedClusterETS, removendo as etapas de validação e seleção, empregando apenas os medóides para realizar o bagging. Para testar estas propostas, 21 séries temporais da aviação civil e demanda energética foram empregadas. / [en] Exponential smoothing methods are flexible procedures for univariate time series forecasting, developed in the 1960 s. Most recent developments based on these models use bagging to improve forecast quality. One of these implementations, BaggedETS, developed in 2016, brought improvements in forecast quality and is distributed through the forecast package for R. A posterior implementation, BaggedClusterETS, adds clustering and validation steps to address the covariance effect associated with bagging. The proposal resulted in further accuracy improvements. This work delves into three extensions of the aforementioned methods: the first studies the effects of the maximum entropy bootstrap on the BaggedETS. The second explores different dissimilarity measures to construct the clusters in BaggedClusterETS. The third studies a simplified version of BaggedClusterETS, where the validation and selection steps are removed, and using only the medoids for bagging. To test these proposals, 21 time series from civil aviation and energy consumption were used. [pt] SERIE TEMPORAL [en] TIME SERIE [pt] CLUSTERIZACAO [en] CLUSTERING [pt] BAGGING [en] BAGGING
5	[en] CLUSTERING UNDER CONSTRAINTS: EXPLAINABILITY VIA DECISION TREES AND SEPARABILITY WITH MINIMUM SIZE / [pt] CLUSTERIZAÇÃO SOB RESTRIÇÕES: EXPLICABILIDADE VIA ÁRVORES DE DECISÃO E SEPARABILIDADE COM TAMANHO MÍNIMO LUCAS SAADI MURTINHO 18 March 2025 (has links) [pt] Investigamos dois métodos de clusterização com restrições nas partições geradas: a clusterização explicável, em que a partição deve ser induzida por uma árvore de decisão binária (ou seja, por cortes paralelos aos eixos); e a clusterização de tamanho mínimo, na qual todos os clusters devem ter pelo menos um número predeterminado de elementos. Para a clusterização explicável, apresentamos algoritmos e garantias teóricas para as funções de custo k-centers, k-medians, k-means e espaçamento mínimo. Introduzimos também três algoritmos práticos para a popular função de custo k-means: ExGreedy, com resultados geralmente melhores do que os de algoritmos comparáveis na literatura; ExShallow, com um termo de penalidade relacionado à profundidade da árvore que induz a partição, permitindo um equilíbrio entre desempenho (redução da função de custo) e explicabilidade (geração de árvores mais rasas); e ExBisection, que, até onde sabemos, é o primeiro algoritmo de clusterização explicável baseado em árvores de decisão para a função de custo k-means que constrói uma partição explicável do zero (ou seja, sem usar uma partição irrestrita como ponto de partida). Para a clusterização de tamanho mínimo, focamos em medidas interclusterização. Mostramos que Single-Linkage, o algoritmo que maximiza o espaçamento mínimo, também maximiza o custo da árvore de geração mínima de um grafo induzido pela partição gerada por ele; no entanto, este algoritmo tende a gerar muitos clusters pequenos, o que motiva a busca por algoritmos com bons resultados para essas funções de custo que garantam um número mínimo de elementos por cluster. Introduzimos um algoritmo de aproximação para cada função de custo e apresentamos os resultados de experimentos que mostram que eles produzem partições com melhores resultados do que o popular algoritmo k-means para essas instâncias do problema de clusterização. / [en] We investigate two methods of clustering with constraints on the partitions being generated: explainable clustering, in which the partition must be induced by a binary decision tree (i.e., by cuts that are parallel to the axes); and minimum-size clustering, in which all clusters must have at least a predetermined number of elements. For explainable clustering, we present theoretical algorithms and bounds for the k-centers, k-medians, k-means, and minimum-spacing cost functions. We also introduce three practical algorithms for the popular k-means cost function: ExGreedy, which presents results generally better than comparable algorithms in the literature; ExShallow, with a penalty term related to the depth of the tree that induces the partition, allowing for a trade-off between performance (reducing the cost function) and explainability (generating shallower trees); and ExBisection, to our knowledge the first explainable clustering algorithm based on decision trees for the k-means cost function that builds an explainable partition from scratch (i.e., without starting from an unrestricted partition). For minimum-size clustering, our focus is on inter-clustering measures. We show that Single-Linkage, the algorithm that maximizes the minimum spacing, also maximizes the minimum-spanning-tree cost of a graph induced by the partition it generates; however, it is also prone to generating small clusters, which motivates the search for algorithms that perform well for these cost functions without suffering from this tendency. We introduce one approximation algorithm for each cost function, and present the results of experiments showing that they produce partitions that perform better than the popular k-means algorithm for these instances of the clustering task. [pt] ARVORE DE DECISAO [pt] EXPLICABILIDADE [pt] SEPARABILIDADE [pt] CLUSTERIZACAO [en] DECISION TREE [en] EXPLAINABILITY [en] SEPRABILITY [en] CLUSTERING
6	[en] APPLICATION OF CLUSTERING METHODS IN A STUDY ABOUT THE BRAZILIAN STOCK MARKET / [pt] APLICAÇÃO DE MÉTODOS DE CLUSTERIZAÇÃO EM UM ESTUDO SOBRE O MERCADO ACIONÁRIO BRASILEIRO RODRIGO ARRUDA TORRES 02 May 2014 (has links) [pt] Evidências indicam que ações de empresas de um mesmo setor da economia apresentam retornos semelhantes ao longo do tempo, uma vez que estariam expostas a variáveis econômico-financeiras e técnico-operacionais semelhantes. Gestores de recursos, de maneira geral, utilizam esta evidência em suas avaliações diárias na busca pelos melhores investimentos. Entretanto, na grande maioria dos casos, não há um embasamento teórico e matemático que comprove essa relação entre as ações. O objetivo dessa dissertação é verificar se, para um grupo de ações classificadas como mais relevantes dentre as presentes na Bolsa de Valores brasileira, os preços diários de fechamento que se comportam analogamente correspondem a empresas de um mesmo setor econômico. Para testar tal hipótese, serão avaliados diferentes métodos de clusterização aplicados a matriz de dissimilaridade entre os dados estudados, que por sua vez será determinada a partir de diferentes técnicas não-paramétricas de cálculo de dependência entre dados. Os métodos testados serão comparados e o melhor escolhido através da aplicação de índices de validação de clusterizações. / [en] Evidence indicates that shares of companies belonging to the same economic sector have similar returns over time, since they would be exposed to similar economic-financial and technical-operational variables. Portfolio managers, in general, use this evidence in their daily valuations in order to find the best investment alternatives. However, in most cases, there isn`t a theoretical and mathematical background proving this relationship between stocks exists. The objective of this dissertation is to determine whether, for a group of stocks classified as among the most important of the Brazilian stock market, the daily closing prices that behave similarly correspond to companies in the same economic sector. To test this hypothesis, various clustering methods were evaluated and applied to the dissimilarity matrix calculated for the analyzed data, which is determined using different non-parametric techniques for calculating the dependency between data. The models were compared and the best selected by applying clustering validation index. [pt] CLUSTERS [en] CLUSTERS [pt] FINANCAS COMPORTAMENTAIS [en] BEHAVIORAL FINANCE [pt] CLUSTERIZACAO [en] CLUSTERING [en] CLUSTER VALIDATION INDEX
7	[en] A GRAPH-MINING BASED METHOD FOR SEGMENTATION AND COUNTING OF LOCAL MAXIMUM CLUSTERS IN DIGITAL IMAGES / [pt] UM MÉTODO BASEADO EM MINERAÇÃO DE GRAFOS PARA SEGMENTAÇÃO E CONTAGEM DE CLUSTERS DE MÁXIMOS LOCAIS EM IMAGENS DIGITAIS GEISA MARTINS FAUSTINO 19 August 2011 (has links) [pt] Uma imagem monocromática pode ser interpretada como uma superfície topológica e desta forma objetos de interesse podem aparecer como picos (sharp mountains), domos (smooth hills) ou vales (V- or U-shaped). Um domo geralmente contém vários pontos de máximo locais em seu topo. Logo, fica bem caracterizado por um cluster de máximos locais. Segmentar individualmente objetos em imagens onde estes aparecem parcialmente sobrepostos ou fortemente agrupados é um problema que métodos clássicos de segmentação podem não solucionar adequadamente. Outro problema é contar objetos idênticos em imagens perviamente segmentada. Esta tarefa, quando executada manualmente, devido ao cansaço visual exige um grande esforço humano. É tediosa, demorada, além de gerar resultados subjetivos. O presente trabalho propõe um novo método para segmentação e contagem de clusters de máximos locais em uma imagem digital através uma abordagem baseada em grafos. Utilizando a informação de luminância, a imagem é representada por um grafo de adjacências e um algoritmo de mineração é utilizado para segmentar os clusters. Por fim, de acordo com características da imagem, um algoritmo de clusterização pode ser incorporado ao processo para melhorar o resultado final. A contagem dos objetos é um resultado direto do algoritmo de mineração e de clusterização, quando este último é aplicado. O método proposto é tolerante a variações no tamanho e forma dos objetos e é facilmente parametrizado para lidar com diferentes grupos de imagens provenientes de objetos distintos. Testes executados em uma base de dados com 262 imagens, composta de imagens de objetos reais (grupo 1) e de células tronco embrionárias em imagens de microscopia fluorescente (grupo 2), atestam a eficiência e qualidade do método desenvolvido no que diz respeito a segmentação e a contagem. Os resultados gerados para as imagens do grupo 1 foram validados pela autora e os do grupo 2 pelos biólogos do Instituto de Ciências Biomédicas da Universidade Federal do Rio de Janeiro. Para estas imagens foram obtidas uma F-measuare média de 85,33% e 90,88%, respectivamente. Por fim, um estudo comparativo com o algoritmo clássico de watershed foi realizado. Este alcançou uma F-measuare média de 74.02% e 78,28% para os grupos 1 e 2, respectivamente, contra 85,33% e 91,60% obtido pelo método proposto. / [en] A grayscale image can be viewed as a topological surface and this way, objects of interests may appear as peaks (sharp mountains), domes (smooth hills) or valleys (V- or U-shaped). Generally, the dome top presents more than one local maximum. Thus, it can be characterized by a local maximum cluster. Segmenting objects individually in images where they appear partially or totally fused is a problem which frequently may not be solved by a watershed segmentation or a basic morphological processing of images. Other issue is counting similar objects in images segmented beforehand. Counting them manually is a tedious and time-consuming task, and its subjective nature can lead to a wide variation in the results. This work presents a new method for segmenting and counting of local maximum clusters in digital images through a graph-based approach. Using the luminance information, the image is represented by a region adjacency graph and a graph-mining algorithm is applied to segment the clusters. Finally, according to image characteristics, a graph-clustering algorithm can be added to the process to improve the final result. The object counting step is a direct result from the mining algorithm and the clustering algorithm, when the latter is applied. The proposed method is tolerant to variations in object size and shape and can easily be parameterized to handle different image groups resulting from distinct objects. Tests made on a database with 262 images, composed of photographs of objects (group 1) and embryonic stem cells under fluorescence microscopy images (group 2), attest the effectiveness and quality of the proposed method as for segmentation and counting purpose. The images form group 1 processed by our method were checked by the author and those ones from group 2 by the specialists from the Institute of Biomedical Sciences at UFRJ. For these images we obtained an average F-measure of 85.33% and 90.88%, respectively. Finally, a comparative study with the widely used watershed algorithm was done. The watershed achieved an average F-measure of 74.02% e 78.28% for groups 1 and 2, respectively, against 85.33% e 91.60% obtained by our method. [pt] SEGMENTACAO [en] SEGMENTATION [pt] CLUSTERS [en] CLUSTERS [pt] REPRESENTACAO VISUAL [en] VISUAL REPRESENTATION [pt] CLUSTERIZACAO [en] CLUSTERING [pt] MINERACAO [en] MINING
8	[pt] LOCALIZAÇÃO ESPAÇO-TEMPORAL DE ATORES EM VÍDEOS/VÍDEOS 360 E SUAS APLICAÇÕES / [en] SPATIO-TEMPORAL LOCALIZATION OF ACTORS IN VIDEO/360-VIDEO AND ITS APPLICATIONS 13 September 2021 (has links) [pt] A popularidade de plataformas para o armazenamento e compartilhamento de vídeo tem criado um volume massivo de horas de vídeo. Dado um conjunto de atores presentes em um vídeo, a geração de metadados com a determinação temporal dos intervalos em que cada um desses atores está presente, bem como a localização no espaço 2D dos quadros em cada um desses intervalos pode facilitar a recuperação de vídeo e a recomendação. Neste trabalho, nós investigamos a Clusterização Facial em Vídeo para a localização espaço-temporal de atores. Primeiro descrevemos nosso método de Clusterização Facial em Vídeo em que utilizamos métodos de detecção facial, geração de embeddings e clusterização para agrupar faces dos atores em diferentes quadros e fornecer a localização espaço-temporal destes atores. Então, nós exploramos, propomos, e investigamos aplicações inovadoras dessa localização espaço-temporal em três diferentes tarefas: (i) Reconhecimento Facial em Vídeo, (ii) Recomendação de Vídeos Educacionais e (iii) Posicionamento de Legendas em Vídeos 360 graus. Para a tarefa (i), propomos um método baseado na similaridade de clústeres que é facilmente escalável e obteve um recall de 99.435 por cento e uma precisão de 99.131 por cento em um conjunto de vídeos. Para a tarefa (ii), propomos um método não supervisionado baseado na presença de professores em diferentes vídeos. Tal método não requer nenhuma informação adicional sobre os vídeo e obteve um valor mAP aproximadamente 99 por cento. Para a tarefa (iii), propomos o posicionamento dinâmico de legendas baseado na localização de atores em vídeo 360 graus. / [en] The popularity of platforms for the storage and transmission of video content has created a substantial volume of video data. Given a set of actors present in a video, generating metadata with the temporal determination of the interval in which each actor is present, and their spatial 2D localization in each frame in these intervals can facilitate video retrieval and recommendation. In this work, we investigate Video Face Clustering for this spatio-temporal localization of actors in videos. We first describe our method for Video Face Clustering in which we take advantage of face detection, embeddings, and clustering methods to group similar faces of actors in different frames and provide the spatio-temporal localization of them. Then, we explore, propose, and investigate innovative applications of this spatio-temporal localization in three different tasks: (i) Video Face Recognition, (ii) Educational Video Recommendation and (iii) Subtitles Positioning in 360-video. For (i), we propose a cluster-matching-based method that is easily scalable and achieved a recall of 99.435 percent and precision of 99.131 percent in a small video set. For (ii), we propose an unsupervised method based on them presence of lecturers in different videos that does not require any additional information from the videos and achieved a mAP approximately 99 percent. For (iii), we propose a dynamic placement of subtitles based on the automatic localization of actors in 360-video. [pt] CLUSTERIZACAO [pt] VIDEO 360 [pt] RECOMENDACAO DE VIDEO [pt] RECONHECIMENTO FACIAL [en] CLUSTERING [en] 360-VIDEO [en] VIDEO RECOMMENDATION [en] FACE RECOGNITION
9	[pt] DESENVOLVIMENTO DE SISTEMA PARA DETECÇÃO DE PERDAS COMERCIAIS EM REDES DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA / [en] SYSTEM DEVELOPMENT TO DETECT COMMERCIAL LOSSES IN ELECTRICAL ENERGY DISTRIBUTION NETWORK RODRIGO FLORA CALILI 29 December 2005 (has links) [pt] Os modelos matemáticos comumente usados na identificação de irregularidades na medição se baseiam na análise da redução percentual do consumo do mês (normalmente de 20% a 30%) em relação aos meses anteriores. Este método tem gerado resultados imprecisos uma vez que considera o valor do consumo como um valor rígido e, portanto, não incorpora o efeito da sazonalidade na tipologia das cargas das unidades consumidoras. Este trabalho tem o intuito de melhorar a identificação de clientes fraudulentos utilizando métodos de inteligência artificial, tais como Redes Neurais e Lógica Fuzzy, implementados a um banco de dados de cadastro da Distribuidora de Energia ELEKTRO e a uma Pesquisa de Posses e Hábitos de Consumo (PPH) feita nesta mesma empresa. Nesta dissertação, o objetivo foi classificar um grupo de consumidores como normal (adimplente), inadimplente e fraudulento. Para tanto, foi feita inicialmente uma clusterização utilizando uma Rede Neural, mais especificamente uma Rede de Kohonen, para o banco de dados de cadastro disponibilizado pela distribuidora. Tomando os grupos desta classificação prévia feita pela Rede identificaram-se quais e quantos destes tiveram PPH´s realizadas. Para se ter a classificação de um grupo quanto a incidência de consumidores normais, inadimplentes e fraudulentos utilizou-se um processo de Análise Fuzzy, o qual identifica os clusters com os consumidores de cada um dos segmentos. É feita uma análise de desempenho do modelo proposto com dados reais fornecidos pela empresa, na qual os resultados apontaram para uma robustez do método. / [en] Mathematical models commonly used to identify irregularities in measurement are based on percentile reduction analysis of the monthly consumption (normally from 20% to 30%) in relation to the previous months. This method tends to generate imprecise results, since it considers the value of the consumption as a rigid value and, therefore, it does not incorporate the seasonal effect in the loads topology of the consumer units. This work has intention to improve the identification of fraudulent customers using artificial intelligence methods, such as Neural Networks and Fuzzy Logic, implemented to a database of consumers of ELEKTRO a distributing utility of São Paulo State, Brazil. It also uses information on appliances ownership obtained via market research in ELEKTRO area, named PPH (Portuguese for this particular type of market research). In this dissertation, the main objective was to classify a group of consumers as solvent, insolvent and fraudulent. In order to achieve this task, a clustering was initially made using a Neural Network framework, more specifically a Kohonen Network, for the database available. It was then checked which of the groups had a minimum number of clients interviewed in the PPH. In order to have the classification of the clients in the three categories it was used Fuzzy Analysis. Selected data is also presented, considering the available database of the Company as well as the research environment, which had been taken from the PPH. Finally, it was checked the performance of the method against real data obtained from the utility and the results were very satisfactory. [pt] FRAUDULENTO [pt] INADIMPLENTE [pt] ADIMPLENTE [pt] CLUSTERIZACAO [pt] PERDA COMERCIAL [en] FRAUDULENT [en] INSOLVENT [en] SOLVENT [en] CLUSTERING [en] COMMERCIAL LOSS
10	[pt] RESULTADOS TEÓRICOS E EXPERIMENTAIS EM CLUSTERIZAÇÃO COM MÉTRICAS DE TEORIA DA INFORMAÇÃO / [en] THEORETICAL AND EXPERIMENTAL RESULTS IN INFORMATION-THEORETIC CLUSTERING LUCAS SAADI MURTINHO 21 September 2020 (has links) [pt] Esta dissertação apresenta resultados teóricos e experimentais relativos ao problema de clusterização de um conjunto de vetores (que possam ser interpretados como distribuições de probabilidade) com o objetivo de minimizar uma medida de impureza da partição resultante. Por meio de uma conexão entre o problema geométrico de k-médias e o problema de clusterização para minimizar a impureza ponderada de Gini da partição, prova-se que este último é NP-completo e APX-difícil. Também analisamos uma família de algoritmos para clusterização com base nas componentes dominantes (as maiores componentes) dos vetores a serem particionados. Mostra-se que, em alguns casos, dois desses algoritmos conseguem obter bons resultados em termos da entropia ponderada da partição resultante, em um tempo bem menor do que os algoritmos considerados como o estado da arte. / [en] We present theoretical and experimental results related to the problem of clustering a set of vectors (which can be interpreted as probability distributions) with the goal of minimizing a weighted impurity measure of the resulting partition. The problem of clustering while minimizing the weighted Gini impurity of the partition is shown to be NP-complete and APX-hard, via a connection with the geometrical k-means problem. We also analyze a family of algorithms for information-theoretic clustering that rely on the dominant (largest) component of the vectors to be clustered. These algorithms are shown to be very fast compared to the state of the art, while able to achieve comparable results in terms of the resulting partition s weighted entropy. [pt] ENTROPIA [pt] GINI [pt] MEDIDAS DE IMPUREZA [pt] CLUSTERIZACAO [pt] TEORIA DA INFORMACAO [en] ENTROPY [en] GINI [en] IMPURITY MEASURES [en] CLUSTERING [en] INFORMATION THEORY

Search results