• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 20
  • 2
  • Tagged with
  • 22
  • 22
  • 22
  • 16
  • 16
  • 16
  • 14
  • 12
  • 12
  • 10
  • 9
  • 8
  • 8
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Algoritmos de agrupamento aplicados a dados de express?o g?nica de c?ncer: um estudo comparativo

Ara?jo, Daniel Sabino Amorim de 11 November 2008 (has links)
Made available in DSpace on 2014-12-17T15:47:48Z (GMT). No. of bitstreams: 1 DanielSAA.pdf: 691771 bytes, checksum: c2a3333a69e8d426409687ac8cfac27f (MD5) Previous issue date: 2008-11-11 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The use of clustering methods for the discovery of cancer subtypes has drawn a great deal of attention in the scientific community. While bioinformaticians have proposed new clustering methods that take advantage of characteristics of the gene expression data, the medical community has a preference for using classic clustering methods. There have been no studies thus far performing a large-scale evaluation of different clustering methods in this context. This work presents the first large-scale analysis of seven different clustering methods and four proximity measures for the analysis of 35 cancer gene expression data sets. Results reveal that the finite mixture of Gaussians, followed closely by k-means, exhibited the best performance in terms of recovering the true structure of the data sets. These methods also exhibited, on average, the smallest difference between the actual number of classes in the data sets and the best number of clusters as indicated by our validation criteria. Furthermore, hierarchical methods, which have been widely used by the medical community, exhibited a poorer recovery performance than that of the other methods evaluated. Moreover, as a stable basis for the assessment and comparison of different clustering methods for cancer gene expression data, this study provides a common group of data sets (benchmark data sets) to be shared among researchers and used for comparisons with new methods / O uso de t?cnicas de agrupamento na descoberta de subtipos de c?ncer tem atra?do grande aten??o da comunidade cient?fica. Enquanto bioinformatas prop?em novas t?cnicas de agrupamento que levam em considera??o caracter?sticas dos dados de express?o g?nica, a comunidade m?dica prefere utilizar as t?cnicas cl?ssicas de agrupamento. De fato, n?o existem trabalhos na literatura que realizam uma avalia??o em grande escala de t?cnicas de agrupamento nesse contexto. Diante disso, este trabalho apresenta o primeiro estudo em grande escala de sete t?cnicas de agrupamento e quatro medidas de proximidade para a an?lise de 35 conjuntos de dados de express?o g?nica. Mais especificamente, os resultados mostram que a t?cnica mistura finita de gaussianas, seguida pelo k-means, apresentam os melhores resultados em termos de recupera??o da estrutura natural dos dados. Esses m?todos tamb?m apresentam a menor diferen?a entre o n?mero real de classes e o n?mero de grupos presente na melhor parti??o. Al?m disso, os m?todos de agrupamento hier?rquico, que v?m sendo bastante utilizados pela comunidade m?dica, apresentaram os piores resultados quando comparados com os outros m?todos investigados. Este trabalho tamb?m apresenta, como uma refer?ncia est?vel para a avalia??o e compara??o de diferentes algoritmos de agrupamento para dados de express?o g?nica de c?ncer, um conjunto de bases de dados (benchmark data sets) que pode ser compartilhado entre pesquisadores e usado na compara??o de novos m?todos
12

Uma An?lise de m?todos de distriubui??o de atributos em comit?s de classificadores

Vale, Karliane Medeiros Ovidio 07 August 2009 (has links)
Made available in DSpace on 2014-12-17T15:47:50Z (GMT). No. of bitstreams: 1 KarlianeMOV.pdf: 860257 bytes, checksum: 481ec0c73e057f9e2acea8211d919448 (MD5) Previous issue date: 2009-08-07 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / The objective of the researches in artificial intelligence is to qualify the computer to execute functions that are performed by humans using knowledge and reasoning. This work was developed in the area of machine learning, that it s the study branch of artificial intelligence, being related to the project and development of algorithms and techniques capable to allow the computational learning. The objective of this work is analyzing a feature selection method for ensemble systems. The proposed method is inserted into the filter approach of feature selection method, it s using the variance and Spearman correlation to rank the feature and using the reward and punishment strategies to measure the feature importance for the identification of the classes. For each ensemble, several different configuration were used, which varied from hybrid (homogeneous) to non-hybrid (heterogeneous) structures of ensemble. They were submitted to five combining methods (voting, sum, sum weight, multiLayer Perceptron and na?ve Bayes) which were applied in six distinct database (real and artificial). The classifiers applied during the experiments were k- nearest neighbor, multiLayer Perceptron, na?ve Bayes and decision tree. Finally, the performance of ensemble was analyzed comparatively, using none feature selection method, using a filter approach (original) feature selection method and the proposed method. To do this comparison, a statistical test was applied, which demonstrate that there was a significant improvement in the precision of the ensembles / As pesquisas em intelig?ncia artificial t?m como objetivo capacitar o computador a executar fun??es que s?o desempenhadas pelo ser humano usando conhecimento e racioc?nio. O presente trabalho foi desenvolvido dentro da ?rea de aprendizado de m?quina (AM), que ? um ramo de estudo da intelig?ncia artificial, sendo relacionado ao projeto e desenvolvimento de algoritmos e t?cnicas capazes de permitir o aprendizado computacional. O objetivo deste trabalho ? analisar um m?todo de sele??o de atributos em comit?s de classificadores. Esse m?todo, baseado em filtros, utilizou a vari?ncia e a correla??o de Spearman para ordenar os atributos e estrat?gias de recompensa e puni??o para medir a import?ncia de cada atributo na identifica??o das classes. Foram formados comit?s de classificadores tanto homog?neos quanto heterog?neos, e submetidos a cinco m?todos de combina??o de classificadores (voto, soma, soma ponderada, MLP e naive Bayes), os quais foram aplicados a seis bases de dados distintas (reais e artificiais). Os classificadores aplicados durante os experimentos foram k-nn, MLP, naive Bayes e ?rvore de decis?o. Por fim, foram analisados, comparativamente, o esempenho dos comit?s de classificadores utilizando nenhum m?todo de sele??o de atributos, utilizando um m?todo de sele??o de atributos padr?o baseado em filtro e o m?todo proposto (RecPun). Com base em um teste estat?stico, foi demonstrado que houve uma melhora significante na precis?o dos comit?s
13

Sistema inteligente de controle e monitoramento de ambiente de laborat?rios de an?lises qu?micas

Silva, Artejose Revoredo da 20 July 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-01-13T14:35:43Z No. of bitstreams: 1 ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-01-26T14:53:00Z (GMT) No. of bitstreams: 1 ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5) / Made available in DSpace on 2017-01-26T14:53:00Z (GMT). No. of bitstreams: 1 ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5) Previous issue date: 2016-07-20 / Os laborat?rios de an?lises qu?micas, por se constitu?rem em um conjunto de testes e procedimentos, usando produtos e equipamentos espec?ficos para tratar dos resultados nas amostras que s?o testadas, est?o sempre sujeitos aos fatores inerentes ao ambiente. Devido a esse fato, controlar fatores como a temperatura e a umidade relativa do ar ? tarefa primordial, para que os processos desenvolvidos dentro de tais ambientes (laborat?rios de an?lises qu?micas) possam ser repetidos dentro dos par?metros exigidos. Buscando propor mecanismos de controle para ambientes, mais especificamente para laborat?rios de an?lises qu?micas, neste trabalho, apresentamos um sistema baseado em rede de sensores e reconhecimento de padr?es para controle inteligente de ambientes. Nosso prot?tipo utiliza os pr?prios dados gerados pelos sensores distribu?dos pelo ambiente, para identificar um padr?o de comportamente. Atrav?s da utiliza??o de algoritmos de aprendizado de m?quina, identificam-se as classes contidas nos dados (agrupamento), treina-se e testa-se o sistema (algoritmos de classifica??o), para que o mesmo consiga generalizar o que foi aprendido. Por ?ltimo, criam-se regras de controle associadas as classes previamente identificadas, para controlar os aparelhos de ar condicionado, tanto o principal quanto o reserva, e mais o desumificador. Dessa forma, o prot?tipo mant?m temperatura e umidade estaveis de forma inteligente.
14

Extraindo dados de tr?fego a partir de v?deos em tempo real / Extracting traffic data from videos in real-time

Silva, Luiz Fernando Virginio da 31 July 2017 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-11-01T21:17:52Z No. of bitstreams: 1 LuizFernandoVirginioDaSilva_DISSERT.pdf: 4917021 bytes, checksum: 80294a6de65d56abadd8696d441746c6 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-11-07T22:41:10Z (GMT) No. of bitstreams: 1 LuizFernandoVirginioDaSilva_DISSERT.pdf: 4917021 bytes, checksum: 80294a6de65d56abadd8696d441746c6 (MD5) / Made available in DSpace on 2017-11-07T22:41:10Z (GMT). No. of bitstreams: 1 LuizFernandoVirginioDaSilva_DISSERT.pdf: 4917021 bytes, checksum: 80294a6de65d56abadd8696d441746c6 (MD5) Previous issue date: 2017-07-31 / Alguns dos maiores problemas nas grandes cidades est?o relacionados com a mobilidade urbana. Problemas como congestionamentos e acidentes impactam diretamente, de modo negativo na sociedade, e s?o muitas vezes atribu?dos ? falta de planejamento urbano por parte dos governantes, ? falta de pol?ticas p?blicas e projetos de pesquisa que proporcionem uma solu??o, mesmo que de forma parcial, ao problema. Estas projetos de pesquisa dependem de dados que devem ser coletados in loco nas principais avenidas e ruas da cidade, hoje realizado de forma manual atrav?s da observa??o de imagens geradas por c?meras de CFTV (Circuito Fechado de TV), principal meio de vigil?ncia no tr?nsito. Assim, surge a necessidade de uma solu??o que seja capaz de automatizar a coleta destes dados de forma a reduzir custos com pessoal, otimizar o trabalho e reduzir, tamb?m, erros oriundos deste tipo de opera??o. Desta forma, propomos um m?todo capaz de coletar estes dados de forma autom?tica, em tempo real, utilizando estas imagens de v?deos para subsidiar pesquisas e detectar poss?veis a??es no tr?nsito. Nosso m?todo consiste em um fluxo sequencial de atividades o qual submetemos as imagens. Primeiro, utilizamos segmenta??o por movimento para detectar objetos em movimento. Em seguida, aplicamos, em cada objeto segmentado, uma adapta??o do m?todo de Viola-Jones para refinar a busca na detec??o de ve?culos, classificando-os. Nesta etapa, tratamos situa??es de oclus?o, fen?meno comum de sobreposi??o de objetos que interfere diretamente nos resultados, e, por fim, aplicamos o m?todo de Senior para rastreamento de cada ve?culo classificado a fim de obtermos dados relevantes do tr?fego, inicialmente a dire??o, velocidade e intensidade do fluxo. Submetemos alguns v?deos coletados em uma avenida de grande circula??o a fim de testarmos nosso m?todo. Como resultado, constru?mos um modelo eficiente e com custo computacional baixo capaz de tratar situa??es de oclus?o sob diferentes condi??es de ilumina??o, sendo esta a principal contribui??o deste trabalho. / Some of the major problems in large cities are related to urban mobility. Problems such as traffic jams and vehicle accidents directly impact society in a negative way, and are usually attributed to lack of urban planning from governments, the lack of public policies or research projects aimed at solving this problems, even if partially. These researche projects depend on data that must be collected in loco on the main avenues and streets of the city, that are now performed manually through the observation of images captured by CCTV cameras (Closed Circuit TV), the main means of traffic surveillance in the city. Thus, there is a need for a solution that is able to automaticaly collect these data in order to reduce costs with personnel, optimize the work and also reduce errors that arise from this operation. In this way, we propose a method capable of collecting this data automatically, in real time, using these video images to support the researche projects and explore possible actions in traffic management. Our method consists of a continuous flow of activities that use the collected images. First, it uses motion segmentation to detect moving objects. Then, we apply, in each segmented object, an adaptation of the Viola-Jones method to refine the search in the detection of vehicles, classifying them. In this step, we deal with occlusion situations, a common phenomenon of objects overlapping that directly interfere on results. Finally, we apply the Senior method to track each vehicle in order to obtain relevant traffic data, initially direction, speed and intensity of flow. We submit some videos collected on a large avenue to test our method. As a result, we construct an efficient model with low computational cost capable of handling situations of occlusion in distincts lighting conditions, which is the main contribution of this work.
15

PathoSpotter: um sistema para classifica??o de glomerulopatias a partir de imagens histol?gicas renais

Barros, George Oliveira 29 February 2016 (has links)
Submitted by Ricardo Cedraz Duque Moliterno (ricardo.moliterno@uefs.br) on 2016-09-13T21:44:53Z No. of bitstreams: 1 Disserta??o_George.pdf: 4996097 bytes, checksum: ece2301b72ccb1d9d33a2e2837531079 (MD5) / Made available in DSpace on 2016-09-13T21:44:53Z (GMT). No. of bitstreams: 1 Disserta??o_George.pdf: 4996097 bytes, checksum: ece2301b72ccb1d9d33a2e2837531079 (MD5) Previous issue date: 2016-02-29 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / The realization of an accurate diagnosis from histological images requires pathologists with practical experience because the characteristics of these images lead to a subjective analysis, which often hamper the accuracy of diagnosis. Systems that help to achieve better diagnoses can minimize doubts and improve the quality of diagnosis, influencing on increasing the effectiveness of medical treatments. This paper describes the research and development of PathoSpotter, a computer system to aid in the identification of diseases from histological images. The PathoSpotter proposes to reduce the lack of support work to histopathological diagnosis of renal diseases since much has been done in the area of cancer, but there is few published material in relation to the Digital Pathology applied to nephrology and hepatology. Our goal in this study was to apply the PathoSpotter the classification of proliferative glomerulopathy, which is a family of primary diseases affecting the kidneys. The work was based on a data set consisting of 811 histological pictures glomeruli and classical techniques of processing digital images and histopathology were used. The PathoSpotter presented a performance of 88.4% accuracy, which was similar to other Digital Pathology jobs that can be found in the literature. / A realiza??o do diagn?stico preciso a partir de imagens histol?gicas requer m?dicos patologistas com vasta experi?ncia pr?tica, pois as caracter?sticas dessas imagens conduzem a uma an?lise subjetiva que muitas vezes dificultam a exatid?o do diagn?stico. Sistemas que auxiliam a obten??o de melhores diagn?sticos podem minimizar d?vidas e melhorar a qualidade dos diagn?sticos, influenciando no aumento da efic?cia dos tratamentos m?dicos. Este trabalho descreve a pesquisa e o desenvolvimento do PathoSpotter, um sistema computacional para aux?lio na identifica??o de patologias a partir de imagens histol?gicas. O PathoSpotter se prop?e a reduzir a car?ncia de trabalhos de apoio ao diagn?stico histopatol?gico das doen?as renais, j? que muito tem sido feito na ?rea de neoplasias, mas h? pouco material publicado em rela??o ? Patologia Digital aplicada ? nefrologia ou hepatologia. Nosso objetivo neste trabalho foi aplicar o PathoSpotter na classifica??o das glomerulopatias proliferativas, que ? uma fam?lia de doen?as prim?rias que afetam os rins. O trabalho se baseou em um conjunto de dados composto por 811 imagens histol?gicas de glom?rulos, e foram utilizadas t?cnicas cl?ssicas de processamento de imagens e histopatologia digital. O PathoSpotter apresentou um desempenho de 88,4% de acur?cia, resultado similar ao de outros trabalhos de Patologia Digital que podem ser encontrados na literatura especializada.
16

AILINE: um m?todo baseado em redes neurais artificiais para detec??o autom?tica de linhas espectrais na regi?o do ?ptico

Ferreira, Yvson Paulo Nascimento 24 August 2017 (has links)
Submitted by Luis Ricardo Andrade da Silva (lrasilva@uefs.br) on 2017-11-28T22:15:22Z No. of bitstreams: 1 AILINE-corrigida e completa-enviada pgca.pdf: 18819458 bytes, checksum: 1356b2bb4c6c8fbf60dec709646715da (MD5) / Made available in DSpace on 2017-11-28T22:15:22Z (GMT). No. of bitstreams: 1 AILINE-corrigida e completa-enviada pgca.pdf: 18819458 bytes, checksum: 1356b2bb4c6c8fbf60dec709646715da (MD5) Previous issue date: 2017-08-24 / Advances in the acquisition technology of astronomical spectra resulted in an enormous amount of data. Not being more feasible to analyze them using classical approaches, the need for automatic methods arises. Then, in this research is presented, an Intelligent Algorithm for Identifying Spectral Lines, the AILINE (in Portuguese), which utilizes an artificial neural network to identify the emission lines in the optical spectra of galaxies. This method that in the tests carried out has achieved a accuracy higher than 95% is evaluated and faced with other automatic approaches and other machine learning algorithms. / Os avan?os na tecnologia de aquisi??o de espectros astron?micos resultaram em uma enorme quantidade de dados. N?o sendo mais vi?vel analis?-los usando abordagens cl?ssicas, surge a necessidade de m?todos autom?ticos. Ent?o, nesta pesquisa ? apresentado um Algoritmo Inteligente para Identifica??o de Linhas Espectrais, o AILINE, que utiliza uma Rede Neural Artificial para identificar as linhas em emiss?o nos espectros ?pticos de gal?xias. Este m?todo que nos testes realizados alcan?ou uma acur?cia superior a 95%, ? avaliado e confrontado com outras abordagens autom?ticas e outros algoritmos de aprendizado de m?quina.
17

Predi??o de Falhas em Sistemas de Telecomunica??es utilizando Algoritmos de Gera??o de ?rvores de Decis?o / Prediction of Failures in Telecommunication Systems using Decision Tree Generation Algorithms

Lima, Jos? Divino de 31 August 2017 (has links)
Submitted by SBI Biblioteca Digital (sbi.bibliotecadigital@puc-campinas.edu.br) on 2018-02-21T17:47:30Z No. of bitstreams: 1 JOSE DIVINO DE LIMA.pdf: 3046765 bytes, checksum: a793279094d547961482cafe99be62cb (MD5) / Made available in DSpace on 2018-02-21T17:47:30Z (GMT). No. of bitstreams: 1 JOSE DIVINO DE LIMA.pdf: 3046765 bytes, checksum: a793279094d547961482cafe99be62cb (MD5) Previous issue date: 2017-08-31 / The present dissertation work analyses telecommunication systems failures caused by internal and external agents. This analysis can be very challenging since such systems are complex and heterogeneous. Within this context, this work proposed a model that can be used to predict consequent failures from data samples. To do so, we have used a data mining tool and prediction algorithms that create decision trees. Applying the proposed model to a set of faults, generated by the system of a major telecommunications operator, it was demonstrated that it is possible to group faults with an accuracy of 85.96%. In this way, a process can be established that assists in the definition of grouping and correlation of failures, which allows that high level management systems can be configured more efficiently by their administrators. / O presente trabalho de disserta??o tem como principal objetivo a an?lise dos sistemas de telecomunica??o, os quais est?o cada vez mais complexos e heterog?neos e, em fun??o disso, suscet?veis a diversos tipos de falhas causadas tanto por fatores internos como externos, sendo estes ?ltimos devido ? integra??o com sistemas de terceiros. Dentro desse contexto, este trabalho apresenta, ent?o, um modelo que pode ser utilizado para prever falhas consequentes a partir de uma amostra de dados. Para tanto, utilizou-se uma ferramenta de minera??o de dados e algoritmos de predi??o, que criam ?rvores de decis?o. Aplicado o modelo proposto a um conjunto de falhas, gerado pelo sistema de uma grande operadora de telecomunica??es, demonstrou-se que ? poss?vel agrupar falhas com precis?o de 85,96%. Logo, pode-se estabelecer um processo que auxilia na defini??o do agrupamento e correla??o de falhas, permitindo que os sistemas de gest?o de alto n?vel possam ser configurados de maneira mais eficiente pelos administradores.
18

Utilizando Pesos est?ticos e din?micos em sistemas multi-classificadores com diferentes n?veis de diversidade

Paradeda, Raul Benites 27 July 2007 (has links)
Made available in DSpace on 2014-12-17T15:47:44Z (GMT). No. of bitstreams: 1 RaulBP.pdf: 1811907 bytes, checksum: 007d54350318472b95b8e06144b749a5 (MD5) Previous issue date: 2007-07-27 / Although some individual techniques of supervised Machine Learning (ML), also known as classifiers, or algorithms of classification, to supply solutions that, most of the time, are considered efficient, have experimental results gotten with the use of large sets of pattern and/or that they have a expressive amount of irrelevant data or incomplete characteristic, that show a decrease in the efficiency of the precision of these techniques. In other words, such techniques can t do an recognition of patterns of an efficient form in complex problems. With the intention to get better performance and efficiency of these ML techniques, were thought about the idea to using some types of LM algorithms work jointly, thus origin to the term Multi-Classifier System (MCS). The MCS s presents, as component, different of LM algorithms, called of base classifiers, and realized a combination of results gotten for these algorithms to reach the final result. So that the MCS has a better performance that the base classifiers, the results gotten for each base classifier must present an certain diversity, in other words, a difference between the results gotten for each classifier that compose the system. It can be said that it does not make signification to have MCS s whose base classifiers have identical answers to the sames patterns. Although the MCS s present better results that the individually systems, has always the search to improve the results gotten for this type of system. Aim at this improvement and a better consistency in the results, as well as a larger diversity of the classifiers of a MCS, comes being recently searched methodologies that present as characteristic the use of weights, or confidence values. These weights can describe the importance that certain classifier supplied when associating with each pattern to a determined class. These weights still are used, in associate with the exits of the classifiers, during the process of recognition (use) of the MCS s. Exist different ways of calculating these weights and can be divided in two categories: the static weights and the dynamic weights. The first category of weights is characterizes for not having the modification of its values during the classification process, different it occurs with the second category, where the values suffers modifications during the classification process. In this work an analysis will be made to verify if the use of the weights, statics as much as dynamics, they can increase the perfomance of the MCS s in comparison with the individually systems. Moreover, will be made an analysis in the diversity gotten for the MCS s, for this mode verify if it has some relation between the use of the weights in the MCS s with different levels of diversity / Apesar de algumas t?cnicas individuais de Aprendizado de M?quina (AM) supervisionado, tamb?mconhecidos como classificadores, ou algoritmos de classifica??o, fornecerem solu??es que, na maioria das vezes, s?o consideradas eficientes, h? resultados experimentais obtidos com a utiliza??o de grandes conjuntos de padr?es e/ou que apresentam uma quantidade expressiva de dados incompletos ou caracter?sticas irrelevantes, que mostram uma queda na efic?cia da precis?o dessas t?cnicas. Ou seja, tais t?cnicas n?o conseguem realizar um reconhecimento de padr?es de uma forma eficiente em problemas complexos. Com o intuito de obter um melhor desempenho e efic?cia dessas t?cnicas de AM, pensouse na id?ia de fazer com que v?rios tipos de algoritmos de AM consigam trabalhar conjuntamente, dando assim origem ao termo Sistema Multi-Classificador (SMC). Os SMC s apresentam, como componentes, diferentes algoritmos de AM, chamados de classificadores base, e realizam uma combina??o dos resultados obtidos por estes algoritmos para atingir o resultado final. Para que o SMC tenha um desempenho melhor que os classificadores base, os resultados obtidos por cada classificador base devem apresentar uma determinada diversidade, ou seja, uma diferen?a entre os resultados obtidos por cada classificador que comp?em o sistema. Pode-se dizer que n?o faz sentido ter SMC s cujos classificadores base possuam respostas id?nticas aos padr?es apresentados. Apesar dos SMC s apresentarem melhores resultados que os sistemas executados individualmente, h? sempre a busca para melhorar os resultados obtidos por esse tipo de sistema. Visando essa melhora e uma maior consist?ncia nos resultados, assim como uma maior diversidade dos classificadores de um SMC, v?m sendo recentemente pesquisadas metodologias que apresentam como caracter?sticas o uso de pesos, ou valores de con- fian?a. Esses pesos podem descrever a import?ncia que um determinado classificador forneceu ao associar cada padr?o a uma determinada classe. Esses pesos ainda s?o utilizados, em conjunto com as sa?das dos classificadores, durante o processo de reconhecimento (uso) dos SMC s. Existem diferentes maneiras de se calcular esses pesos e podem ser divididas em duas categorias: os pesos est?ticos e os pesos din?micos. A primeira categoria de pesos se caracteriza por n?o haver a modifica??o de seus valores no decorrer do processo de classifica??o, ao contr?rio do que ocorre com a segunda categoria, onde os valores sofrem modifica??es no decorrer do processo de classifica??o. Neste trabalho ser? feito uma an?lise para verificar se o uso dos pesos, tanto est?ticos quanto din?micos, conseguem aumentar o desempenho dos SMC s em compara??o com estes sistemas executados individualmente. Al?m disso, ser? feita uma an?lise na diversidade obtida pelos SMC s, para dessa forma verificar se h? alguma rela??o entre o uso dos pesos nos SMC s com diferentes n?veis de diversidade
19

Uso de confiabilidade na rotula??o de exemplos em problemas de classifica??o multirr?tulo com aprendizado semissupervisionado

Rodrigues, Fillipe Morais 21 February 2014 (has links)
Made available in DSpace on 2014-12-17T15:48:09Z (GMT). No. of bitstreams: 1 FillipeMR_DISSERT.pdf: 1204563 bytes, checksum: 66d7e69371d4103cf2e242609ed0bbb7 (MD5) Previous issue date: 2014-02-21 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results / As t?cnicas de Aprendizado de M?quina s?o aplicadas em tarefas de classifica??o para a aquisi??o de conhecimento atrav?s de um conjunto de dados ou informa??es. Alguns m?todos de aprendizado utilizados pela literatura s?o baseados em aprendizado semissupervisionado; este ? representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e n?o rotulados (n?o-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados est? dispon?vel para treinamento. O problema da escolha aleat?ria das inst?ncias ? comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleat?ria dessas inst?ncias o que pode causar um impacto negativo. Por outro lado, grande parte dos m?todos de aprendizado de m?quina trata de problemas unirr?tulo, ou seja, problemas onde exemplos de um determinado conjunto s?o associados a uma ?nica classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de dom?nios, ou em mais de uma classe, essa classifica??o citada ? denominada classifica??o multirr?tulo. Este trabalho apresenta uma an?lise experimental dos resultados obtidos por meio da utiliza??o do aprendizado semissupervisionado em problemas de classifica??o multirr?tulo usando um par?metro de confiabilidade como aux?lio na classifica??o dos dados. Dessa maneira, a utiliza??o de t?cnicas de aprendizado semissupervisionado, bem como de m?todos de classifica??o multirr?tulos, foram imprescind?veis na apresenta??o dos resultados
20

Aplica??o de sistemas multi-classificadores no diagn?stico de falhas em motores de indu??o trif?sicos

Santos, Sergio Pinheiro dos 11 April 2009 (has links)
Made available in DSpace on 2014-12-17T14:55:37Z (GMT). No. of bitstreams: 1 SergioPS.pdf: 2376478 bytes, checksum: 7999af148ddd33a9739b28a9fdf05cf3 (MD5) Previous issue date: 2009-04-11 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / Equipment maintenance is the major cost factor in industrial plants, it is very important the development of fault predict techniques. Three-phase induction motors are key electrical equipments used in industrial applications mainly because presents low cost and large robustness, however, it isn t protected from other fault types such as shorted winding and broken bars. Several acquisition ways, processing and signal analysis are applied to improve its diagnosis. More efficient techniques use current sensors and its signature analysis. In this dissertation, starting of these sensors, it is to make signal analysis through Park s vector that provides a good visualization capability. Faults data acquisition is an arduous task; in this way, it is developed a methodology for data base construction. Park s transformer is applied into stationary reference for machine modeling of the machine s differential equations solution. Faults detection needs a detailed analysis of variables and its influences that becomes the diagnosis more complex. The tasks of pattern recognition allow that systems are automatically generated, based in patterns and data concepts, in the majority cases undetectable for specialists, helping decision tasks. Classifiers algorithms with diverse learning paradigms: k-Neighborhood, Neural Networks, Decision Trees and Na?ves Bayes are used to patterns recognition of machines faults. Multi-classifier systems are used to improve classification errors. It inspected the algorithms homogeneous: Bagging and Boosting and heterogeneous: Vote, Stacking and Stacking C. Results present the effectiveness of constructed model to faults modeling, such as the possibility of using multi-classifiers algorithm on faults classification / A manuten??o de equipamentos ? um dos principais fatores de custo no ambiente industrial, sendo de fundamental import?ncia o desenvolvimento de t?cnicas de preven??o de falhas. Os motores de indu??o trif?sicos s?o os equipamentos el?tricos mais utilizados na industria, pois apresentam um baixo custo e boa robustez, entretanto, n?o est?o imunes a diversos tipos de falhas como curto-circuitos nos enrolamentos e quebra de barras rot?ricas. Diversas formas de aquisi??o, processamento e an?lise dos sinais s?o aplicadas para melhorar seu diagn?stico. As t?cnicas mais eficazes utilizam sensores de corrente e a an?lise de sua assinatura. Neste trabalho, s?o apresentadas an?lises a partir destes sensores, sendo esta informa??o processada atrav?s do vetor de Park, que fornece uma boa capacidade de visualiza??o dos padr?es. Visando a obten??o destes padr?es fora do ambiente de opera??o, foi desenvolvida uma metodologia para a constru??o das bases de dados. Para a modelagem da m?quina tamb?m ? aplicada a transforma??o de Park no referencial estacion?rio para solucionar as equa??es diferenciais da m?quina. Detec??o de falhas requer uma an?lise profunda das vari?veis envolvidas e suas influ?ncias, tornando o diagn?stico complexo. Reconhecimento de padr?es permite que sistemas sejam gerados automaticamente, por encontrar padr?es e conceitos nos dados, muitas vezes n?o detectados por especialistas, auxiliando na tomada de decis?es. Algoritmos de classifica??o com diferentes paradigmas de aprendizado como k-vizinhos mais pr?ximos, Redes Neurais, ?rvores de Decis?o e Na?ve-Bayes s?o utilizados para reconhecer os padr?es dos motores. M?todos de multiclassifica??o s?o empregados para melhorar o desempenho na taxa de erro de classifica??o, s?o examinados os seguintes algoritmos homog?neos: Bagging e Boosting e heterog?neos: Vote, Stacking e Stacking C. Nos resultados ? poss?vel notar a efic?cia do modelo constru?do para simular as falhas assim como dos algoritmos multiclassificadores para a classifica??o de falhas

Page generated in 0.2096 seconds