Global ETD Search

1	Detecção e classificação de nódulos de câncer de pulmão para diagnóstico assistido por computador ALMEIDA, Raphael Lima Nobre de 07 March 2016 (has links) Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-08-30T12:16:52Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação - Raphael Lima Nobre de Almeida.pdf: 3877614 bytes, checksum: fb5c13466242f36f8e80a7bfdbe436ab (MD5) / Made available in DSpace on 2017-08-30T12:16:52Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação - Raphael Lima Nobre de Almeida.pdf: 3877614 bytes, checksum: fb5c13466242f36f8e80a7bfdbe436ab (MD5) Previous issue date: 2016-03-07 / O câncer de pulmão tem se mostrado o mais agressivo e mortal dentre os tipos de câncer existentes. Uma das principais formas de combatê-lo eficientemente é através do diagnóstico precoce, porém, devido ao alto número de exames de tomografia analisados, vários casos tendem a passar despercebidos. Uma das maneiras de amenizar o problema é o uso de CAD para servir como segunda opinião no momento do diagnóstico. Esse trabalho apresenta um novo sistema CAD, tendo como resultado a indicação de nódulos presentes em exames de tomografia computadorizada do tórax de pacientes. O sistema proposto se baseia em propriedades matemáticas extraídas das regiões candidatas para determinar se elas são nódulos ou não, e a classificação é realizada usando um paralelo entre classificadores baseados em aprendizagem supervisionada e não-supervisionada. Foram estudados vários métodos CAD para definição de uma estrutura de processo automática, em todas as etapas, que primeiro realiza a segmentação da imagem do pulmão a partir de exames de tomografia computadorizada, depois extrai ROI contendo áreas com potencial presença de nódulos, e depois realiza a classificação das ROIs entre áreas com Nódulos e Não-nódulos. Uma base de dados pública de imagens de exames de pacientes LIDC, internacionalmente usada na concepção e testes de sistemas CAD, foi empregada. SOM e SVM foram investigados como classificadores. Como resultado, foram obtidos valores acima de 85% de acurácia, 88% de sensibilidade, 86% F-measure e 1,59 FP/Slice para o SVM e valores acima de 81% de acurácia e 86% de sensibilidade, 82% F-measure e 2,05 FP/Slice para o SOM, onde o FP/Slice significa a média de falsos positivos gerados por imagem. O sistema proposto apresentou resultados superiores em alguns aspectos quando comparados a metodos anteriores e ligeiramente inferior quando comparado com um sistema CAD de saída semelhante, mas que realiza a segmentação manual das regiões de interesse. A partir dos resultados, foi possível ratificar a viabilidade de sistemas CAD com um novo sistema para o diagnóstico de nódulos de câncer de pulmão. / Lung cancer has demonstrated to be the most aggressive and mortal among all kinds of cancer. One of the main manners to efficiently defeat it is the early diagnostic, although due the high number of exams of computed tomography analyzed by the radiologists, they tend to let scape some true cases. A suitable way to diminish this problem is using CAD systems to be used as a second opinion during diagnostic task. Therefore, this work presents a new CAD system , showing as result the indication of the present nodules in thoracic computed tomography exams. The proposed system is based on mathematical properties extracted from Região de Interesse (Region of Interest) (ROI)s to define if they are nodules or not, the classification is accomplished using a parallel between supervised and unsupervised learning techniques.It was studied a gamut of Sistemas para Diagnóstico Assistido por Computador (Computer Aided Diagnosis) (CAD) methods to determine a struct of process, and a base of comparison between the methods. The chosen database was (Lung Image Database Consortium) (LIDC), because it is a public base, internationally used and has diagnostic to each ROI. Mapa Auto-organizável de Kohonen (Self-Organizing Map) (SOM) and Máquina de Vetor de Suporte (Support Vector Machine) (SVM) was used as classifiers, to trace a study of results among them.As result, SVM achieved more than 85% of accuracy, 86% F-measure, 88% of sensibility and 1,59 of FP/Slice. About SOM, the best parametric configuration resulted in more than 81% of accuracy, 85% of sensibility, 82% F-measure and 2,05 of FP/Slice. Thus, it was possible to deduce that the proposed system presents better score when compared with equivalents methods, and lightly worse when compared with a CAD that has ROIs segmented manually. Based on gathered results, it was possible to ratify the importance and the possibility of CAD applications, as well as presents a new system able to perform equivalent task. CAD Tomograﬁa Computadorizada Detecção Classiﬁcação de Imagens
2	Disorderclassifier: classificação de texto para categorização de transtornos mentais NUNES, Francisca Pâmela Carvalho 23 August 2016 (has links) Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-04-19T13:35:36Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO_Franscisca Pamela Carvalho.pdf: 2272114 bytes, checksum: 83ff79a7d05409b93fe71ce4c307dc30 (MD5) / Made available in DSpace on 2017-04-19T13:35:36Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO_Franscisca Pamela Carvalho.pdf: 2272114 bytes, checksum: 83ff79a7d05409b93fe71ce4c307dc30 (MD5) Previous issue date: 2016-08-23 / Nos últimos anos, através da Internet, a comunicação se tornou mais ampla e acessível. Com o grande crescimento das redes sociais, blogs, sites em geral, foi possível estabelecer uma extensa base de conteúdo diversificado, onde os usuários apresentam suas opiniões e relatos pessoais. Esses informes podem ser relevantes para observações futuras ou até mesmo para o auxílio na tomada de decisão de outras pessoas. No entanto, essa massa de informação está esparsa na Web, em formato livre, dificultando a análise manual dos textos para categorização dos mesmos. Tornar esse trabalho automático é a melhor opção, porém a compreensão desses textos em formato livre não é um trabalho simples para o computador, devido a irregularidades e imprecisões da língua natural. Nessas circunstâncias, estão surgindo sistemas que classificam textos, de forma automática, por tema, gênero, características, entre outros, através dos conceitos da área de Mineração de Texto (MT). A MT objetiva extrair informações importantes de um texto, através da análise de um conjunto de documentos textuais. Diversos trabalhos de MT foram sugeridos em âmbitos variados como, por exemplo, no campo da psiquiatria. Vários dos trabalhos propostos, nessa área, buscam identificar características textuais para percepção de distúrbios psicológicos, para análise dos sentimentos de pacientes, para detecção de problemas de segurança de registros médicos ou até mesmo para exploração da literatura biomédica. O trabalho aqui proposto, busca analisar depoimentos pessoais de potenciais pacientes para categorização dos textos por tipo de transtorno mental, seguindo a taxonomia DSM-5. O procedimento oferecido classifica os relatos pessoais coletados, em quatro tipos de transtorno (Anorexia, TOC, Autismo e Esquizofrenia). Utilizamos técnicas de MT para o pré-processamento e classificação de texto, com o auxilio dos pacotes de software do Weka. Resultados experimentais mostraram que o método proposto apresenta alto índice de precisão e que a fase de pré-processamento do texto tem impacto nesses resultados. A técnica de classificação Support Vector Machine (SVM) apresentou melhor desempenho, para os fins apresentados, em comparação a outras técnicas usadas na literatura. / In the last few years, through the internet, communication became broader and more accessible. With the growth of social media, blogs, and websites in general, it became possible to establish a broader, diverse content base, where users present their opinions and personal stories. These data can be relevant to future observations or even to help other people’s decision process. However, this mass information is dispersing on the web, in free format, hindering the manual analysis for text categorization. Automating is the best option. However, comprehension of these texts in free format is not a simple task for the computer, taking into account irregularities and imprecisions of natural language. Giving these circumstances, automated text classification systems, by theme, gender, features, among others, are arising, through Text Mining (MT) concepts. MT aims to extract information from a text, by analyzing a set of text documents. Several MT papers were suggested on various fields, as an example, psychiatric fields. A number of proposed papers, in this area, try to identify textual features to perceive psychological disorders, to analyze patient’s sentiments, to detect security problems in medical records or even biomedical literature exploration. The paper here proposed aim to analyze potential patient’s personal testimonies for text categorization by mental disorder type, according to DSM-5 taxonomy. The offered procedure classifies the collected personal testimonies in four disorder types (anorexia, OCD, autism, and schizophrenia). MT techniques were used for pre-processing and text classification, with the support of software packages of Weka. Experimental results showed that the proposed method presents high precision values and the text pre-processing phase has impact in these results. The Support Vector Machine (SVM) classification technique presented better performance, for the presented ends, in comparison to other techniques used in literature. Mineração de Texto Classiﬁcação de texto Depoimentos pessoais Transtorno mental Text Mining Text classiﬁcation Personal testimonies Mental disorder
3	Algoritmo kNN na imputação de dados de espectros de massa do tipo MALDI-TOF: uma análise da influência da imputação com kNN sobre o desempenho de classificadores logísticos para identificação de bactérias Santos, Fábio dos 14 September 2018 (has links) Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2018-11-06T17:08:39Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Fábio dos Santos.pdf: 1456053 bytes, checksum: 5ee15a88a68aaef87a46a8f42f816e32 (MD5) / Made available in DSpace on 2018-11-06T17:08:39Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Fábio dos Santos.pdf: 1456053 bytes, checksum: 5ee15a88a68aaef87a46a8f42f816e32 (MD5) Previous issue date: 2018-09-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O processo de identiﬁcação de bactérias relacionadas ao crescimento vegetal,é alvo de diversos estudos na área de bioinformática. Uma das formas para realizar esta identiﬁcação é utilizar dados de espectrometria de massa do tipo MALDI-TOF para detectar a presença de proteínas ribossomaisemumaamostra,eentão,usarclassiﬁcadoresparaprocessarestesdadoseselecionar o rótulo com a maior probabilidade. Durante o processo de geração dos espectros de massa paraclassiﬁcaçãoécomumanãodetecçãodealgumdospicosrelacionadosaproteínasribossomais. Considerando isto, este trabalho apresenta um estudo sobre o uso do algoritmo kNN para imputação desses casos. O estudo foi desenvolvido com o uso de classiﬁcadores logísticos para identiﬁcação de bactérias da espécie Staphylococcus aureus e do gênero Bacillus. Durante os experimentos foram testados três técnicas para imputar dados: imputação com zero, imputação com a média do atributo faltante, e a imputação com kNN. Desta última foram usadas duas abordagens: função de agregação de média e função de agregação de mediana. O protocolo experimental implementado possibilitou avaliar a inﬂuência da imputação sobre os resultados de classiﬁcação sob diferentes cenários no que se refere ao número de variáveis faltantes. Os resultadosobtidosmostramqueoempregodokNNnãolevouàumareduçãododesempenhodos classiﬁcadores, em relação àquele observado quando do uso de dados completos. Além disto, a classiﬁcação de dados submetidos a imputação pelo kNN apresentou desempenho superior àquele veriﬁcado quando do uso dos demais métodos. / It is subject of several studies in bioinformatics area the plant growth promoting bacteria identiﬁcation process. An approach to performing it is to process sample’s ribosomal proteins data obtained by MALDI-TOF mass spectrometry through a classiﬁer and select the highest probability label. However, at the time of mass spectra generation, it is common not detecting some ribosomal proteins related peaks data. With this in mind, this work presents a study about data imputation through the kNN algorithm. Logistic classiﬁers were applied to identify bacteria of the Bacillus genus and the Staphylococcus aureus species while three data imputation techniques were tested: with zero, with the average of the missing attribute, and with kNN algorithm. From this latter imputation technique, two approaches were considered: average aggregation function and median aggregation function. The adopted experimental protocol investigated the imputation inﬂuence on classiﬁcation results under different scenarios regarding missing variablesnumber.TheresultsshowthatbothkNN’sapproachesdidnotpromotesigniﬁcantreduction on classiﬁers’ performance when compared with complete data approach and that the classiﬁcation of imputed data by kNN presented superior performance to that of other considered methods. Imputação com kNN Espectrometria de Massa Regressão Logística Classiﬁcação de Bactérias Imputation with kNN Mass Spectrometry Logistic Regression Bacterial Classiﬁcation
4	Comitê de classiﬁcadores em bases de dados transacionais desbalanceadas com seleção de características baseada em padrões minerados Campos, Camila Maria 29 January 2016 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T14:42:33Z No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-30T15:36:24Z (GMT) No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) / Made available in DSpace on 2017-05-30T15:36:24Z (GMT). No. of bitstreams: 1 camilamariacampos.pdf: 929528 bytes, checksum: ebea02fc47981edfa166a24d9c1d7be2 (MD5) Previous issue date: 2016-01-29 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os resultados dos problemas de classiﬁcação por regras de associação sofrem grande inﬂuência da estrutura dos dados que estão sendo utilizados. Uma diﬁculdade na área é a resolução de problemas de classiﬁcação quando se trata de bases de dados desbalanceadas. Assim, o presente trabalho apresenta um estudo sobre desbalanceamento em bases de dados transacionais, abordando os principais métodos utilizados na resolução do problema de desbalanceamento. Além disso, no que tange ao desbalanceamento, este trabalho propõe um modelo para realizar o balanceamento entre classes, sendo realizados experimentos com diferentes mé- todos de balanceamento e métodos ensemble, baseados em comitê de classiﬁcadores. Tais experimentos foram realizados em bases transacionais e não transacionais com o intuito de validar o modelo proposto e melhorar a predição do algoritmo de classiﬁcação por regras de associação. Bases de dados não transacionais também foram utilizadas nos ex perimentos, com o objetivo de veriﬁcar o comportamento do modelo proposto em tais bases. Outro fator importante no processo de classiﬁcação é a dimensão da base de dados que, quando muito grande, pode comprometer o desempenho dos classiﬁcadores. Neste traba lho, também é proposto um modelo de seleção de características baseado na classiﬁcação por regras de associação. Para validar o modelo proposto, também foram realizados ex- perimentos aplicando diferentes métodos de seleção nas bases de dados. Os resultados da classiﬁcação obtidos utilizando as bases contendo as características selecionadas pelos me- todos, foram comparados para validar o modelo proposto, tais resultados apresentaram-se satisfatórios em relação aos demais métodos de seleção. / The results of Classiﬁcation Based on Associations Rules (CBA) are greatly inﬂuenced by the used data structure. A diﬃculty in this area is solving classiﬁcation problems when it comes to unbalanced databases. Thus, this paper presents a study of unbalance in transactional and non-transactional databases, addressing the main methods used to solve the unbalance problem. In addition, with respect to the unbalance problem, this paper proposes a model to reach the balance between classes, conducting experiments with diﬀerent methods of balancing and ensemble methods based on classiﬁers committee. These experiments were performed in transactional and non-transactional databases, in order to validate the proposed model and improve Classiﬁcation Based on Associations Rules prediction. Another important factor in the classiﬁcation process is database dimensionality, be cause when too large, it can compromise the classiﬁers performance. In this work, it is also proposed a feature selection model based on the rules of CBA. Aiming to validate this model, experiments were also performed applying diﬀerent features selection methods in the databases.The classiﬁcation results obtained using the bases containing the features selected by the methods were compared to validate the proposed model, these results were satisfactory in comparison with other methods of selection. Mineração dados Regra de associação Classiﬁcação Balanceamento em bases de dados Seleção de características Data Mining Association Rule Classification Balancing Database Feature Selection

1

Page generated in 0.0533 seconds