• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 96
  • 21
  • 20
  • 20
  • 20
  • 17
  • 8
  • 3
  • 3
  • 3
  • 3
  • Tagged with
  • 106
  • 106
  • 51
  • 35
  • 35
  • 33
  • 24
  • 24
  • 23
  • 23
  • 22
  • 22
  • 22
  • 21
  • 21
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina

Reis, Esther Camilo dos [UNESP] 23 January 2015 (has links) (PDF)
Made available in DSpace on 2016-08-12T18:48:37Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-01-23. Added 1 bitstream(s) on 2016-08-12T18:50:51Z : No. of bitstreams: 1 000865635.pdf: 6040797 bytes, checksum: 5f2b6ed1c7905636c25068c4edc4c186 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Uma importante questão levantada logo após o primeiro sequenciamento completo do genoma de um organismo foi: quantos genes são essenciais para a vida celular? Experimentos de deleção individual realizados com a bactéria Escherichia coli revelaram que menos de 10% dos seus genes apresentam essa condição, ou seja, a inativação de cada um deles leva a total inviabilidade da bactéria. A teoria de redes fornece uma representação abstrata de um sistema biológico, onde o conjunto de nodos são os componentes biológicos (proteínas, genes, metabólitos, etc) e o conjunto de arestas são as interações de natureza biológica (interação física entre proteínas, interações metabólicas, interações de regulação transcricional, etc) que conectam cada dois componentes biológicos. A posição dos componentes biológicos em uma rede indica sua importância para a manutenção do sistema biológico. De forma geral, componentes localizados em posições centrais em uma rede biológica são aqueles componentes chaves para a integridade do sistema. Neste trabalho, decidimos investigar a posição dos restantes 90% dos genes considerados não-essenciais na rede integrada de interações gênicas (RIG) de E. coli. Especificamente, investigamos os genes condicionalmente essenciais, isto é, genes que são essenciais somente em determinadas condições de estresse. Além disso, investigamos também a posição na rede de pares de genes que constituem interações genéticas agravantes, isto é, pares de genes que quando deletados conjuntamente agravam a viabilidade do organismo. Utilizando uma abordagem puramente computacional baseada em aprendizado de máquina e propriedades topológicas da RIG, nós criamos modelos preditivos de árvores de decisão para definirmos como esses genes condicionalmente essenciais e as interações genéticas agravantes estão distribuídas na RIG. Ainda, uma lista com as probabilidades de classificação de cada... / An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ...
22

Estimativa da irradiação solar global pelo método de Angstrom-Prescott e técnicas de aprendizado de máquinas /

Silva, Maurício Bruno Prado da, 1988. January 2016 (has links)
Orientador: João Francisco Escobedo / Banca: Erico Tadao Teramoto / Banca: Silvia Helena Modenese Gorla da Silva / Resumo: No presente trabalho é descrito o estudo comparativo de métodos de estimativas da irradiação solar global (HG) nas partições diária (HGd) e mensal (HGm): geradas pela técnica de Angstrom-Prescott (A-P) e duas técnicas de Aprendizado de Máquina (AM), Máquinas de Vetores de Suporte (MVS) e Redes Neurais Artificiais (RNA). A base de dados usada foi medida no período de 1996 a 2011, na Estação Solarimétrica em Botucatu. Por meio da regressão entre a transmissividade atmosférica (HG/HO) e razão de insolação (n/N), o modelo estatístico (A-P) foi determinado, obtendo equações lineares que permitem estimar HG com elevados coeficientes de determinação. As técnicas, MVS e RNA, foram treinadas na mesma arquitetura de A-P (modelo 1). As técnicas MVS e RNA foram treinadas ainda em mais 3 modelos com acréscimos, uma a uma, das variáveis temperatura do ar, precipitação e umidade relativa (modelos 2, 3 e 4). Os modelos foram validados usando uma base de dados de dois anos, denominadas de típico e atipico, por meio de correlações entre os valores estimados e medidos, indicativos estatísticos rMBE, MBE, rRMSE, RMSE e d de Willmott. Os indicativos estatísticos r das correlações mostraram que o modelo (A-P) pode estimar HG com elevados coeficientes de determinação nas duas condições de validação. Já indicativos estatísticos rMBE, MBE, rRMSE, RMSE e d de Willmott indicam que o modelo (A-P) pode ser utilizado na estimativa de HGd com exatidão e precisão. Os indicativos estatísticos obtidos pelos 4 modelos das técnicas MVSd e RNAd (diária) e MVSm e RNAm (mensal) podem ser utilizadas nas estimativas de HGd com elevadas correlações e com precisão e exatidão. Entre os modelos foram selecionadas por comparação entre os indicativo estatisticos as redes MVS4d e RNA4d ... / Abstract: In this paper describes the comparative study of different methods for estimating global solar irradiation (HG) in the daily partitions (HGd) and monthly (HGm): generated by Angstrom-Prescott (AP) and two machine learning techniques (ML), Support Vector Machines (SVM) and Artificial Neural Networks (ANN). The used database was measured from 1996 to 2011, in Solarimetric station in Botucatu. Through regression between atmospheric transmissivity (HG / HO) and insolation ratio (n / N), the statistical model (A-P) was determined, obtaining linear equations that allow estimating HG with high coefficients of determination. The techniques, svm and ANN, were trained on the same architecture of A-P (model 1). The SVM and ANN techniques were further trained on the most models with 3 additions, one by one, the variable air temperature, rainfall and relative humidity (model 2, 3 and 4 ). The models were validated using a database of two years, called of typical and atypical, with correlation between estimated and measured values, statistical indications: rMBE, MBE, rRMSE, RMSE, and d Willmott. The statistical indicative of correlations coefficient (r) showed that the model (A-P) can be estimated with high HG determination coefficients in the two validation conditions. The rMBE, MBE, rRMSE, RMSE Willmott and d indicate that the model (A-P) can be used to estimate HGD with accuracy and precision. The statistical indicative obtained by the four models of technical SVMd and ANNd (daily) and SVMm and ANNm (monthly) can be used in the estimates of HGD with high correlations and with precision and accuracy. Among the models were selected by comparing the indicative statistical SVM4d and ANN4d networks (daily) and SVM1m and ANN1m (monthly). The comparison of statistical indicative rMBE, MBE, rRMSE, RMSE, d Willmott, r and R2 obtained in the validation of the models (A-P), SVM and ANN showed that: the SVM technique ... / Mestre
23

Classificação de ambientes prediais para usuários utilizando tags RFID ativas e filtro de Kalman

Silva Júnior, Cristovam Albano da 21 August 2012 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2012. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2013-01-31T15:46:56Z No. of bitstreams: 1 2012_CristovamAlbanoSilvaJunior.pdf: 2422961 bytes, checksum: 1b2427ea94d6f7ef03e86fb917635ad1 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2013-03-22T11:33:10Z (GMT) No. of bitstreams: 1 2012_CristovamAlbanoSilvaJunior.pdf: 2422961 bytes, checksum: 1b2427ea94d6f7ef03e86fb917635ad1 (MD5) / Made available in DSpace on 2013-03-22T11:33:10Z (GMT). No. of bitstreams: 1 2012_CristovamAlbanoSilvaJunior.pdf: 2422961 bytes, checksum: 1b2427ea94d6f7ef03e86fb917635ad1 (MD5) / RFID e outras tecnologias sem fio têm sido objeto de estudo em aplicações de localização de usuários em ambientes internos de edificações. Existem diferentes formas de se prover a localização com as variáveis disponibilizadas por estes sistemas, sendo uma das mais populares, a utilização do RSSI como referência, pois esta grandeza possui relação com a distância entre o transmissor e o receptor do sinal. Entretanto, promover a localização em ambientes internos de edificações com o RSSI não é trabalho tão trivial, pois o sinal RF sofre interferências diversas, próprias do canal de comunicação RF em ambientes internos e de difícil modelagem, durante seu trajeto, ocasionando muita incerteza nos valores registrados pelos equipamentos que compõe o sistema RFID. Elas podem ser minimizadas através da aplicação de ferramentas computacionais como o filtro de Kalman e as redes neurais MLP e LVQ ou as SVM, treinadas com amostras de sinal que representem de forma qualitativa a área em que será provida a localização. O presente trabalho compara o desempenho destas ferramentas computacionais aplicadas a um banco de dados coletado de um sistema de RFID com tags ativas disponibilizado no LARA para experimentos. Tal sistema será usado para a classificação de ambientes delimitados do LARA, onde estarão usuários portadores das tags RFID, para assim controlar o sistema de climatização daquele laboratório. ______________________________________________________________________________ ABSTRACT / RFID and others technologies have been object of study in applications of indoor localization. There are different ways of providing localization with the variables provided by these systems, one of the most popular is the use of RSSI as the reference, since it has relation with the distance between the transmitter and the receiver of the signal. However, to provide the indoor localization with RSSI is not so trivial, because the RF signal suffers from various interferences, own of RF indoor communication channel and its very difficult modeling, during its course, causing much uncertainty on the registered values of RSSI by the equipments of RFID system. These uncertainties can be minimized by the application of some computational tools such as Kalman Filter and classifiers as MLP or LVQ neural networks, or the SVM, trained with signal samples that represent in a qualitative form the area in that the localization will be provided. This work compares the performance of this computational tools applied to the data collected from an RFID system with active tags, available in LARA to the experiments, and that will be used to classify some delimited environment of LARA, where users with RFID tags will be, and then control the HVAC system of that laboratory.
24

Redes probabilísticas fuzzy naive bayes

Moura, Gabriel Barreto January 2016 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016 / Made available in DSpace on 2016-09-20T04:19:30Z (GMT). No. of bitstreams: 1 341498.pdf: 2702580 bytes, checksum: ac52d986bff31a48f53a987366f89c76 (MD5) Previous issue date: 2016 / Redes bayesianas são modelos gráficos probabilísticos capazes de modelar a incerteza estocástica e são vastamente aplicados em vários problemas de classificação. Especificamente, a estrutura naïve bayes são largamente utilizadas devido aos bons resultados atingidos, apesar da sua estrutura simples e 'ingênua'. Sistemas fuzzy, por outro lado, são modelos bem conhecidos para lidar com a imprecisão linguística por representar o conhecimento através de regras e funções de pertinências simples e interpretáveis. Porém, sistemas fuzzy tradicionais não são capazes de modelar a incerteza estocástica e, por isso, sistemas fuzzy probabilísticos foram desenvolvidos de forma a levar em consideração ambas as incertezas. Neste trabalho é proposta a rede probabilística fuzzy naïve bayes, uma combinação de sistemas fuzzy probabilísticos e redes bayesianas naïve, também capaz de modelar ambas as incertezas simultaneamente. O modelo proposto é primeiramente aplicado a um problema simples e didático de classificação para demonstrar o seu potencial e vantagem em relação a classificadores naïve bayes, enquanto mantém-se a interpretabilidade do modelo tradicional. Para testar o modelo, experimentos foram realizados em conjuntos de dados de benchmark e seus resultados são comparados a modelos de outros autores que utilizam os mesmos conjuntos de dados. A rede proposta apresenta resultados levemente inferiores a outros modelos. Porém, é observada uma vantagem qualitativa da rede proposta devido a seu alto nível de interpretabilidade.<br> / Abstract: Bayesian networks are probabilistic graphical models capable of modeling statistical uncertainty and are widely applied in many classification problems. Specifically, Naive Bayesian networks are largely used due to their simple, naive structure, while still producing precise results. Fuzzy systems, on the other hand, are a well known technique capable of dealing with linguistic vagueness by representing knowledge with simple and interpretable rules and membership functions. As traditional fuzzy systems are unable to model statistical uncertainty, Probabilistic Fuzzy Systems were developed in order to account for both kinds of uncertainties. In this work we propose the Probabilistic Fuzzy Naive Bayes classifier as a combination of both probabilistic fuzzy systems and naive bayesian networks, also capable of simultaneously modeling both kinds of uncertainties. The proposed model is firstly applied in a very simple classification problem in order to show its potential and advantage over traditional naive bayes classifiers, while maintaining their interpretability. For validation, experiments were done using benchmark classification data sets from the UCI machine learning repository and the results are then compared with other similar alternate methods.
25

Utilização de machine learning para categorização dos gastos de bitcoin no Brasil

Tomé, Vívian Tostes 05 May 2017 (has links)
Submitted by Vívian Tostes Tomé (vivian.tome@gmail.com) on 2017-05-31T11:46:45Z No. of bitstreams: 1 Dissertação -Vívian Tomé.pdf: 1176937 bytes, checksum: 6e9a444829b379507464c4bbb965430c (MD5) / Approved for entry into archive by Leiliane Silva (leiliane.silva@fgv.br) on 2017-06-01T20:49:33Z (GMT) No. of bitstreams: 1 Dissertação -Vívian Tomé.pdf: 1176937 bytes, checksum: 6e9a444829b379507464c4bbb965430c (MD5) / Made available in DSpace on 2017-06-23T12:38:38Z (GMT). No. of bitstreams: 1 Dissertação -Vívian Tomé.pdf: 1176937 bytes, checksum: 6e9a444829b379507464c4bbb965430c (MD5) Previous issue date: 2017-05-05 / A criptomoeda Bitcoin trouxe inovação para o sistema de pagamento internacional, proporcionando uma maneira simples de transferir fundos ao redor do mundo com um certo grau de anonimato. Com isso, também tornou mais fácil a venda de bens e serviços ilícitos no mercado negro. Além disso, as moedas virtuais se mostraram atraentes para os investidores devido às flutuações do seu preço. Esta tese visa explicar por que as pessoas compram bitcoins no Brasil, por meio da análise do destino das moedas virtuais originadas nas exchanges brasileiras. A análise consiste em duas etapas. Primeiro, os endereços de destino são pesquisados na web para descobrir quem é o proprietário. Em seguida, os endereços conhecidos são categorizados e usados para treinar um classificador de aprendizagem de máquina. Assim, os endereços não-identificados poderão ser submetidos ao classificador para descobrir o perfil dos brasileiros que adquirem bitcoins. / The cryptocurrency Bitcoin brought innovation to the international payment system, providing a simple way to transfer funds around the world with a certain level of anonymity. This also facilitated the sale of illicit goods and services in the dark marketplace. In addition, virtual coins became attractive to investors due its price's fluctuations. This thesis aims to explain why people buy bitcoins in Brazil by analyzing the destination of the virtual coins originated from Brazilian exchanges. The analysis consists in two steps. First, the destination addresses are searched in the web to find out who is the owner. Second, the known addresses are categorized and used to train a machine learning classifier. Thus, the non-identified addresses can be submitted to the classifier to find out the profile of Brazilians bitcoin buyers.
26

Análise de sentimento para textos curtos

Avila, Gustavo Vianna 10 March 2017 (has links)
Submitted by Gustavo Vianna Avila (guavila@gmail.com) on 2017-03-30T18:26:08Z No. of bitstreams: 1 FGV EMAp - Gustavo Avila - Análise de Sentimento para Textos Curtos.pdf: 1066914 bytes, checksum: 245f39102b78290b281cc9f68239d26d (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2017-04-07T15:10:23Z (GMT) No. of bitstreams: 1 FGV EMAp - Gustavo Avila - Análise de Sentimento para Textos Curtos.pdf: 1066914 bytes, checksum: 245f39102b78290b281cc9f68239d26d (MD5) / Made available in DSpace on 2017-04-12T19:10:52Z (GMT). No. of bitstreams: 1 FGV EMAp - Gustavo Avila - Análise de Sentimento para Textos Curtos.pdf: 1066914 bytes, checksum: 245f39102b78290b281cc9f68239d26d (MD5) Previous issue date: 2017-03-10 / A huge number of short informal messages are posted every day in social network sites, discussion forums and customer surveys. Emotions seem to be frequently important in these texts. The challenge of identifying and understanding an emotion present in this type of communication is important in distinguishing the sentiment in the text and also in identifying anomalous and inappropriate behaviors, eventually offering some kind of risk. This work proposes the implementation of a sentiment analysis solution based on machine learning. Using supervised learning techniques, it is desired to discern whether a message has a positive, neutral, or negative sentiment. The messages to be analyzed are IT service satisfaction surveys. Two models were used in the analysis, the first model where only the ”Comment”, a nonstructured text field was considered and the second model, where besides the ”Comment”field, two objective questions were considered. The results obtained indicate that the techniques of machine learning, are not behind the results produced by human-produced baselines. The accuracy obtained was up to 86.8% accuracy for a three class model: ”praise”, ”neutral”and ”complaint”. Accuracy was significantly higher, reaching up to 94.5 % in an alternative model of only two classes: ”praise”and ”non-praise”. / Um grande número de mensagens curtas informais são postadas diariamente em redes sociais, fórums de discussão e pesquisas de satisfação. Emoções parecem ser importantes de forma frequente nesses textos. O desafio de identificar e entender a emoção presente nesse tipo de comunicação é importante para distinguir o sentimento presente no texto e também para identificar comportamentos anômalos e inapropriados, eventualmente oferecendo algum tipo de risco. Este trabalho propõe a implementação de uma solução para a análise de sentimento de textos curtos baseada em aprendizado por máquina. Utilizando técnicas de aprendizado supervisionado, é desejado discernir se uma mensagem possui sentimento positivo, neutro ou negativo. As mensagens a serem analisadas serão pesquisas de satisfação de serviços de TI. Foram utilizados nas análises dois modelos, o primeiro modelo onde apenas o campo de texto livre "Comentário" foi considerado e o segundo modelo, onde além do campo de texto livre "Comentário", foram consideradas, adicionalmente, duas perguntas objetivas da pesquisa de satisfação. Os resultados obtidos indicam que as técnicas utilizadas de aprendizado por máquina, não ficam atrás dos resultados produzidos por aprendizado humano. A acurácia obtida foi de até 86,8% de acerto para um modelo de três classes: "elogio", "neutro" e "reclamação". A acurácia foi significativamente superior, alcançando até 94,5% em um modelo alternativo, de apenas duas classes: "elogio" e "não-elogio".
27

[en] PROBABILISTIC LATENT SEMANTIC ANALYSIS APPLIED TO RECOMMENDER SYSTEMS / [pt] ANÁLISE PROBABILÍSTICA DE SEMÂNTICA LATENTE APLICADA A SISTEMAS DE RECOMENDAÇÃO

DIOGO SILVEIRA MENDONCA 03 March 2009 (has links)
[pt] Os sistemas de recomendação são um tema de pesquisa constante devido a sua grande quantidade de aplicações práticas. Estes sistemas podem ser abordados de diversas maneiras, sendo uma das mais utilizadas a filtragem colaborativa, em que para recomendar um item a um usuário são utilizados dados de comportamento de outros usuários. Porém, nem sempre os algoritmos de filtragem colaborativa atingem níveis de precisão necessários para serem utilizados em aplicações reais. Desta forma este trabalho tem como objetivo avaliar o desempenho da análise probabilística de semântica latente (PLSA) aplicado a sistemas de recomendação. Este modelo identifica grupos de usuários com comportamento semelhante através de atributos latentes, permitindo que o comportamento dos grupos seja utilizado na recomendação. Para verificar a eficácia do método, apresentamos experimentos com o PLSA utilizando os problemas de recomendação de anúncios na web e a recomendação de filmes. Evidenciamos uma melhoria de 18,7% na precisão da recomendação de anúncios na web e 3,7% de melhoria no erro quadrático sobre a Média das Médias para o corpus do Netflix. Além dos experimentos, o algoritmo foi implementado de forma flexível e reutilizável, permitindo adaptação a outros problemas com esforço reduzido. Tal implementação também foi incorporada como um módulo do LearnAds, um framework de recomendação de anúncios na web. / [en] Recommender systems are a constant research topic because of their large number of practical applications. There are many approaches to address these problems, one of the most widely used being collaborative filtering, in which in order to recommend an item to a user, data of other users` behaviors are employed. However, collaborative filtering algorithms do not always reach levels of precision required for the use in real applications. Within this context, the present work aims to evaluate the performance of the probabilistic latent semantic analysis (PLSA) applied to recommender systems. This model identifies groups of users with similar behaviors through latent attributes, allowing the use of these behaviors in the recommendation. To check the effectiveness of the method, there were presented experiments with problems of both web ad recommending and film recommending. An improvement of 18,7% were found in the accuracy of the recommendation of ads on the web and we also found 3.7% of improvement in Root Mean Square Error over the Means of Means baseline system for the Netflix corpus. Apart from the aforementioned experiments, the algorithm was implemented in a flexible and reusable way, allowing its adaptation to other problems with reduced effort. This implementation has also been incorporated as a module of LearnAds, a framework for the recommendation of ads on the web.
28

Paralelização do algoritmo DIANA com OpenMP e MPI /

Ribeiro, Hethini do Nascimento. January 2018 (has links)
Orientador: Roberta Spolon / Banca: Kelton Augusto Pontara da Costa / Banca: Anderson Francisco Talon / Resumo: No início desta década havia cerca de 5 bilhões de telefones em uso gerando dados. Essa produção global aumentou aproximadamente 40% ao ano no início da década passada. Esses grandes conjuntos de dados que podem ser capturados, comunicados, agregados, armazenados e analisados, também chamados de Big Data, estão colocando desafios inevitáveis em muitas áreas e, em particular, no campo Machine Learning. Algoritmos de Machine Learning são capazes de extrair informações úteis desses grandes repositórios de dados e por este motivo está se tornando cada vez mais importante o seu estudo. Os programas aptos a realizarem essa tarefa podem ser chamados de algoritmos de classificação e clusterização. Essas aplicações são dispendiosas computacionalmente. Para citar alguns exemplos desse custo, o algoritmo Quality Threshold Clustering tem, no pior caso, complexidade O(�����������������5). Os algoritmos hierárquicos AGNES e DIANA, por sua vez, possuem O(n²) e O(2n) respectivamente. Sendo assim, existe um grande desafio, que consiste em processar grandes quantidades de dados em um período de tempo realista, encorajando o desenvolvimento de algoritmos paralelos que se adequam ao volume de dados. O objetivo deste trabalho é apresentar a paralelização do algoritmo de hierárquico divisivo DIANA. O desenvolvimento do algoritmo foi realizado em MPI e OpenMP, chegando a ser três vezes mais rápido que a versão monoprocessada, evidenciando que embora em ambientes de memória distribuídas necessite de... / Abstract: Earlier in this decade there were about 5 billion phones in use generating data. This global production increased approximately 40% per year at the beginning of the last decade. These large datasets that can be captured, communicated, aggregated, stored and analyzed, also called Big Data, are posing inevitable challenges in many areas, and in particular in the Machine Learning field. Machine Learning algorithms are able to extract useful information from these large data repositories and for this reason their study is becoming increasingly important. The programs that can perform this task can be called classification and clustering algorithms. These applications are computationally expensive. To cite some examples of this cost, the Quality Threshold Clustering algorithm has, in the worst case, complexity O (n5). The hierarchical algorithms AGNES and DIANA, in turn, have O (n²) and O (2n) respectively. Thus, there is a great challenge, which is to process large amounts of data in a realistic period of time, encouraging the development of parallel algorithms that fit the volume of data. The objective of this work is to present the parallelization of the DIANA divisive hierarchical algorithm. The development of the algorithm was performed in MPI and OpenMP, reaching three times faster than the monoprocessed version, evidencing that although in distributed memory environments need synchronization and exchange of messages, for a certain degree of parallelism it is advantageous ... / Mestre
29

Um sistema inteligente que prevê a produtividade do algodão em imagens de lavouras comerciais /

Oliveira, Danilo Tedesco de. January 2019 (has links)
Orientador: Rouverson Pereira da Silva / Coorientador: Walter Maldonado Jr. / Coorientador: Cristiano Zerbato / Resumo: Uma maneira de melhorar a qualidade da operação de colheita mecanizada do algodão é alterar as configurações e regulagens de colhedora ao longo do processo de acordo com informações que podem ser adquiridas durante a própria colheita. Acreditamos que a previsão da produtividade pode se tornar uma informação de grande importância no gerenciamento da qualidade da operação, visando ao aumento da eficiência e redução das perdas no processo. Portanto, nessa pesquisa apresentamos o desenvolvimento de um sistema inteligente capaz de prever a produtividade do algodão em imagens coloridas, adquiridas por um dispositivo mobile simples. Propomos uma abordagem robusta às condições ambientais, treinando algoritmos de detecção com imagens adquiridas em diferentes horários ao longo do dia. Os resultados experimentais para o modelo SSD Mobilenet V1 indicaram que é possível realizar a contagem dos capulhos presentes nas imagens adquiridas em diferentes horários ao longo do dia, com erros médios de 8.84% (~5 capulhos). Além disso, avaliando a previsão da produtividade em 204 imagens do conjunto de dados de teste, o erro foi igual à 11%. Esse valor representa variações de até 11.90 gramas entre cada previsão. / Abstract: The predict of yield before the mechanized harvesting of a cotton crop depends on the rigorous collection of data in the field, making it impossible to perform in large areas. We believe that this prediction can become a very important information in the management of the quality of the operation. Therefore, in this research we present the development of an intelligent system capable of predicting the productivity of cotton in images acquired by a simple mobile device. We propose a robust approach to environment conditions by training detection algorithms with images acquired at different times throughout the day. The experimental results for the Mobilenet V1 SSD model indicated that it is possible to count the bolls present in the images acquired at different times throughout the day, with average errors of 8.84%. In addition, evaluating the productivity forecast in 204 images of the test dataset, the error was equal to 11%, this value represents variations of up to 11.90 grams between predictions. In future studies we will evaluate the performance of this system to perform the counting of the bolls and predict the productivity of cotton in real time during the mechanized harvesting operation. / Mestre
30

Segmentação interativa de imagens utilizando competição e cooperação entre partículas

Silva, Bárbara Ribeiro da [UNESP] 13 October 2015 (has links) (PDF)
Made available in DSpace on 2016-05-17T16:51:39Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-10-13. Added 1 bitstream(s) on 2016-05-17T16:55:22Z : No. of bitstreams: 1 000863304.pdf: 2077644 bytes, checksum: b840a93c470319804fb7f313d43a5e9a (MD5) / Para estudar e classificar imagens é necessário entender as subdivisões que elas apresentam. Para esta finalidade existem técnicas de segmentação de imagens, uma das tarefas de visão computacional, a qual consiste na repartição de uma imagem digital em múltiplos segmentos, regiões ou objetos, com o intuito de facilitar a análise e compreensão. Métodos de segmentação de imagens são frequentemente utilizados para localizar objetos e bordas em imagens. Para tal tarefa, frequentemente são empregados algoritmos de aprendizado de máquina; disciplina científica que trata do projeto e desenvolvimento de algoritmos que melhoram automaticamente com a experiência, imitando o comportamento de aprendizado humano. O processo de aprendizado de máquina pode ser utilizado de diferentes formas, no entanto a categoria de aprendizado semi-supervisionado foi a que melhor se adaptou à proposta deste projeto. Esta categoria representa uma mescla entre o aprendizado supervisionado e o aprendizado não-supervisionado e trabalha com ambos os dados rotulados e não rotulados em sua fase de treinamento, proporcionando o uso de características individuais e/ou por conjunto. Diante da necessidade de combinação do aprendizado semi-supervisionado com a segmentação de imagem, foram estudadas formas de se utilizar informação provenientes de imagens para alimentar o aprendizado de máquina semi-supervisionado. Como resultado deste estudo, o algoritmo de aprendizado semi-supervisionado conhecido como competição e cooperação entre partículas foi estendido para a aplicações na tarefa de segmentação interativa de imagens. Na imagem de entrada, alguns pixels são classificados pelo usuário e servem como pixels de partida para o algoritmo. Estes pontos pré-rotulados são utilizados para criar as partículas no modelo utilizado. Também foram alterados alguns parâmetros de execução e partes estruturais do algoritmo de forma a otimizar a... / To study and classify images it is necessary to understand the subdivisions they present. For this purpose there are image segmentation techniques, one of the computer vision tasks, which consists in the distribution of a digital image into multiple segments, regions or objects, in order to facilitate analysis and understanding. Image segmentation methods are often used for locating objects in images and borders. For this task, machine learning algorithms are often employed; scientific discipline that deals with the design and development of algorithms that automatically improve with experience, imitating the human learning behavior. The machine learning process can be used in different ways, however the category that best adapted to the project proposal, which represents a blend of supervised learning and unsupervised learning, called semi-supervised learning. Such category of algorithms works with both labelled and unlabelled data in their training phase, allowing the use of individual characteristics and or per set. Given the necessity of combining semi-supervised learning with image segmentation, some means of using information delivered from image to feed the semi-supervised learning machine were studied. As a result of this study, the semi-supervised learning algorithm known as competition and cooperation among particles was extended to be applied in the interactive image segmentation task. In the input image, some pixels are classified by the user and serve as a starting pixels to the algorithm. These pre-labeled points are used to create particles in the proposed model. Also, some parameters and algorithm structures were changed to optimize the classification and means of expressing the results in order to make it more suitable for the image segmentation task

Page generated in 0.0991 seconds