141 |
NavegaÃÃo em redes espacialmente correlacionadas. / Navigation in a spatially correlated networkSaulo Davi Soares e Reis 30 January 2009 (has links)
Conselho Nacional de Desenvolvimento CientÃfico e TecnolÃgico / Um nÃmero significativo de redes reais apresentam caracterÃsticas espaciais bem definidas. NÃs estudamos como topologias de redes espacialmente correlacionadas podem influenciar processos de navegaÃÃo atravÃs das mesmas. Para isso estudamos o comportamento do mÃnimo caminho mÃdio para redes definidas dentro de modelo de Kleinberg para analisar a navegaÃÃo ditada por regras de conhecimento global. O modelo que Kleinberg caracteriza-se por permitir conexÃes de longo alcance entre dois vÃrtices u e v distribuÃdas por uma distribuiÃÃo de probabilidade em lei de potÃncia. Para um melhor entendimento das caracterÃsticas topolÃgicas apresentadas por essa famÃlia de redes, nÃs aplicamos o modelo epidÃmico suscetÃvel-infectado-suscetÃvel (SIS), e com isso verificamos que o modelo de Kleinberg apresenta fenÃmeno de mundo pequeno apenas para uma determinada faixa de valores assumidos pelo expoente de agregaÃÃo α. Em seguida, introduzimos um modelo de redes espacialmente embutidas, conceitualmente inspirado no modelo de Kleinberg. Este traduz-se na introduÃÃo de um vÃnculo para a distribuiÃÃo das conexÃes de longo alcance. Associamos este vÃnculo a um possÃvel custo envolvido no processo de adiÃÃo de novas conexÃes de longo alcance à rede. Estudamos como esse vÃnculo no custo afeta a navegaÃÃo na rede, tendo como base de comparaÃÃo os trabalhos de Kleinberg para a navegaÃÃo com conhecimento local da topologia, e nossos resultados considerando a navegaÃÃo com conhecimento global. / A significant number of real networks have well-defined spatial characteristics. We studied how network with spatially correlated topolgies can influence the processes of navigation through them. For this, we study the behavior of the average shortest-path length to networks defined within Kleinbergâs model [1, 2] to analyze the navigation dictated by rules of global knowledge. The Kleinbergâs model is characterized by allowing long-range connections between two vertices u and v distributed by a power-law probability distribution. For a better understanding of the topological characteristics presented by this family of networks, we applied the epidemic model susceptible-infected-susceptible (SIS) and we found that, we see that the Kleinbergâs model presents the small-world phenomenon only for a certain range of values of the clustering exponent α. We introduced a model of spatially embedded networks, conceptually based on the Kleinbergâs model. This model consist in introduction of a constrain to the distribution of long-range connections. We associate his constrain to a possible cost involved in the process of adding new long-range connections to the network. We studied how this cost constrain affects the navigation through the system, taking as a basis for comparison the work of Kleinberg for navigation with local knowledge, and our results conserning for navigation with global knowledge.
|
142 |
Dinâmica molecular e redes complexas no estudo da difusão térmica em xilanases da família 11 / Molecular dynamics and complex networks in the study of thermal diffusion in family 11 xylanasesLuciano Borges Censoni 25 July 2013 (has links)
Proteínas tipicamente são capazes de manter a sua conformação funcional somente dentro de um intervalo limitado de temperaturas. A despeito do maquinário sofisticado de manutenção da homeostase celular, é sabido que uma variedade de fenômenos moleculares são capazes de induzir desequilíbrios localizados de energia vibracional, e que a eficiência com que cada proteína dissipa estas perturbações pode estar relacionada com a sua tolerância a altas temperaturas. No entanto, a transferência de energia térmica entre diferentes segmentos de uma cadeia proteica é difícil de caracterizar experimentalmente. Uma alternativa teórica para a investigação destes mecanismos é o emprego de simulações de Dinâmica Molecular, particularmente associadas à técnica de Difusão Térmica Anisotrópica (ATD). Aqui, verificamos a possibilidade de empregar conceitos da teoria de Redes Complexas para construir modelos para estruturas de proteínas, e por meio destes identificar resíduos com capacidade significativa de dissipar perturbações térmicas. Investigamos os diversos protocolos de construção de modelos de rede para proteínas encontrados na literatura, e utilizamos dados experimentais representativos da base SCOP para calcular com rigor os parâmetros numéricos necessários. Produzimos uma definição precisa para o conceito de contato entre resíduos de aminoácidos, e a partir desta calculamos a centralidade de cada resíduo. Com isto, demonstramos que, em um conjunto de Xilanases para as quais dispomos de dados de ATD, a capacidade de difundir perturbações térmicas é fortemente correlacionada com a centralidade de proximidade de cada resíduo, fornecendo argumentos para o uso de modelos de rede para estudar a termoestabilidade de proteínas. / Proteins are typically able to mantain a functional conformation only within a narrow range of temperatures. In spite of the complex cellular homeostatic machinery, it is known that a variety of molecular phenomena can induce localized vibrational imbalances, and that the efficiency with which each protein dissipates these perturbations may be related to its tolerance of higher temperatures. The transference of thermal energy among different sections of a protein chain is, however, hard to characterize experimentally. A theoretical alternative for the investigation of these mechanisms is the use of Molecular Dynamics simulations, particularly when associated with the Anisotropic Thermal Diffusion (ATD) technique. In this work, we verify the possibility of using concepts from Network Theory to construct models for protein structures, and using those to reveal residues with significant ability to dissipate thermal perturbations. We investigate several protocols of network model construction for proteins present in the literature, and we study representative experimental data from the SCOP database to rigorously calculate the necessary parameters. We produce a precise definition for the concept of contact between amino acid residues, and from this we calculate the centrality of each residue. We then show that, in a set of Xylanases for which we have data from ATD experiments, the ability to dissipate thermal perturbations is highly correlated to the closeness centrality of each residue, providing arguments for the use of network models to study protein thermal stability.
|
143 |
Comparação e análise da rede de movimento de bovinos de propriedades positivas e negativas para brucelose no Estado de Mato Grosso / Comparison and analysis of the network of cattle movement from positive and negative holdings to brucellosis in the State of Mato GrossoRafael Ishibashi Cipullo 05 April 2013 (has links)
Uma análise da rede de movimentação de bovinos entre estabelecimentos do Estado de Mato Grosso foi realizada utilizando os dados das guias de trânsito animal (GTA) emitidas durante o ano de 2007. A utilização de parâmetros descritivos da rede de movimentação de bovinos permitiu a caracterização da intensidade de comercialização de bovinos entre os estabelecimentos. Os parâmetros calculados foram: grau (entrada e saída), betweenness, closeness, coeficiente de aglomeração e PageRank. Dados referentes ao status das propriedades (foco ou livre de brucelose) obtidos do banco de dados do levantamento para brucelose bovina do Programa Nacional de Controle e Erradicação da Brucelose e da Tuberculose Animal (PNCEBT) foram utilizados para comparar os parâmetros das propriedades positivas e negativas para brucelose. A comparação foi realizada pelo teste de Mann Whitney e foi encontrada diferença estatisticamente significante (P< 0,05) apenas para os parâmetros grau total e de saída ponderados por número de animais e ponderados por número de lotes movimentados. A análise descritiva da rede de movimentação de bovinos mostra que a distribuição de valores para todos os parâmetros, exceto o closeness, seguiu qualitativamente a Lei de potências. As informações obtidas são importantes para auxiliar em medidas de controle e prevenção de doenças em rebanhos bovinos, como a brucelose. / An analysis of the network of cattle movement between farm premises of the state of Mato Grosso was carried out using data from the records of animal transit (GTA) collected during 2007. The use of descriptive parameters of the network of movement allowed the characterization of the intensity of bovine trade between the farm premises. The parameters calculated were: degree (incoming and outgoing), betweenness, closeness, clustering coefficient and PageRank. The database concerning the status of the premises (positive or brucellosis free) obtained from the survey for bovine brucellosis of National Programme for Control and Eradication of Brucellosis and Tuberculosis Animal (PNCEBT) was used to compare the parameters of positive and negative premises for brucellosis. The comparison was done by using the Mann Whitney test and found a statistically significant difference (P <0.05) for the parameters total degree and outgoing degree weighted by number of animals and number of batches. The descriptive analysis of the network of bovine movements showed that the distribution of values for all parameters, except the closeness, qualitatively followed a power law. The information obtained is important to assist in control measures and prevention of diseases in cattle herds, such as brucellosis.
|
144 |
Canalização: fenótipos robustos como consequência de características da rede de regulação gênica / Canalization: phenotype robustness as consequence of characteristics of the gene regulatory networkVitor Hugo Louzada Patricio 20 April 2011 (has links)
Em sistemas biológicos, o estudo da estabilidade das redes de regulação gênica é visto como uma contribuição importante que a Matemática pode proporcionar a pesquisas sobre câncer e outras doenças genéticas. Neste trabalho, utilizamos o conceito de ``canalização\'\' como sinônimo de estabilidade em uma rede biológica. Como as características de uma rede de regulação canalizada ainda são superficialmente compreendidas, estudamos esse conceito sob o ponto de vista computacional: propomos um modelo matemático simplificado para descrever o fenômeno e realizamos algumas análises sobre o mesmo. Mais especificamente, a estabilidade da maior bacia de atração das redes Booleanas - um clássico paradigma para a modelagem de redes de regulação - é analisada. Os resultados indicam que a estabilidade da maior bacia de atração está relacionada com dados biológicos sobre o crescimento de colônias de leveduras e que considerações sobre a interação entre as funções Booleanas e a topologia da rede devem ser realizadas conjuntamente na análise de redes estáveis. / In biological systems, the study of gene regulatory networks stability is seen as an important contribution that Mathematics can make to cancer research and that of other genetic diseases. In this work, we consider the concept of ``canalization\'\' as a consequence of stability in gene regulatory networks. The characteristics of canalized regulatory networks are superficially understood. Hence, we study the canalization concept under a computational framework: a simplified model is proposed to describe the phenomenon using Boolean Networks - a classical paradigm to modeling regulatory networks. Specifically, the stability of the largest basin of attraction in gene regulatory networks is analyzed. Our results indicate that the stability of the largest basin of attraction is related to biological data on growth of yeast colonies, and that thoughts about the interaction between Boolean functions and network topologies must be given in the analysis of stable networks.
|
145 |
Modelagem de grãos confinados em invólucros utilizando redes complexas e métodos de imagem / Confined grain modeling using complex networks and image processing methodsGustavo Vrech Rigo 11 June 2015 (has links)
A formação de arcos – estruturas que promovem a anisotropia de forças dentro de um sistema – acontece corriqueiramente dentro de silos ou maquinaria agrícola. A presente tese propõe um modelo baseado em redes complexas para modelar tal fenômeno, definindo cada grão como vértice e a força que dois grãos trocam como o peso de uma ligação entre eles. A partir de ensaios tomográficos de 11 diferentes tipos de grãos foi desenvolvido um método para transformar cada uma das imagens tridimensionais resultantes numa rede complexa. Cada imagem foi pré-processada e submetida a uma transformada watershed utilizando como marcadores internos a erosão da própria imagem. Este processo tridimensional resultou na segmentação de cada um dos grãos da imagem original, tornando possível a extração de propriedades físicas de cada grão, como massa, centro de massa, momento de inércia, e as forças às quais este está submetido. A partir destes dados, a rede complexa de cada uma das 11 amostras foi construída. A amostra da soja foi comparada com um padrão-ouro pré-estabelecido possibilitando eventuais refinos no método. As reconstruções tridimensionais segmentadas de cada amostra apresentaram um resultado visual aceitável, embora algumas segmentações tenham sofrido com o efeito do elemento estruturante da erosão, uma vez que este tem de ser grande o suficiente para segmentar grãos adjacentes, porém não o suficiente para super-segmentar um único grão. A rede complexa formada a partir da imagem de soja foi submetida a uma análise mais profunda, estudando e normalizando sua propriedade strength, uma natural candidata para detectar anisotropia de forças. Os vértices com alto valor normalizado de strength foram definidos como o arco da estrutura, e sua análise visual permitiu concluir que estes de fato são os elementos responsáveis pela estrutura do arranjo, assim como substanciar o sucesso do método aqui proposto em detectar automaticamente o arco utilizando uma imagem tridimensional. / The formation of arches – structures that promotes force anisotropy within a system – appears routinely inside silos or agricultural machinery. This current thesis proposes a method for modeling this phenomenon as a complex network, defining each grain as vertex and a force that two grains exchanges as the weight of the link between them. By using computed tomography, 3D images were taken from 11 grain samples, and a method developed to transform each of this resulting images in a complex network. Each image had to be pre-processed and subjected to a watershed transform using as inner markers the erosion of the image itself. This process resulted in three-dimensional segmentation of each grain of the original image, allowing the estimation of the physical properties of each grain, such as mass, center of mass, moment of inertia and the forces to which the grain is subjected. From these measures, the complex network of each of the 11 samples was constructed. Sample soybeans were compared with a gold-standard, allowing improvements to the methodology. The segmented three-dimensional reconstructions of each sample provided acceptable visual output, although some samples suffered from erosion due to the structural element size, since it must be large enough to segment adjacent grains, but not enough to super-segment a single grain. The complex network obtained from the soybeans image was subjected to further analysis, studying and normalizing its strength property, a natural candidate to detect force anisotropy. Vertices with high normalized values of strength were understood as defining the arch of the structure, and its visual analysis showed that these indeed are the elements responsible for the arrangement structure. These results support the ability of the proposed method in automatically detecting the arches using as input a three-dimensional image.
|
146 |
Conectividade funcional no cérebro: uma análise das associações com desempenho intelectual e atenção sustentada usando imagens por ressonância magnética / Functional connectivity of the brain: Analyzing the associations with intellectual performance and sustained attention using magnetic resonance imagingGustavo Santo Pedro Pamplona 18 February 2014 (has links)
Sabe-se que diversas regiões do cérebro humano trabalham em sincronia, mesmo anatomicamente separadas, sugerindo conexões funcionais e estruturais. Dessa forma, nosso cérebro pode ser considerado uma rede que pode ser estudada para diferenças entre indivíduos e entre tarefas, em que os nodos podem ser diferentes regiões e as arestas podem ser medidas de conectividade funcional entre séries temporais de um sinal de ressonância magnética de cada região. Neste estudo, propomos analisar como conectividade funcional e parâmetros de rede cerebral se relacionam com desempenho intelectual e um estado de atenção sustentada. Foram adquiridas imagens de ressonância magnética de 30 indivíduos saudáveis jovens em estado de repouso e de atenção sustentada, a partir delas foram calculadas as conexões funcionais entre 90 regiões cerebrais usando o coeficiente de correlação entre pares de series temporais. Destes sujeitos foram estimados sete índices de inteligência a partir da aplicação do teste WAIS-III. As matrizes de conectividade evidenciariam um comportamento de rede complexa de mundo pequeno para limiares entre 0,2 e 0,5. Não foram encontradas associações entre parâmetros globais das redes ponderadas em estado de repouso e os índices de inteligência. Conectividade funcional e alguns parâmetros de rede locais evidenciaram correlações com pontuações de inteligência, principalmente nas regiões frontal, pré-central, parietal e occipital, giro fusiforme e supramarginal e caudado. Embora o p-valor não-corrigido seja bem pequeno e/ou haja simetria entre hemisférios em alguns resultados, ao ser considerado o efeito de múltiplas comparações para análise inteira não foram encontradas associações estatisticamente significativas, por isso as análises foram corrigidas para cada região (p-valor corrigido pelo FDR<0,05). Ainda assim, possivelmente um aumento do número de sujeitos levaria a resultados mais conclusivos. Não foram encontrados resultados que confirmassem a hipótese de que, para indivíduos normais, haveria uma maior anti-correlação de redes extrínsecas e intrínsecas como um todo para o estado de atenção focada em relação ao estado de repouso. Entretanto, durante o estado de atenção sustentada, foram encontradas algumas diferenças estatisticamente significantes nas conexões locais dentro das redes positivas e negativas à tarefa, evidenciadas por um aumento na magnitude das correlações positivas ou negativas durante a atenção sustentada, além de uma tendência de anti-correlação em conexões entre regiões positivas e negativas à tarefa. / It\'s known that some regions of the human brain work synchronously, even if they are anatomically separated, suggesting functional and structural connections. In this way, our brain can be considered a network that can be studied for individual or task differences and in which nodes can be the different regions and edges can be the measurements of functional connectivity between blood oxygen level-dependent signal time series from each region. In this study, we aim to analyze how functional connectivity and brain network parameters relate to intellectual performance and to sustained attention state. Resonance Magnetic images were acquired in 30 healthy young volunteers in resting and attentional state. The functional connections between 90 brain regions were computed from them using correlation coefficient between pairs of temporal series. Seven intelligence indices were estimated from these subjects through WAIS-III test application and associations between functional connectivity values or brain network parameters were sought. Connectivity matrices evidenced a small-world complex network behavior for thresholds between 0.2 and 0.5. No associations between global parameters using weighted networks were found. Functional connectivity and network parameters have evidenced some correlations with intelligence scores, mainly in frontal, pre-central, parietal, occipital regions, fusiform and supramarginal gyrus and caudate nucleus. Even that the uncorrected p-value was small and/or there was symmetry between hemispheres in several results, statistical significant associations were not found considering multiple comparisons correction for the entire analysis, therefore the analysis were corrected for each region (FDR corrected p-value <0.05). Even, increasing the number of subjects possibly would get more conclusive results. Results corroborant to the initial hypothesis of greater anti-correlation between default mode network and task-positive regions were not found for the sustained attention state. However, during sustained attention state, some statistically significant differences in local connections within task-positive and negative regions were found, evidenced by the increase of the strength of positive and negative correlations, besides of a trend of anti-correlation in connections between task-positive and negative regions.
|
147 |
Sincronismo entre redes neurais com topologia de acoplamento do tipo Newman-WattsMartins, Alex 19 October 2011 (has links)
Made available in DSpace on 2016-03-15T19:37:40Z (GMT). No. of bitstreams: 1
Alex Martins.pdf: 1863982 bytes, checksum: 63a3f4efd397697e6bc129fa070520d5 (MD5)
Previous issue date: 2011-10-19 / Synchronization can be understood as a temporal organization of events, able of emerging in complex systems, as neural networks. Here, random graph and cellular automaton (CA) are used to represent neural networks, in order to investigate the occurrence of synchronism in such networks. The network coupling topology is of Newman-Watts type, formed by regular lattice with additional random connections. Two parts with this structure are connected by random links. Results obtained from numerical simulations with this model indicate variety of oscillatory behavior: there are cases in which both parts oscillate with equal, multiple and submultiple periods; and cases without oscillation. Investigations were performed concerning the relation among oscillatory behavior and maximum activity, the time to reach such an activity, the minimum average path length, size of the network, the percentage of random connections added and the rules of the CA state transition. Synchronous behavior was found in more than 75% of 28000 simulations accomplished. The system dynamics is influenced more by variations on the number of time steps in which a cell remains firing than by alterations on the lattice size or on the percentage of the randomly added links. / Pode-se entender sincronismo como uma organização temporal de eventos, possível de emergir em sistemas complexos, como redes neurais. Aqui, usam-se grafo aleatório e autômato celular (AC) para representar redes neurais, a fim de investigar a ocorrência de sincronismo em tais redes. A topologia de acoplamento da rede é do tipo Newman-Watts, formada por uma grade regular com ligações aleatórias acrescentadas. Duas partes com essa estrutura são conectadas por ligações aleatórias. Resultados obtidos por simulações numéricas com esse modelo indicam diversidade de comportamento oscilatório: há casos em que as duas partes oscilam em períodos iguais, múltiplos e submúltiplos; e casos sem oscilação. Investigaram-se as relações entre comportamento oscilatório e a atividade máxima, o tempo para se alcançar essa atividade, o comprimento do caminho mínimo médio, o tamanho da rede, a porcentagem de ligações aleatórias adicionadas, e as regras de transição de estado do AC. Comportamento síncrono foi encontrado em mais de 75% das 28.000 simulações realizadas. A dinâmica do sistema é mais influenciada por variações no número de passos de tempo em que a célula permanece disparando do que por alterações no tamanho do reticulado ou no percentual das ligações aleatórias adicionais.
|
148 |
Rotulação de indivíduos representativos no aprendizado semissupervisionado baseado em redes: caracterização, realce, ganho e filosofia / Representatives labeling for network-based semi-supervised learning:characterization, highlighting, gain and philosophyBilzã Marques de Araújo 29 April 2015 (has links)
Aprendizado semissupervisionado (ASS) é o nome dado ao paradigma de aprendizado de máquina que considera tanto dados rotulados como dados não rotulados. Embora seja considerado frequentemente como um meio termo entre os paradigmas supervisionado e não supervisionado, esse paradigma é geralmente aplicado a tarefas preditivas ou descritivas. Na tarefa preditiva de classificação, p. ex., o objetivo é rotular dados não rotulados de acordo com os rótulos dos dados rotulados. Nesse caso, enquanto que os dados não rotulados descrevem as distribuições dos dados e mediam a propagação dos rótulos, os itens de dados rotulados semeiam a propagação de rótulos e guiam-na à estabilidade. No entanto, dados são gerados tipicamente não rotulados e sua rotulação requer o envolvimento de especialistas no domínio, rotulando-os manualmente. Dificuldades na visualização de grandes volumes de dados, bem como o custo associado ao envolvimento do especialista, são desafios que podem restringir o desempenho dessa tarefa. Por- tanto, o destacamento automático de bons candidatos a dados rotulados, doravante denominados indivíduos representativos, é uma tarefa de grande importância, e pode proporcionar uma boa relação entre o custo com especialista e o desempenho do aprendizado. Dentre as abordagens de ASS discriminadas na literatura, nosso interesse de estudo se concentra na abordagem baseada em redes, onde conjuntos de dados são representados relacionalmente, através da abstração gráfica. Logo, o presente trabalho tem como objetivo explorar a influência dos nós rotulados no desempenho do ASS baseado em redes, i.e., estudar a caracterização de nós representativos, como a estrutura da rede pode realçá-los, o ganho de desempenho de ASS proporcionado pela rotulação manual dos mesmos, e aspectos filosóficos relacionados. Em relação à caracterização, critérios de caracterização de nós centrais em redes são estudados considerando-se redes com estruturas modulares bem definidas. Contraintuitivamente, nós bastantes conectados (hubs) não são muito representativos. Nós razoavelmente conectados em vizinhanças pouco conectadas, por outro lado, são; estritamente local, esse critério de caracterização é escalável a grandes volumes de dados. Em redes com distribuição de grau homogênea - modelo Girvan-Newman (GN), nós com alto coeficiente de agrupamento também mostram-se representativos. Por outro lado, em redes com distribuição de grau heterogênea - modelo Lancichinetti-Fortunato-Radicchi (LFR), nós com alta intermedialidade se destacam. Nós com alto coeficiente de agrupamento em redes GN estão tipicamente situados em motifs do tipo quase-clique; nós com alta intermedialidade em redes LFR são hubs situados na borda das comunidades. Em ambos os casos, os nós destacados são excelentes regularizadores. Além disso, como critérios diversos se destacam em redes com características diversas, abordagens unificadas para a caracterização de nós representativos também foram estudadas. Crítica para o realce de indivíduos representativos e o bom desempenho da classificação semissupervisionada, a construção de redes a partir de bases de dados vetoriais também foi estudada. O método denominado AdaRadius foi proposto, e apresenta vantagens tais como adaptabilidade em bases de dados com densidade variada, baixa dependência da configuração de seus parâmetros, e custo computacional razoável, tanto sobre dados pool-based como incrementais. As redes resultantes, por sua vez, são esparsas, porém conectadas, e permitem que a classificação semissupervisionada se favoreça da rotulação prévia de indivíduos representativos. Por fim, também foi estudada a validação de métodos de construção de redes para o ASS, sendo proposta a medida denominada coerência grafo-rótulos de Katz. Em suma, os resultados discutidos apontam para a validade da seleção de indivíduos representativos para semear a classificação semissupervisionada, corroborando a hipótese central da presente tese. Analogias são encontrados em diversos problemas modelados em redes, tais como epidemiologia, propagação de rumores e informações, resiliência, letalidade, grandmother cells, e crescimento e auto-organização. / Semi-supervised learning (SSL) is the name given to the machine learning paradigm that considers both labeled and unlabeled data. Although often defined as a mid-term between unsupervised and supervised machine learning, this paradigm is usually applied to predictive or descriptive tasks. In the classification task, for example, the goal is to label the unlabeled data according to the labels of the labeled data. In this case, while the unlabeled data describes the data distributions and mediate the label propagation, the labeled data seeds the label propagation and guide it to the stability. However, as a whole, data is generated unlabeled, and to label data requires the involvement of domain specialists, labeling it by hand. Difficulties on visualizing huge amounts of data, as well as the cost of the specialists involvement, are challenges which may constraint the labeling task performance. Therefore, the automatic highlighting of good candidates to label by hand, henceforth called representative individuals, is a high value task, which may result in a good tradeoff between the cost with the specialist and the machine learning performance. Among the SSL approaches in the literature, our study is focused on the network--based approache, where datasets are represented relationally, through the graphic abstraction. Thus, the current study aims to explore and exploit the influence of the labeled data on the SSL performance, that is, the proper characterization of representative nodes, how the network structure may enhance them, the SSL performance gain due to labeling them by hand, and related philosophical aspects. Concerning the characterization, central nodes characterization criteria were studied on networks with well-defined modular structures. Counterintuitively, highly connected nodes (hubs) are not much representatives. Not so connected nodes placed in low connectivity neighborhoods are, though. Strictly local, this characterization is scalable to huge volumes of data. In networks with homogeneous degree distribution - Girvan-Newman networks (GN), nodes with high clustering coefficient also figure out as representatives. On the other hand, in networks with inhomogeneous degree distribution - Lancichinetti-Fortunato-Radicchi networks (LFR), nodes with high betweenness stand out. Nodes with high clustering coefficient in GN networks typically lie in almost-cliques motifs; nodes with high betweenness in LFR networks are highly connected nodes, which lie in communities borders. In both cases, the highlighted nodes are outstanding regularizers. Besides that, unified approaches to characterize representative nodes were studied because diverse criteria stand out for diverse networks. Crucial for highlighting representative nodes and ensure good SSL performance, the graph construction from vector-based datasets was also studied. The method called AdaRadius was introduced and presents advantages such as adaptability to data with variable density, low dependency on parameters settings, and reasonable computational cost on both pool based and incremental data. Yielding networks are sparse but connected and allow the semi-supervised classification to take great advantage of the manual labeling of representative nodes. Lastly, the validation of graph construction methods for SSL was studied, being proposed the validation measure called graph-labels Katz coherence. Summing up, the discussed results give rise to the validity of representative individuals selection to seed the semi-supervised classification, supporting the central assumption of current thesis. Analogies may be found in several real-world network problems, such as epidemiology, rumors and information spreading, resilience, lethality, grandmother cells, and network evolving and self-organization.
|
149 |
Classificação de textos com redes complexas / Using complex networks to classify textsDiego Raphael Amancio 29 October 2013 (has links)
A classificação automática de textos em categorias pré-estabelecidas tem despertado grande interesse nos últimos anos devido à necessidade de organização do número crescente de documentos. A abordagem dominante para classificação é baseada na análise de conteúdo dos textos. Nesta tese, investigamos a aplicabilidade de atributos de estilo em tarefas tradicionais de classificação, usando a modelagem de textos como redes complexas, em que os vértices representam palavras e arestas representam relações de adjacência. Estudamos como métricas topológicas podem ser úteis no processamento de línguas naturais, sendo a tarefa de classificação apoiada por métodos de aprendizado de máquina, supervisionado e não supervisionado. Um estudo detalhado das métricas topológicas revelou que várias delas são informativas, por permitirem distinguir textos escritos em língua natural de textos com palavras distribuídas aleatoriamente. Mostramos também que a maioria das medidas de rede depende de fatores sintáticos, enquanto medidas de intermitência são mais sensíveis à semântica. Com relação à aplicabilidade da modelagem de textos como redes complexas, mostramos que existe uma dependência significativa entre estilo de autores e topologia da rede. Para a tarefa de reconhecimento de autoria de 40 romances escritos por 8 autores, uma taxa de acerto de 65% foi obtida com métricas de rede e intermitência de palavras. Ainda na análise de estilo, descobrimos que livros pertencentes ao mesmo estilo literário tendem a possuir estruturas topológicas similares. A modelagem de textos como redes também foi útil para discriminar sentidos de palavras ambíguas, a partir apenas de informação topológica dos vértices, evidenciando uma relação não trivial entre sintaxe e semântica. Para algumas palavras, a discriminação com redes complexas foi ainda melhor que a estratégia baseada em padrões de recorrência contextual de palavras polissêmicas. Os estudos desenvolvidos nesta tese confirmam que aspectos de estilo e semânticos influenciam na organização estrutural de conceitos em textos modelados como rede. Assim, a modelagem de textos como redes de adjacência de palavras pode ser útil não apenas para entender mecanismos fundamentais da linguagem, mas também para aperfeiçoar aplicações reais quando combinada com métodos tradicionais de processamento de texto. / The automatic classification of texts in pre-established categories is drawing increasing interest owing to the need to organize the ever growing number of electronic documents. The prevailing approach for classification is based on analysis of textual contents. In this thesis, we investigate the applicability of attributes based on textual style using the complex network (CN) representation, where nodes represent words and edges are adjacency relations. We studied the suitability of CN measurements for natural language processing tasks, with classification being assisted by supervised and unsupervised machine learning methods. A detailed study of topological measurements in texts revealed that several measurements are informative in the sense that they are able to distinguish meaningful from shuffled texts. Moreover, most measurements depend on syntactic factors, while intermittency measurements are more sensitive to semantic factors. As for the use of the CN model in practical scenarios, there is significant correlation between authors style and network topology. We achieved an accuracy rate of 65% in discriminating eight authors of novels with the use of network and intermittency measurements. During the stylistic analysis, we also found that books belonging to the same literary movement could be identified from their similar topological features. The network model also proved useful for disambiguating word senses. Upon employing only topological information to characterize nodes representing polysemous words, we found a strong relationship between syntax and semantics. For several words, the CN approach performed surprisingly better than the method based on recurrence patterns of neighboring words. The studies carried out in this thesis confirm that stylistic and semantic aspects play a crucial role in the structural organization of word adjacency networks. The word adjacency model investigated here might be useful not only to provide insight into the underlying mechanisms of the language, but also to enhance the performance of real applications implementing both CN and traditional approaches.
|
150 |
Classificação de imagens de fluorescência do citoesqueleto através de técnicas em processamento de imagens / Classification of cytoskeleton in fluorescence images with image analysis techniquesFilomen Incahuanaco Quispe 14 September 2017 (has links)
O citoesqueleto é a estrutura celular mais importante em células eucariotas e é responsável por manter a forma da célula e as junções celulares, auxiliando nos movimentos celulares. Esta é composta de filamentos de Actina, Microtúbulos e filamentos intermediários. Recentemente, a análise de duas dessas estruturas tornaram-se importantes, pois é possível obter micrografias usando microscópios de alta resolução, que contém microscopia de fluorescência, em combinação com métodos complexos de aplicação de substâncias de contraste para rotulagem e posterior análises visuais. A combinação dessas técnicas, entretanto, limita-se a ser descritiva e subjetiva. Neste trabalho, são avaliadas cinco técnicas de análise de imagens, as quais são: Bag of Visual Words (BoVW), Local Binary Local (LBP), Textons baseados em Discrete Fourier Transform (TDFT), Textons baseados em Gabor Filter Banks (TGFB) e Textons baseados em Complex Networks (TCN) sobre o conjunto de dados 2D Hela e FDIG Olympus. Experimentos extensivos foram conduzidos em ambos os conjuntos de dados, e seus resultados podem servir de base para futuras pesquisas como análises do citoesqueleto em imagens de microscopia fluorescente. Neste trabalho, é apresentada uma comparação quantitativa e qualitativa dos métodos acima mencionados para entender o comportamento desses métodos e propriedades dos microfilamentos de actina (MA) e Microtúbulos (MT) em ambos os conjuntos de dados. Os resultados obtidos evidenciam que é possível classificar o conjunto de dados da FDIG Olympus com uma precisão de até 90:07% e 98:94% para 2D Hela, além de obter 86:05% e 96:84%, respectivamente, de precisão, usando teoria de redes complexas. / The cytoskeleton is the most important cellular structure in eukaryotic cells and is responsible for maintaining the shape of the cell and cellular junctions, aiding in cell movements. This is composed of filaments of Actin, Microtubules and intermediate filaments. Recently, the analysis of two of these structures has become important because it is possible to obtain micrographs using microscopes of high resolution and fluorescence technology, in combination with complex methods of application of substances of contrast for labeling and later visual analysis. The use of these techniques, however, is limited to being descriptive and subjective. In this work, we evaluate some of the most popular image analysis techniques such as Bag of Visual Words (BoVW), Local Binary Pattern (LBP), Textons based on Discrete Fourier Transform(TDFT) , Gabor Filter banks (TGFB), and approaches based on Complex Networks theory (TCN) over the famous dataset 2D Hela and FDIG Olympus. Extensive experiments were conducted on both datasets in which their results can serve as a baseline for future research with cytoskeleton classification in microscopy fluorescence images. In this work, we present the quantitative and qualitative comparison of above mentioned methods for better understand the behavior of these methods and the properties of Actin microfilaments (MA) and Microtubules (MT) on both datasets. The results showed that it is possible to classify the FDIG Olympus data set with accuracy of up to 90:07% and 98:94% for 2D Hela, in addition to reaching 86:05% and 96:84% respectively, using complex network theory.
|
Page generated in 0.0304 seconds