Global ETD Search

41	Visual analytics of topics in twitter in connection with political debates / Análise visual de tópicos no Twitter em conexão com debates políticos Carvalho, Eder José de 04 May 2017 (has links) Social media channels such as Twitter and Facebook often contribute to disseminate initiatives that seek to inform and empower citizens concerned with government actions. On the other hand, certain actions and statements by governmental institutions, or parliament members and political journalists that appear on the conventional media tend to reverberate on the social media. This scenario produces a lot of textual data that can reveal relevant information on governmental actions and policies. Nonetheless, the target audience still lacks appropriate tools capable of supporting the acquisition, correlation and interpretation of potentially useful information embedded in such text sources. In this scenario, this work presents two system for the analysis of government and social media data. One of the systems introduces a new visualization, based on the river metaphor, for the analysis of the temporal evolution of topics in Twitter in connection with political debates. For this purpose, the problem was initially modeled as a clustering problem and a domain-independent text segmentation method was adapted to associate (by clustering) Twitter content with parliamentary speeches. Moreover, a version of the MONIC framework for cluster transition detection was employed to track the temporal evolution of debates (or clusters) and to produce a set of time-stamped clusters. The other system, named ATR-Vis, combines visualization techniques with active retrieval strategies to involve the user in the retrieval of Twitters posts related to political debates and associate them to the specific debate they refer to. The framework proposed introduces four active retrieval strategies that make use of the Twitters structural information increasing retrieval accuracy while minimizing user involvement by keeping the number of labeling requests to a minimum. Evaluations through use cases and quantitative experiments, as well as qualitative analysis conducted with three domain experts, illustrates the effectiveness of ATR-Vis in the retrieval of relevant tweets. For the evaluation, two Twitter datasets were collected, related to parliamentary debates being held in Brazil and Canada, and a dataset comprising a set of top news stories that received great media attention at the time. / Mídias sociais como o Twitter e o Facebook atuam, em diversas situações, como canais de iniciativas que buscam ampliar as ações de cidadania. Por outro lado, certas ações e manifestações na mídia convencional por parte de instituições governamentais, ou de jornalistas e políticos como deputados e senadores, tendem a repercutir nas mídias sociais. Como resultado, gerase uma enorme quantidade de dados em formato textual que podem ser muito informativos sobre ações e políticas governamentais. No entanto, o público-alvo continua carente de boas ferramentas que ajudem a levantar, correlacionar e interpretar as informações potencialmente úteis associadas a esses textos. Neste contexto, este trabalho apresenta dois sistemas orientados à análise de dados governamentais e de mídias sociais. Um dos sistemas introduz uma nova visualização, baseada na metáfora do rio, para análise temporal da evolução de tópicos no Twitter em conexão com debates políticos. Para tanto, o problema foi inicialmente modelado como um problema de clusterização e um método de segmentação de texto independente de domínio foi adaptado para associar (por clusterização) tweets com discursos parlamentares. Uma versão do algorimo MONIC para detecção de transições entre agrupamentos foi empregada para rastrear a evolução temporal de debates (ou agrupamentos) e produzir um conjunto de agrupamentos com informação de tempo. O outro sistema, chamado ATR-Vis, combina técnicas de visualização com estratégias de recuperação ativa para envolver o usuário na recuperação de tweets relacionados a debates políticos e associa-os ao debate correspondente. O arcabouço proposto introduz quatro estratégias de recuperação ativa que utilizam informação estrutural do Twitter melhorando a acurácia do processo de recuperação e simultaneamente minimizando o número de pedidos de rotulação apresentados ao usuário. Avaliações por meio de casos de uso e experimentos quantitativos, assim como uma análise qualitativa conduzida com três especialistas ilustram a efetividade do ATR-Vis na recuperação de tweets relevantes. Para a avaliação, foram coletados dois conjuntos de tweets relacionados a debates parlamentares ocorridos no Brasil e no Canadá, e outro formado por um conjunto de notícias que receberam grande atenção da mídia no período da coleta. Análise de dados sociais Análise visual Social data analysis Visual analytics Visualização Visualization
42	Análise do índice de instalação de empresas no município de Osasco utilizando sistemas de informação geográfica e análise envoltória de dados - DEA. / Instalation index analysis of companies in Osasco\'s municipal district using geographical information system and Data Envelopment Analysis -DEA. Almeida, George Eduardo Serra 28 August 2006 (has links) Este estudo apresenta uma análise sobre a aplicação do geoprocessamento integrado à técnica de Análise Envoltória de Dados (Data Envelopment Analysis - DEA), relacionada a distribuição espacial de empresas em unidades produtivas representadas por áreas de zoneamento do solo urbano, utilizando dados socioeconômicos multitemporais. O trabalho tem como área de estudo o Município de Osasco, localizado na Região Metropolitana de São Paulo, que faz parte do trecho Oeste do Sistema Viário Rodoanel Mário Covas. Desta forma, a análise de instalação de empresas nos períodos anterior e posterior a implantação do sistema viário Rodoanel, poderá servir de apoio na avaliação de mudanças ou transformações empresariais (indústria, comércio e serviços) no uso e ocupação do solo no Município de Osasco. De uma forma mais específica, o estudo buscou avaliar a influência dos fatores espaciais no processo de localização e migração de empresas, focando em alterações no uso do solo com ênfase no zoneamento do município e em função da melhoria de infra-estrutura relacionada à construção de uma grande obra viária e tomando como base períodos de tempo e situações urbanas distintas. Para traçar este panorama foram utilizadas informações sócioeconômicas, dados cadastrais de empresas e o zoneamento municipal associadas a dados geográficos, os quais permitiram compor cenários multitemporais de cada momento urbano. Estes cenários foram representados e analisados no capítulo de resultados utilizando o índice de instalação de empresas em conjunto com as analises espaciais do SIG, que proporcionou uma análise temporal quantitativa da distribuição de empresas no Município de Osasco. / This study presents an analysis on GIS application integrated to Data Envelopment Analysis - DEA, related to spatial distribution of companies in productive units represented by zoning areas of the urban land and using socioeconomic data of different time periods. The work has Osasco\'s Municipal district as the area of study, located in São Paulo\'s Metropolitan Region, it makes part of the west section of the Mário Covas Rodoanel road system. Thus, the analysis will support in the changes evaluation or managerial transformations (industries, commerce and services) in the Osasco\'s Municipal district land use, current of the Rodoanel road system implantation. In a more specific way, the study sought to evaluate the influence of the space factors in the companies location and migration process, focusing on alterations in the land use with emphasis in the municipal district zoning and in infrastructure improvement function related to construction of a big road and taking as time\'s base periods and distinct urban situations. To trace this panorama were used socioeconomic information, cadastral data of companies and the municipal zoning associated to geographical data, to compose urban scenarios in different time periods. These scenarios were represented and analyzed in the results chapter using the companies installation index together with Spatial GIS Analysis, who provided a quantitative temporal analysis of distribution of companies in Osasco\'s Municipal distritct. Geographic information system Sistemas de informação geográfica
43	Métodos estatísticos para a análise de dados de cDNA microarray em um ambiente computacional integrado / Statistical methods for cDNA microarray data analysis in an integrated computational environment Esteves, Gustavo Henrique 23 March 2007 (has links) Análise de expressão gênica em larga escala é de fundamental importância para a biologia molecular atual pois possibilita a medida dos níveis de expressão de milhares de genes simultaneamente, o que torna viável a realização de trabalhos voltados para biologia de sistemas (systems biology). Dentre as principais técnicas experimentais disponíveis para esta finalidade, a tecnologia de microarray tem sido amplamente utilizada. Este procedimento para medida de expressão gênica é bastante complexo e os dados obtidos são freqüentemente observacionais, o que dificulta a modelagem estatística. Não existe um protocolo padrão para a geração e avaliação desses dados, sendo portanto necessário buscar procedimentos de análise que sejam adequados para cada caso. Assim, os principais métodos matemáticos e estatísticos aplicados para a análise desses dados deveriam estar disponíveis de uma forma organizada, coerente e simples em um ambiente computacional que confira robustez, confiabilidade e reprodutibilidade às análises realizadas. Uma forma de garantir estas características é através da representação (e documentação) de todos os algoritmos utilizados na forma de um grafo direcionado e acíclico que descreva todo o conjunto de transformações, ou operações, aplicadas seqüencialmente ao conjunto de dados. De acordo com esta filosofia, um ambiente foi implementado neste trabalho incorporando diversos procedimentos disponíveis na literatura atual, além de outros que foram aprimorados ou propostos nesta tese. Dentre os métodos de análise já disponíveis que foram incorporados destacam-se aqueles para a construção de agrupamentos, busca de genes diferencialmente expressos e classificadores, construção de redes de relevância e classificação funcional de grupos gênicos. Além disso, o método de construção de redes de relevância foi revisto e aprimorado e um modelo estatístico para a classificação funcional de redes de regulação gênica foi proposto e implementado. Esses dois últimos métodos surgiram a partir de problemas biológicos para os quais não existiam procedimentos de análise adequados na literatura. Finalmente, são apresentados dois conjuntos de dados que foram analisados utilizando diversas ferramentas disponíveis neste ambiente computacional. / High throughput gene expression analysis has a great importance to molecular biology nowadays because it can measure expression profiles for hundreds of genes, and this turn possible studies focused in systems biology. Between the main experimental techniques available in this direction, the microarray technology has been widely used. This experimental procedure to quantify gene expression profiles is very complex and the data obtained is frequently observational, what difficult the statistical modelling. There is not a standard protocol for the generation and evaluation of microarray data, therefore it is necessary to search by adequate analysis methods for each case. Thus, the main mathematical and statistical methods applied to microarray data analysis would have to be available in an organized, coherent and simple way in a computational environment that confer robustness, reliability and reproducibility to the data analysis. One way to guarantee these characteristics is through the representation (and documentation) of all used algorithms as a directed and acyclic graph that describes the set of transformations, or operations, applied sequentially to the dataset. According to this philosophy, an environment was implemented in this work aggregating several data analysis procedures already available in the literature, beyond other methods that were improved or proposed in this thesis. Between the procedures already available that were incorporated we can distinguish that ones for cluster analysis, differentially expressed genes and classifiers search, construction of relevance networks and functional classification of gene groups. Moreover, the method for construction of relevance networks was revised and improved and an statistical model was proposed and implemented for the functional classification of gene regulation networks. The last two procedures was born from biological problems for which adequate data analysis methods didn?t exist in the literature. Finally, we presented two datasets that were evaluated using several data analysis procedures available in this computational environment. Análise de Dados Classificação de Grupos Gênicos Classification of Gene Networks Data Analysis Microarray Microarray Redes de Relevância Relevance Networks
44	Aplicação de modelos multiníveis na análise de dados de medidas repetidas no tempo. / Multilevel models applied in the analysis of repeated measure data. Bergamo, Genevile Carife 28 October 2002 (has links) Em muitos trabalhos científicos, é comum encontrar os dados estruturados de forma hierarquica, ou seja, os indivíduos em estudo estão agrupados em unidades de nível mais baixo, que por sua vez pertencem a unidades de um nível mais alto e assim sucessivamente. Na análise desse tipo de dados é importante levar em conta a estrutura hierarquica uma vez que, não faze-la, pode implicar na superestimação dos coecientes do modelo em estudo. Assim, para facilitar a análise de dados seguindo uma estrutura hierarquica, foram desenvolvidos os modelos multiníveis. Tais modelos levam em conta toda a variabilidade existente para os dados num mesmo nível como nos diferentes níveis da hierarquia. No caso da análise de dados de medidas repetidas no tempo, uma estrutura hierarquica em dois níveis pode ser considerada, organizando as ocasiões de medidas, no primeiro nível, para cada indivíduo no segundo nível. Neste trabalho, é feita uma abordagem dos modelos multiníveis para vários níveis da hierarquia bem como os métodos de estimação e teste dos parâmetros envolvidos no modelo. Como aplicação, foram analisados dados provenientes do Programa de Atenção ao Idoso (PAI), desenvolvido no ambulatório municipal Dr. Plinio do Prado Coutinho em Alfenas, M.G., em que foram observadas as variáveis Indice de Massa Corporea (imc) e Pressão Arterial dos idosos durante 22 meses. Também, foram analisados dados referentes ao teor de proteína no leite de 79 vacas australianas, coletados durante 19 semanas após o parto e submetidas a três dietas (Diggle et al., 1994). Para os dados do "PAI", foi possível verificar que as diferentes medidas de pressão arterial estão relacionadas positivamente com o imcao longo do tempo, independente de sexo, idade e estado civil. Já nos dados relativos ao teor de proteína no leite, notou-se uma redução do teor de proteína no leite ao longo do tempo, independente dos tratamentos aplicados. Foram utilizados os softwares MLwiN e SAS para a realização das análises. / It is common to and data structured in a hierarchical form in several scientific works, that is, the studied subjects are nested in the lowest level unites, that belong to the highest level unites, and so on. To analyze these sort of data it is important to take in account the hierarchical structure once, if does not do it, the coeficients can be overestimated in the studied model. Then, in order to become easier the data analysis according to the hierarchical structure, multilevel models were developed. Such models take into account all the existing variability for the data at the same level as well as in diferent levels of the hierarchy. In the case of repeated measure data, a two levels hierarchical structure can be considered, organizing the occasions at the first level for each subject at the second level. In this work, na approach of the multilevel models for several levels are made as well as the estimation methods and the tests for the involved parameters in the model. As an application, data from the Elderly Care Program (ECP), developed at outpatient clinic Dr. Plinio do Prado Coutinho at Alfenas, M.G., where the Body Mass Index and the Bloody Pressure were observed from elderly people for 22 months. Also, it was analyzed the milk protein content of 79 australian cows during 19 weeks after calving and subject to three diets (Diggle et al., 1994). For the data of the ECP it was possible to observe that the bloody pressure are positively related to the occasions, independently of sex, race and marital status. For the data form the milk protein content, a reduce in the content in the occasions even after the diets are included. MLwiN and SAS softwares were used to run the analysis. análise de dados applied statistics data analysis estatística aplicada mathematical models medidas repetidas modelos matemáticos repeated measures
45	Detecção não supervisionada de posicionamento em textos de tweets / Unsupervised stance detection in texts of tweets Dias, Marcelo dos Santos January 2017 (has links) Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio. / Stance Detection is the task of automatically identifying if the author of a text is in favor of the given target, against the given target, or whether neither inference is likely. With the wide use of Twitter as a platform to express opinions and stances, the automatic analysis of this content becomes of high regard for companies, organizations and public figures. In general, works that explore such task adopt supervised or semi-supervised approaches. The present work proposes and evaluates a non-supervised process to detect stance in texts of tweets that has as entry only the target and a set of tweets to classify and is based on a hybrid approach composed by 2 stages: a) automatic labelling of tweets based on a set of heuristics and b) complementary classification based on supervised machine learning. The proposal succeeds when applied to public figures, overcoming the state-of-the-art. Beyond that, some alternatives are evaluated with the intention of increasing the performance when applied to other domains, revealing the possibility of use of strategies such as using seed targets and profiles depending on each domain characteristics. Recuperacao : Informacao Twitter Análise de dados Sentiment Analysis Automatic labelling Stance Detection
46	Seleção e análise dos modelos PARAFAC e Tucker e gráfico triplot com aplicação em interação tripla / Selection and analysis of the PARAFAC and Tucker models and triplot graphic with application in triple interaction Araújo, Lúcio Borges de 16 July 2009 (has links) O presente trabalho tem os seguintes objetivos: propor uma sistemática para o estudo e a interpretação da estabilidade e adaptabilidade fenotípica, através de duas técnicas de análise multiway (PARAFAC e Tucker3); propor a construção de um gráfico, denominado de Triplot, que possibilita avaliar as relç]oesoes entre os 3 modos (genótipos, locais e anos); implementar uma rotina computacional para a análise de dados, segundo os modelos multiway; implementar uma rotina computacional para a construção do Triplot. Os dados a serem uti- lizados são relativos a experimentos com 13 genótipos de feijão que foram conduzidos em 9 ex- perimentos distintos constituídos pelos anos agrícolas de 2000/2001, 2001/2002 e 2005/2006, pelos municípios de Dourados e Aquidauana, sendo que os experimentos foram instalados na época das águas (Dourados)e também na época da seca (Dourados e Aquidauana). Cada local é constituído de município e uma época de instalação. Os resultados indicaram que o gráfico triplot e joint plot, facilitam o entendimento da interação tripla e traz ao pesquisador informações mais reais sobre a interação tripla, do que a modelagem AMMI de duas entradas; o gráfico triplot, ajuda a identificar genótipos, locais e anos estáveis, dentro de um grande grupo de genótipos, locais e anos; de uma maneira geral recomenda-se, utilizar o triplot e o joint plot juntos, para obter melhores interpretações dos resultados; dentre os genótipos estudados, o genótipo 6 é o que menos contribui para a interação e o os genótipos 12, 9 e 5 são os que mais contribuem para a interação. / The present work has the following objectives: to propose a systematics for the study and the interpretation of the phenotypic stability and adaptability, through several multiway models (PARAFAC and Tucker3); to propose a graphic, called of Triplot, that it makes possible to evaluate the relations between the 3 ways (genotypes, locations and years); to implement a computational routine for the data analysis, according multiway models; to implement a computational routine for the construction of Triplot. The used data are relative the experiments with 13 genotypes of beans that had been lead in 9 experimental distinct ones constituted by agricultural years of 2000/2001, 2001/2002 and 2005/2006, by Dourados and Aquidauana cities, where the experiments had been installed at the time of waters (Dourados) and also at the time of dries (Dourados and Aquidauana). Each location is constituted of city and time of installation. The results indicated that the graphic triplot and joint plot, facilitate the agreement of triple interaction and bring to the researcher more real information about triple interaction, of what AMMI model of two way; the graphic triplot, helps to identify stabels genotypes, locations and years, inside of a great group of genotypes, location and years; in a general recommend to use triplot and joint plot together, to get better interpretations of the results; the genotype 6 is what less contributes for the triple interaction and genotypes 12, 9 and 5 are the that more contribute for the interaction. Análise de dados Correlação genética e ambiental Data analysis Fenótipos Genética estatística. Genetics and environment correlation Phenotypes Statistics genetics.
47	Modelos para a análise de dados de contagens longitudinais com superdispersão: estimação INLA / Models for data analysis of longitudinal counts with overdispersion: INLA estimation Rocha, Everton Batista da 04 September 2015 (has links) Em ensaios clínicos é muito comum a ocorrência de dados longitudinais discretos. Para sua análise é necessário levar em consideração que dados observados na mesma unidade experimental ao longo do tempo possam ser correlacionados. Além dessa correlação inerente aos dados é comum ocorrer o fenômeno de superdispersão (ou sobredispersão), em que, existe uma variabilidade nos dados além daquela captada pelo modelo. Um caso que pode acarretar a superdispersão é o excesso de zeros, podendo também a superdispersão ocorrer em valores não nulos, ou ainda, em ambos os casos. Molenberghs, Verbeke e Demétrio (2007) propuseram uma classe de modelos para acomodar simultaneamente a superdispersão e a correlação em dados de contagens: modelo Poisson, modelo Poisson-gama, modelo Poisson-normal e modelo Poisson-normal-gama (ou modelo combinado). Rizzato (2011) apresentou a abordagem bayesiana para o ajuste desses modelos por meio do Método de Monte Carlo com Cadeias de Markov (MCMC). Este trabalho, para modelar a incerteza relativa aos parâmetros desses modelos, considerou a abordagem bayesiana por meio de um método determinístico para a solução de integrais, INLA (do inglês, Integrated Nested Laplace Approximations). Além dessa classe de modelos, como objetivo, foram propostos outros quatros modelos que também consideram a correlação entre medidas longitudinais e a ocorrência de superdispersão, além da ocorrência de zeros estruturais e não estruturais (amostrais): modelo Poisson inacionado de zeros (ZIP), modelo binomial negativo inacionado de zeros (ZINB), modelo Poisson inacionado de zeros - normal (ZIP-normal) e modelo binomial negativo inacionado de zeros - normal (ZINB-normal). Para ilustrar a metodologia desenvolvida, um conjunto de dados reais referentes à contagens de ataques epilépticos sofridos por pacientes portadores de epilepsia submetidos a dois tratamentos (um placebo e uma nova droga) ao longo de 27 semanas foi considerado. A seleção de modelos foi realizada utilizando-se medidas preditivas baseadas em validação cruzada. Sob essas medidas, o modelo selecionado foi o modelo ZIP-normal, sob o modelo corrente na literatura, modelo combinado. As rotinas computacionais foram implementadas no programa R e são parte deste trabalho. / Discrete and longitudinal structures naturally arise in clinical trial data. Such data are usually correlated, particularly when the observations are made within the same experimental unit over time and, thus, statistical analyses must take this situation into account. Besides this typical correlation, overdispersion is another common phenomenon in discrete data, defined as a greater observed variability than that nominated by the statistical model. The causes of overdispersion are usually related to an excess of observed zeros (zero-ination), or an excess of observed positive specific values or even both. Molenberghs, Verbeke e Demétrio (2007) have developed a class of models that encompasses both overdispersion and correlation in count data: Poisson, Poisson-gama, Poisson-normal, Poissonnormal- gama (combined model) models. A Bayesian approach was presented by Rizzato (2011) to fit these models using the Markov Chain Monte Carlo method (MCMC). In this work, a Bayesian framework was adopted as well and, in order to consider the uncertainty related to the model parameters, the Integrated Nested Laplace Approximations (INLA) method was used. Along with the models considered in Rizzato (2011), another four new models were proposed including longitudinal correlation, overdispersion and zero-ination by structural and random zeros, namely: zero-inated Poisson (ZIP), zero-inated negative binomial (ZINB), zero-inated Poisson-normal (ZIP-normal) and the zero-inated negative binomial-normal (ZINB-normal) models. In order to illustrate the developed methodology, the models were fit to a real dataset, in which the response variable was taken to be the number of epileptic events per week in each individual. These individuals were split into two groups, one taking placebo and the other taking an experimental drug, and they observed up to 27 weeks. The model selection criteria were given by different predictive measures based on cross validation. In this setting, the ZIP-normal model was selected instead the usual model in the literature (combined model). The computational routines were implemented in R language and constitute a part of this work. Análise de dados longitudinais Bayesian inference Contagens Counts Inferência Bayesiana Longitudinal data analysis Overdispersion Superdispersão
48	Desenvolvimento de uma ferramenta computacional para a análise de fluxos metabólicos empregando carbono marcado. / Development of a computational tool for metabolic flux analysis with labeled carbon. Oliveira, Rafael David de 11 October 2017 (has links) A 13C-Análise de Fluxos Metabólicos (13C-MFA) tornou-se uma técnica de alta precisão para estimar fluxos metabólicos e obter informações importantes sobre o metabolismo. Este método consiste em procedimentos experimentais, técnicas de medição e em cálculos para análise de dados. Neste contexto, os grupos de pesquisa de engenharia metabólica necessitam de ferramentas computacionais precisas e adequadas aos seus objetos de estudo. No presente trabalho, foi construída uma ferramenta computacional na plataforma MATLAB que executa cálculos de 13C-MFA, com balanços de metabólitos e cumômeros. Além disso, um módulo para estimar os fluxos metabólicos e um módulo para quantificar as incertezas das estimativas também foram implementados. O programa foi validado com dados presentes na literatura e aplicado a estudos de caso. Na estimação de fluxos de Pseudomonas sp. LFM046, identificou-se que esse micro-organismo possivelmente utiliza a Via das Pentoses em conjunto com a Via Entner-Doudoroff para a biossíntese de Polihidroxialcanoato (PHA). No design ótimo de experimentos para uma rede genérica de Pseudomonas, identificou-se a glicose marcada no átomo cinco como um substrato que permitirá determinar o fluxo na Via das Pentoses com menor incerteza. / 13C-Metabolic Flux Analysis (13C-MFA) has become a high-precision technique to estimate metabolic fluxes and get insights into metabolism. This method consists of experimental procedures, measurement techniques and data analysis calculations. In this context, metabolic engineering research groups demand accurate and suitable computational tools to perform the calculations. A computational tool was implemented in MATLAB platform that performs 13C-MFA calculation, using metabolite and cumomer balances, as well as a module to estimate the fluxes and a module to quantify their uncertainty. The program was validated with some classical cases from literature. From the flux estimates of Pseudomonas sp. LFM046, it was identified that the microorganism possibly uses the Pentose Phosphate Pathway along with the Entner-Doudoroff Pathway for Polyhydroxyalkanoate (PHA) biosynthesis. From the optimal experimental design for a generic Pseudomonas network, it was possible to conclude that glucose labeled at atom five is the best option to determine the flux in the Pentose Phosphate Pathway with smaller uncertainty. 13C-metabolic flux analysis Análise de dados Metabolic engineering Metabolismo Modeling Parameter estimation PHA Pseudomonas Pseudomonas
49	Controle automático de adição de AlF3 em cubas de redução de alumínio, usando lógica fuzzy / Automatic control of addition of alf3 in cubas of aluminum reduction, using logical fuzzy PEREIRA, Vanilson Gomes 21 December 2005 (has links) Made available in DSpace on 2011-03-23T21:19:12Z (GMT). No. of bitstreams: 0 / Item created via OAI harvest from source: http://www.bdtd.ufpa.br/tde_oai/oai2.php on 2011-03-23T21:19:12Z (GMT). Item's OAI Record identifier: oai:bdtd.ufpa.br:50 / ALBRAS - Alumínio Brasileiro S.A. / This work describes a data analysis system, which generates an intelligent aluminum fluoride (AlF3) addition strategy for electrolytic cells. The project is based on Fuzzy logic concepts, wherein the knowledge accumulated by the process specialist is translated in a qualitative manner into a set of linguistic rules such as: IF<condition> THEN<action>. The use of this fuzzy technique for fluoride addition control seeks to explicitly represent an implicit knowledge, retained by the cell operators of the electrolytic cells. Due the conventional system not to contemplate the variations of the phenomena that they involve the dynamics of the process, a controller fuzzy was implemented in the real system for taking of decisions, using the minimum model of Mandani. Based this model, the process variables to input fuzzy system, such as bath temperature and fluoride of aluminum were manipulated to estimate the tendency up and down, through the Method of Least Squares(MLS). The controller fuzzy is applied to calculate the amount of fluoride of aluminum (AlF3) to be added in the electrolytic cells in an automatic way without the need of the the specialist?s of the process intervention. The use of a fuzzy control system is justified by the fact of not having an available dynamic model for aluminum fluoride addition process in electrolytic cells. This lack of modeling is due to the great complexity of the phenomena involved in a cell, which are thermodynamic and electromagnetic processes linked together. / Este trabalho descreve um sistema de análise de dados com a finalidade de gerar um sistema de controle utilizando técnica inteligente para adição de fluoreto de alumínio (AlF3) em fornos de redução de alumínio. O projeto baseia-se nos conceitos de lógica fuzzy, nos quais o conhecimento acumulado pelo especialista do processo é traduzido de maneira qualitativa em um conjunto de regras linguísticas do tipo SE<condição> ENTÃO<ação>. A utilização desta técnica inteligente para o controle de adição de fluoreto busca representar explicitamente um conhecimento qualitativo, detido pelos operadores de cubas eletrolíticas. Devido o sistema convencional não contemplar as variações dos fenômenos que envolvem a dinâmica do processo, um controlador fuzzy foi implmentado no sistema real para tomadas de decisões, utilizando o modelo mínimo de Mandani. Baseado neste modelo, as variáveis de processo para a entrada do sistema fuzzy, tais como temperatura de banho e percentual de fluoreto foram manipuladas para estimar a tendência de subida e descida, respectivamente, através do método mínimos quadrados(MMQ). O controlador fuzzy é aplicado para calcular a quantidade de fluoreto de alumínio (AlF3) a ser adicionado na cuba eletrolítica de forma automática sem a necessidade da intervenção do especialista do processo. A motivação para o uso de um sistema de controle fuzzy se deve ao fato de não se ter disponível um modelo dinâmico do processo de adição do fluoreto na cuba eletrolítica. Esta falta de modelagem se deve ao fato de grande complexidade dos fenômenos envolvidos em uma cuba que são processos termodinâmicos e eletromagnéticos acoplados. CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Controle de processos (Eng. sistemas) Sistema de análise de dados Sistemas difusos
50	Análise de sentimentos e afetividade de textos extraídos das redes sociais. / Sentiment analysis and affection of texts extracted from social networks. Renata Lopes Rosa 18 August 2015 (has links) Atualmente, os usuários expressam seus desejos e preferências em relação a um objeto, conteúdo ou evento por meio das redes sociais; portanto, analisar os sentimentos de uma pessoa no mundo digital sobre o que a rodeia tem sido cada vez mais frequente com o intuito de conhecer as preferências desta pessoa. O estudo propõe um novo mecanismo e cálculo de sentimentos e afetividade, aperfeiçoando a análise de sentimentos. Um mecanismo de cálculo de sentimentos associado a um fator de correção correspondente a n-gramas, tempos verbais, expressões e às características pessoas, tais como idade, gênero e escolaridade é desenvolvido neste trabalho. Os sentimentos negativos, neutros e positivos são extraídos de frases das redes sociais. As frases são classificadas em intensidade de sentimentos e em polaridade positiva, negativa ou neutra, por meio de um novo dicionário de palavras em português e de um novo cálculo de sentimentos. O cálculo de sentimentos possui regras específicas para tempos verbais (presente e passado) e advérbios. Os sentimentos das palavras são extraídos por meio de adjetivos, substantivos, palavras únicas (unigramas) e palavras que associadas (bigramas e trigramas) possuem um significado diferente de palavras únicas. Para validação do desempenho do dicionário e do novo mecanismo de cálculo de sentimentos, os resultados sao comparados com uma ferramenta de análise de sentimentos j´a existente, a SentiStrength e são validados por meio de testes subjetivos, com avaliadores remotos, com uma técnica denominada de crowdsourcing e por aprendizagem de máquina. O estudo também analisa a afetividade das frases e propõe uma métrica denominada de Brazillian Affective Metric (AFMBr), extraindo emoções de raiva, alegria, tristeza, surpresa e nojo. A solução de análise de sentimentos e afetividade é aplicada em um sistema de recomendação de músicas, como estudo de caso, o qual sugere conteúdos conforme o estado sentimental da pessoa. / Currently, users express their wishes and preferences in relation to an object, content or event through social networks; therefore analyze the sentiments of a person in the digital world about what surrounds the person has been increasingly used in order to know the preferences of this person. The study proposes new metrics of sentiments and affection, improving the sentiment analysis. The sentiment analysis metric associated with a corresponding correction factor for n-grams, tenses, expressions and personal characteristics such as age, gender and education is developed in this work. Negative, neutral and positive sentiments are extracted from social networks phrases. The sentences are ranked in positive, neutral or negative sentiment intensity or polarity by a new dictionary of words in Portuguese language and is extracted the sentiments. The calculation of sentiments has specific rules for verb tenses (present and past) and adverbs. The sentiments are extracted by means of adjectives, nouns, unigrams and associated words (bigrams and trigrams) that have a different meaning of single words. To validate the dictionary performance and new sentiments calculation mechanisms, the results are compared with an analysis tool of sentiments named of SentiStrength and are validated by subjective tests, with remote evaluators, with a technique named of crowdsourcing and machine learning. The study also analyzes the affection of sentences and proposes a metric called Brazillian Affective Metric (AFM-Br), that extracts emotions of anger, joy, sadness, surprise and disgust. The sentiment analysis solution and affection is applied in a music recommendation system, as a case study, which suggests content according to the emotional state of the person. Análise de dados Comunicação Internet Redes sociais Communication Data analysis Internet Social networks

Search results