Global ETD Search

11	Classificação automática de textos por meio de aprendizado de máquina baseado em redes / Text automatic classification through machine learning based on networks Rafael Geraldeli Rossi 26 October 2015 (has links) Nos dias atuais há uma quantidade massiva de dados textuais sendo produzida e armazenada diariamente na forma de e-mails, relatórios, artigos e postagens em redes sociais ou blogs. Processar, organizar ou gerenciar essa grande quantidade de dados textuais manualmente exige um grande esforço humano, sendo muitas vezes impossível de ser realizado. Além disso, há conhecimento embutido nos dados textuais, e analisar e extrair conhecimento de forma manual também torna-se inviável devido à grande quantidade de textos. Com isso, técnicas computacionais que requerem pouca intervenção humana e que permitem a organização, gerenciamento e extração de conhecimento de grandes quantidades de textos têm ganhado destaque nos últimos anos e vêm sendo aplicadas tanto na academia quanto em empresas e organizações. Dentre as técnicas, destaca-se a classificação automática de textos, cujo objetivo é atribuir rótulos (identificadores de categorias pré-definidos) à documentos textuais ou porções de texto. Uma forma viável de realizar a classificação automática de textos é por meio de algoritmos de aprendizado de máquina, que são capazes de aprender, generalizar, ou ainda extrair padrões das classes das coleções com base no conteúdo e rótulos de documentos textuais. O aprendizado de máquina para a tarefa de classificação automática pode ser de 3 tipos: (i) indutivo supervisionado, que considera apenas documentos rotulados para induzir um modelo de classificação e classificar novos documentos; (ii) transdutivo semissupervisionado, que classifica documentos não rotulados de uma coleção com base em documentos rotulados; e (iii) indutivo semissupervisionado, que considera documentos rotulados e não rotulados para induzir um modelo de classificação e utiliza esse modelo para classificar novos documentos. Independente do tipo, é necessário que as coleções de documentos textuais estejam representadas em um formato estruturado para os algoritmos de aprendizado de máquina. Normalmente os documentos são representados em um modelo espaço-vetorial, no qual cada documento é representado por um vetor, e cada posição desse vetor corresponde a um termo ou atributo da coleção de documentos. Algoritmos baseados no modelo espaço-vetorial consideram que tanto os documentos quanto os termos ou atributos são independentes, o que pode degradar a qualidade da classificação. Uma alternativa à representação no modelo espaço-vetorial é a representação em redes, que permite modelar relações entre entidades de uma coleção de textos, como documento e termos. Esse tipo de representação permite extrair padrões das classes que dificilmente são extraídos por algoritmos baseados no modelo espaço-vetorial, permitindo assim aumentar a performance de classificação. Além disso, a representação em redes permite representar coleções de textos utilizando diferentes tipos de objetos bem como diferentes tipos de relações, o que permite capturar diferentes características das coleções. Entretanto, observa-se na literatura alguns desafios para que se possam combinar algoritmos de aprendizado de máquina e representações de coleções de textos em redes para realizar efetivamente a classificação automática de textos. Os principais desafios abordados neste projeto de doutorado são (i) o desenvolvimento de representações em redes que possam ser geradas eficientemente e que também permitam realizar um aprendizado de maneira eficiente; (ii) redes que considerem diferentes tipos de objetos e relações; (iii) representações em redes de coleções de textos de diferentes línguas e domínios; e (iv) algoritmos de aprendizado de máquina eficientes e que façam um melhor uso das representações em redes para aumentar a qualidade da classificação automática. Neste projeto de doutorado foram propostos e desenvolvidos métodos para gerar redes que representem coleções de textos, independente de domínio e idioma, considerando diferentes tipos de objetos e relações entre esses objetos. Também foram propostos e desenvolvidos algoritmos de aprendizado de máquina indutivo supervisionado, indutivo semissupervisionado e transdutivo semissupervisionado, uma vez que não foram encontrados na literatura algoritmos para lidar com determinados tipos de relações, além de sanar a deficiência dos algoritmos existentes em relação à performance e/ou tempo de classificação. É apresentado nesta tese (i) uma extensa avaliação empírica demonstrando o benefício do uso das representações em redes para a classificação de textos em relação ao modelo espaço-vetorial, (ii) o impacto da combinação de diferentes tipos de relações em uma única rede e (iii) que os algoritmos propostos baseados em redes são capazes de superar a performance de classificação de algoritmos tradicionais e estado da arte tanto considerando algoritmos de aprendizado supervisionado quanto semissupervisionado. As soluções propostas nesta tese demonstraram ser úteis e aconselháveis para serem utilizadas em diversas aplicações que envolvam classificação de textos de diferentes domínios, diferentes características ou para diferentes quantidades de documentos rotulados. / A massive amount of textual data, such as e-mails, reports, articles and posts in social networks or blogs, has been generated and stored on a daily basis. The manual processing, organization and management of this huge amount of texts require a considerable human effort and sometimes these tasks are impossible to carry out in practice. Besides, the manual extraction of knowledge embedded in textual data is also unfeasible due to the large amount of texts. Thus, computational techniques which require little human intervention and allow the organization, management and knowledge extraction from large amounts of texts have gained attention in the last years and have been applied in academia, companies and organizations. The tasks mentioned above can be carried out through text automatic classification, in which labels (identifiers of predefined categories) are assigned to texts or portions of texts. A viable way to perform text automatic classification is through machine learning algorithms, which are able to learn, generalize or extract patterns from classes of text collections based on the content and labels of the texts. There are three types of machine learning algorithms for automatic classification: (i) inductive supervised, in which only labeled documents are considered to induce a classification model and this model are used to classify new documents; (ii) transductive semi-supervised, in which all known unlabeled documents are classified based on some labeled documents; and (iii) inductive semi-supervised, in which labeled and unlabeled documents are considered to induce a classification model in order to classify new documents. Regardless of the learning algorithm type, the texts of a collection must be represented in a structured format to be interpreted by the algorithms. Usually, the texts are represented in a vector space model, in which each text is represented by a vector and each dimension of the vector corresponds to a term or feature of the text collection. Algorithms based on vector space model consider that texts, terms or features are independent and this assumption can degrade the classification performance. Networks can be used as an alternative to vector space model representations. Networks allow the representations of relations among the entities of a text collection, such as documents and terms. This type of representation allows the extraction patterns which are not extracted by algorithms based on vector-space model. Moreover, text collections can be represented by networks composed of different types of entities and relations, which provide the extraction of different patterns from the texts. However, there are some challenges to be solved in order to allow the combination of machine learning algorithms and network-based representations to perform text automatic classification in an efficient way. The main challenges addressed in this doctoral project are (i) the development of network-based representations efficiently generated which also allows an efficient learning; (ii) the development of networks which represent different types of entities and relations; (iii) the development of networks which can represent texts written in different languages and about different domains; and (iv) the development of efficient learning algorithms which make a better use of the network-based representations and increase the classification performance. In this doctoral project we proposed and developed methods to represent text collections into networks considering different types of entities and relations and also allowing the representation of texts written in any language or from any domain. We also proposed and developed supervised inductive, semi-supervised transductive and semi-supervised inductive learning algorithms to interpret and learn from the proposed network-based representations since there were no algorithms to handle certain types of relations considered in this thesis. Besides, the proposed algorithms also attempt to obtain a higher classification performance and a faster classification than the existing network-based algorithms. In this doctoral thesis we present (i) an extensive empirical evaluation demonstrating the benefits about the use of network-based representations for text classification, (ii) the impact of the combination of different types of relations in a single network and (iii) that the proposed network-based algorithms are able to surpass the classification performance of traditional and state-of-the-art algorithms considering both supervised and semi-supervised learning. The solutions proposed in this doctoral project have proved to be advisable to be used in many applications involving classification of texts from different domains, areas, characteristics or considering different numbers of labeled documents. Aprendizado de máquina Classificação de textos Propagação de rótulos Redes heterogêneas Heterogeneous networks Label propagation Machine learning Text classification
12	Multiplicidade de pobrezas nas redes heterogêneas das políticas públicas contemporâneas Curado, Jacy Corrêa 03 July 2012 (has links) Made available in DSpace on 2016-04-29T13:30:58Z (GMT). No. of bitstreams: 1 Jacy Correa Curado.pdf: 1878864 bytes, checksum: 30c8d5cefd3066c88698e38bd8dced21 (MD5) Previous issue date: 2012-07-03 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This dissertation addresses poverty as a multiple and complex phenomenon performed by a network of heterogeneous materials from contemporary public policies. To delimit these assumptions, theoretical and epistemological dialogues based on Discursive Social Psychology were articulated, addressing aspects such as the historical construction of poverty, importance of language in this construction, polysemy of meanings, and corresponding linguistic repertoires. Poverty was interpreted as a manifestation of the governmentalization of the Modern State that allowed the pursuit of a specific and complex form of government targeting the poor. Strategies for combating poverty also underwent resignifications accompanying the processes of metamorphosis and reconversion of social issues, bringing about changes in the framework of contemporary social policies, ultimately taking on the form of income transfer. To understand how the Public Policy for Combating Poverty is performed by a heterogeneous network of human and nonhuman actors through the Bolsa Família Income Allowance Program, a dialogue was articulated with selected inputs from the Actor-Network Theory and epistemological references questioning the ontological bases of truth and reality through the notions of multiplicity and performativity. Drawing on observations, interviews, conversations, and readings of public documents addressing actions of the Bolsa Família Program, three versions of "poverty" emerged: calculated, officially recorded, and controlled. These versions coexist and should not be interpreted in isolation, since taken together they would yield a joint entity or comprise a portrait of poverty that is homogeneous, stable, and permanent, understood from diverse viewpoints and perspectives. By contrast, a focus on a multiplicity of poverties is proposed in the present study. Connections between and bifurcations from versions of poverty produced by the materialities and socialities of the heterogeneous network of public policies for combating poverty are also highlighted, in a bid to destabilize, deterritorialize, and impart flexibility to the traditional notions of poor and poverty" / Esta tese apresenta a pobreza como múltipla e complexa, performada por uma rede de materiais heterogêneos nas políticas públicas contemporâneas. Para chegarmos a esses pressupostos construímos diálogos teóricos e epistemológicos com a abordagem da Psicologia Social Discursiva, tais como a construção histórica da pobreza, a importância da linguagem nessa construção, a polissemia de sentidos e seus repertórios linguísticos. Procurou-se entendê-la como manifestação de governamentalização do Estado Moderno, que permitiram o exercício de uma de forma específica e complexa de governo, que tem por alvo a população pobre. O enfrentamento à pobreza também passou por ressignificações trazidas pelos processos de metamorfose e reconversão da questão social, produzindo mudanças no marco das políticas sociais contemporâneas, assumindo o formato da transferência de renda. Para compreender como a Política Pública de Enfrentamento à Pobreza é performada por uma rede heterogênea de atores humanos e não humanos via o Programa Bolsa Família, articulou-se ainda um diálogo com algumas pontuações da Teoria Ator-rede e referenciais epistemológicos que questionam os fundamentos ontológicos de verdade e realidade por meio das noções de multiplicidade e performatividade. A partir das observações, entrevistas, conversas e leitura de documentos públicos das ações do Programa Bolsa Família, descrevemos três versões de pobrezas : a pobreza calculada, a cadastrada e a controlada. Essas versões coexistem entre si, e não devem ser entendidas de forma isoladas de tal modo que somadas produziriam um todo ou comporiam um retrato da pobreza homogênea, estável e permanente, apreendida por uma diversidade de olhares e perspectivas. Ao contrário, propomos aqui se trate de uma multiplicidade de pobrezas . Pontuamos também as conexões e bifurcações entre as versões de pobrezas produzidas pelas materialidades e socialidades da rede heterogênea das políticas públicas de enfrentamento à pobreza, como forma de desestabilizar, desterritorializar e flexibilizar as noções tradicionais de pobre e pobreza Pobrezas Multiplicidade Redes heterogêneas Psicologia social Políticas públicas Poverties Multiplicity Heterogeneous networks Social psychology Public policies
13	A vida cotidiana no movimento das águas pantaneiras / Everyday life moved by the waters of the Pantanal Luiz, George Moraes De 16 November 2015 (has links) Made available in DSpace on 2016-04-29T13:31:20Z (GMT). No. of bitstreams: 1 George Moraes De Luiz.pdf: 5186035 bytes, checksum: 3b435105f641786fe4bc92c797215ff4 (MD5) Previous issue date: 2015-11-16 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / This research looks into the co-inhabitance of the population native to the Pantanal region in the center-west region of Brazil, state of Mato Grosso, with the cycle of full tide of the swamps surrounding the rural areas of three cities. We have selected the water cycle as our subject because they dictate the course all forms of life in the Pantanal. The basis of our discussion is formed by an interdisciplinary perspective, which allows for theoretical and methodological approximations with different areas of the social sciences and human sciences, notably the theoretical and epistemological notions of the Actor-Network theory. This has provided us with the understanding of the swamps as heterogeneous networks, establishing a debate with authors of the field of Environmental Education. We have assigned ourselves the task of writing a thesis in which both style and content question the "canons" of the academy, thus opening ourselves to reflections upon new manners of doing social research. In this challenge, we have given a poetic note to the text, valuing the traditional knowledge of the Pantanal region without losing sight of scientific knowledge. This thesis is the result of experiences lived by the researcher as an inhabitant of the Pantanal region, as wells as a result of formal and informal conversations with 42 people who are directly associated with the activities conducted in the swamps, among whom those who live on the river banks. Anchored in the notions of Everyday Conversation, with semi-structured script and field annotations, we have systematized the information by the means of fluctuating readings, generating themes which comprise the corpus of the thesis in the form descriptive narratives. The focus of our analysis is on the manner in which traditional populations predict, prepare themselves for, and live with the cycle of full tide, prioritizing the association between humans and non-humans as a possibility for survival in a flooded territory. The co-inhabitance of people with the full tides is described here in three different themes: birth-giving, housing, and means of transportation. This way of life, intertwined with nature, is commonly described in classic literature as the culture and tradition of the Pantanal populations. However, what we indicate here is that new actors, such as the construction of river dams, park roads and industrial plants, interfere in the Pantanal, altering the cycle of full tide. Due to this interference, it becomes unviable to understand the ways of life of the local populations as crystallized, which makes us argue in favor of the processuality of relations between people and nature, while rethinking the very notion of what the swamps come to be after constant socio-environmental interventions / O foco desta pesquisa é a convivência da população pantaneira com o ciclo de cheia nos pantanais mato-grossenses da região rural dos municípios de Barão de Melgaço, Poconé e Nossa Senhora do Livramento. Elegemos o ciclo das águas como fio condutor deste trabalho por ele ditar o ritmo de todas as formas de vida no Pantanal. Para sustentar nossa discussão, adotamos uma postura interdisciplinar, o que permite aproximações teórico-metodológicas com diferentes áreas das ciências sociais e humanas, notadamente os pressupostos teórico-epistemológicos da teoria ator-rede, o que permitiu compreender os pantanais como redes heterogêneas, em diálogo com autores da educação ambiental. Demo-nos a tarefa de escrever uma tese cujo estilo e conteúdo questionam os cânones da academia, abrindo-nos, assim, para reflexões sobre novas formas de fazer pesquisa social. Nesse desafio, demos tons poéticos ao texto, valorizando o saber tradicional pantaneiro sem abrir mão do conhecimento científico. Esta tese resulta das experiências vivenciadas pelo pesquisador enquanto morador da região pantaneira de Poconé, assim como da convivência e de conversas formais e informais com 42 pessoas ligadas diretamente às atividades nos pantanais, com destaque para os(as) pantaneiros(as) e ribeirinhos(as). Ancorados nas noções de conversas no cotidiano, com roteiro semiestruturado e anotações de diário de campo, sistematizamos as informações por meio de leituras flutuantes, gerando temas que compuseram o corpus da tese em forma de narrativas descritivas. O enfoque de nossa análise está na maneira como os povos tradicionais preveem, se preparam e convivem com o ciclo de cheias, privilegiando a associação entre humanos e não humanos como possibilidade de sobrevivência em um território de inundação. A convivência das pessoas com as cheias está descrita a partir de três temas: os partos, as moradias e os meios de transportes. Comumente, esse modo de vida que se atrela aos elementos da natureza é descrito pela literatura clássica como cultura e tradição pantaneira. Entretanto, sinalizamos aqui que novos atores, como a construção de diques, estradas-parque, aterros e usinas, interferem nos pantanais, alterando o ciclo de cheias. Considerando esse pressuposto, apontamos a inviabilidade de compreender os modos de vida pantaneiros de forma cristalizada, argumentando a favor da processualidade das relações entre os povos pantaneiros com a natureza, e repensando a própria noção do que vêm a ser os pantanais após constantes intervenções socioambientais Redes heterogêneas Pantanal Cheias Intervenções socioambientais Social Psychology Heterogeneous networks Pantanal Full tides Socio-environmental interventions

Page generated in 0.0935 seconds