Spelling suggestions: "subject:"documentos -"" "subject:"ocumentos -""
441 |
Um Modelo Baseado em Instituições Eletrônicas para Utilização, Certificação e Autenticação de uma Biblioteca Digital Temática / A Model Based on Electronic Institutions for the Use, Certification and Authentication of a Thematic Digital LibrarySilva, Rosaura Espírito Santo da 07 August 2008 (has links)
Made available in DSpace on 2016-03-22T17:26:09Z (GMT). No. of bitstreams: 1
Rosaura.pdf: 1428815 bytes, checksum: e1bbddca8023e11df043fcf404caaef9 (MD5)
Previous issue date: 2008-08-07 / The need to organize and certify documents stored in digital libraries leads us to search for a model that enables the consolidation of norms to regulate both the access to material and interactions among the users responsible for the utilization process, evaluation and certification of the documents to be digitalized. The use of the model and technology of the Electronic Institutions allows achieving this goal through a mechanism which leads to a natural extension from human institutions to an electronic environment. This work aims to shape an environment of electronic institution type to support the mechanism of evaluation and certification of digitalized documents in a thematic digital library / A necessidade de organizar e legitimar documentos armazenados em bibliotecas digitais nos remete à busca de um modelo que possibilite a consolidação de normas que norteiem o acesso aos acervos e as interações entre os usuários do sistema, especialmente as interações entre os usuários responsáveis pelo processo de utilização, avaliação e certificação dos documentos a serem digitalizados. A utilização do modelo e da tecnologia das instituições eletrônicas possibilita alcançar esse objetivo através de um mecanismo que remete a uma extensão natural das instituições humanas para um ambiente eletrônico. Este trabalho pretende modelar um ambiente tipo instituição eletrônica para embasar o mecanismo de avaliação e certificação de documentos digitalizados de uma biblioteca digital temática
|
442 |
Representação de coleções de documentos textuais por meio de regras de associação / Representation of textual document collections through association rulesRafael Geraldeli Rossi 16 August 2011 (has links)
O número de documentos textuais disponíveis em formato digital tem aumentado incessantemente. Técnicas de Mineração de Textos são cada vez mais utilizadas para organizar e extrair conhecimento de grandes coleções de documentos textuais. Para o uso dessas técnicas é necessário que os documentos textuais estejam representados em um formato apropriado. A maioria das pesquisas de Mineração de Textos utiliza a abordagem bag-of-words para representar os documentos da coleção. Essa representação usa cada palavra presente na coleção de documentos como possível atributo, ignorando a ordem das palavras, informa ções de pontuação ou estruturais, e é caracterizada pela alta dimensionalidade e por dados esparsos. Por outro lado, a maioria dos conceitos são compostos por mais de uma palavra, como Inteligência Articial, Rede Neural, e Mineração de Textos. As abordagens que geram atributos compostos por mais de uma palavra apresentam outros problemas além dos apresentados pela representação bag-of-words, como a geração de atributos com pouco signicado e uma dimensionalidade muito maior. Neste projeto de mestrado foi proposta uma abordagem para representar documentos textuais nomeada bag-of-related-words. A abordagem proposta gera atributos compostos por palavras relacionadas com o uso de regras de associação. Com as regras de associação, espera-se identicar relações entre palavras de um documento, além de reduzir a dimensionalidade, pois são consideradas apenas as palavras que ocorrem ou que coocorrem acima de uma determinada frequência para gerar as regras. Diferentes maneiras de mapear o documento em transações para possibilitar a geração de regras de associação são analisadas. Diversas medidas de interesse aplicadas às regras de associação para a extração de atributos mais signicativos e a redução do número de atributos também são analisadas. Para avaliar o quanto a representação bag-of-related-words pode auxiliar na organização e extração de conhecimento de coleções de documentos textuais, e na interpretabilidade dos resultados, foram realizados três grupos de experimentos: 1) classicação de documentos textuais para avaliar o quanto os atributos da representação bag-of-related-words são bons para distinguir as categorias dos documentos; 2) agrupamento de documentos textuais para avaliar a qualidade dos grupos obtidos com a bag-of-related-words e consequentemente auxiliar na obtenção da estrutura de uma hierarquia de tópicos; e 3) construção e avaliação de hierarquias de tópicos por especialistas de domínio. Todos os resultados e dimensionalidades foram comparados com a representação bag-of-words. Pelos resultados dos experimentos realizados, pode-se vericar que os atributos da representação bag-of-related-words possuem um poder preditivo tão bom quanto os da representação bag-of-words. A qualidade dos agrupamentos de documentos textuais utilizando a representação bag-of-related-words foi tão boa quanto utilizando a representação bag-of-words. Na avaliação de hierarquias de tópicos por especialistas de domínio, a utilização da representação bag-of-related-words apresentou melhores resultados em todos os quesitos analisados / The amount of textual documents available in digital format is incredibly large. Text Mining techniques are becoming essentials to manage and extract knowledge in big textual document collections. In order to use these techniques, the textual documents need to be represented in an appropriate format to allow the construction of a model that represents the embedded knowledge in these textual documents. Most of the researches on Text Mining uses the bag-of-words approach to represent textual document collections. This representation uses each word in a collection as feature, ignoring the order of the words, structural information, and it is characterized by the high dimensionality and data sparsity. On the other hand, most of the concepts are compounded by more than one word, such as Articial Intelligence, Neural Network, and Text Mining. The approaches which generate features compounded by more than one word to solve this problem, suer from other problems, as the generation of features without meaning and a dimensionality much higher than that of the bag-of-words. An approach to represent textual documents named bag-of-related-words was proposed in this master thesis. The proposed approach generates features compounded by related words using association rules. We hope to identify relationships among words and reduce the dimensionality with the use of association rules, since only the words that occur and cooccur over a frequency threshold will be used to generate rules. Dierent ways to map the document into transactions to allow the extraction of association rules are analyzed. Dierent objective interest measures applied to the association rules to generate more meaningful features and to the reduce the feature number are also analyzed. To evaluate how much the textual document representation proposed in this master project can aid the managing and knowledge extraction from textual document collections, and the understanding of the results, three experiments were carried out: 1) textual document classication to analyze the predictive power of the bag-of-related-words features, 2) textual document clustering to analyze the quality of the cluster using the bag-of-related-words representation 3) topic hierarchies building and evaluation by domain experts. All the results and dimensionalities were compared to the bag-of-words representation. The results presented that the features of the bag-of-related-words representation have a predictive power as good as the features of the bag-of-words representation. The quality of the textual document clustering also was as good as the bag-of-words. The evaluation of the topic hierarchies by domain specialists presented better results when using the bag-of-related-words representation in all the questions analyzed
|
443 |
Herramienta para gestión de proyectos basada en XPDL para el proyecto Competisoft: análisis y diseñoSilva Lazo, Anita Yesenia, Villegas Ortega, Sara Mirella 09 December 2011 (has links)
En el ambiente de negocios de hoy, más que nunca las organizaciones dependen
del buen resultado de sus proyectos para estar en condiciones de alcanzar una
multitud de objetivos; desde objetivos estratégicos hasta las mejoras operacionales
diarias.
El mundo en la actualidad está cambiando a velocidades inusitadas y las
organizaciones deben reaccionar rápidamente abordando proyectos que las ayuden
a alcanzar nuevos objetivos. La gestión de proyectos basada en una metodología
ordenada, sistemática y rigurosa facilita el trabajo en los proyectos que enfrentan
cada día las empresas y sus administradores. El adecuado conocimiento y
aplicación de alguna metodología para la gestión de proyectos permite crear un
ambiente de trabajo propicio y con menor variabilidad para obtener resultados
efectivos.
XPDL (XML Process Definition Language) es un lenguaje para la definición de un
flujo de trabajo propuesto por la WfMC (Workflow Management Coalition). El
objetivo de este lenguaje es proporcionar marco de referencia estándar que permita
la importación y exportación de las definiciones de procesos.
El presente trabajo de tesis presenta el desarrollo de una herramienta software
basada en el lenguaje XPDL, la cual fue concebida con el propósito de realizar el
seguimiento y control de cualquier tipo de proyecto de software, gestionando su
avance, plazos, esfuerzos, recursos y ofreciendo la información necesaria sobre
cada elemento para su administración oportuna, permite crear la instancia de una
metodología a través de una interfaz grafica, así como apoyar con el manejo de
otros elementos críticos en los proyectos informáticos como es la gestión de la
configuración.
Cabe resaltar que el presente proyecto es parte del componente de desarrollo de
herramientas que viene realizando el Grupo de Investigación y Desarrollo en
Ingeniería de Software y Sistemas de Información de la PUCP como parte del
Proyecto COMPETISOFT (Mejora de Procesos para Fomentar la Competitividad de
la Pequeña y Mediana Industria de Software de Ibero América). / Tesis
|
444 |
[en] A MULTI-AGENT FRAMEWORK FOR SEARCH AND FLEXIBILIZATION OF DOCUMENT CLASSIFICATION ALGORITHMS / [pt] UM FRAMEWORK MULTI-AGENTES PARA BUSCA E FLEXIBILIZAÇÃO DE ALGORITMOS DE CLASSIFICAÇÃO DE DOCUMENTOSJOAO ALFREDO PINTO DE MAGALHAES 18 June 2003 (has links)
[pt] Vivemos na era da informação, onde o conhecimento é criado
numa velocidade nunca antes vista. Esse aumento de
velocidade teve como principalrazão a Internet, que alterou
os paradigmas até então existentes de troca de informações
entre as pessoas. Através da rede, trabalhos inteiros podem
ser publicados, atingindo um público alvo impossível de ser
alcançado através dos meios existentes anteriormente.
Porém, o excesso de informação também pode agir no sentido
contrário: muita informação pode ser igual a nenhuma
informação. Nosso trabalho foi o de produzir um sistema
multi-agentes para busca e classificação de documentos
textuais de um domínio específico. Foi construída
uma infra-estrutura que separa as questões referentes à
busca e seleção dos documentos (plataforma) das referentes
ao algoritmo de classificação utilizado (uma aplicação do
conceito de separation of concerns). Dessa forma, é possível
não só acoplar algoritmos já existentes, mas também gerar
novos algoritmos levando em consideração características
específicas do domínio de documentos abordado. Foram
geradas quatro instâncias a partir do framework, uma
aplicação de webclipping, um componente para auxílio a
knowledge management, um motor de busca para websites e uma
aplicação para a web semântica. / [en] We are living in the information age, where knowledge is
constantly being created in a rate that was never seen
before. This is mainly due to Internet, that changed all
the information exchange paradigms between people. Through
the net, it is possible to publish or exchange whole works,
reaching an audience impossible to be reached through other
means. However, excess of information can be harmful:
having too much information can be equal to having no
information at all. Our work was to build a multi-agent
framework for search and flexibilization of textual
document classification algorithms of a specific domain.
We have built an infra-structure that separates the
concerns of document search and selection (platform) from
the concerns of document classification (an application of
the separation of concerns concept). It is possible not
only to use existing algorithms, but also to generate new
ones that consider domain-specific characteristics of
documents. We generated four instances of the framework, a
webclipping application, a knowledge management component,
a search engine for websites and an application for the
semantic web.
|
445 |
Herramienta para gestión de proyectos basada en XPDL para el proyecto Competisoft: construcción, pruebas e integraciónOcampo Moreno, Evelyn Lindsay, Gonzáles Cajahuanca, Carlos 09 December 2011 (has links)
En el ambiente de negocios de hoy, más que nunca las organizaciones dependen
del buen resultado de sus proyectos para estar en condiciones de alcanzar una
multitud de objetivos; desde objetivos estratégicos hasta las mejoras operacionales
diarias.
El mundo en la actualidad está cambiando a velocidades inusitadas y las
organizaciones deben reaccionar rápidamente abordando proyectos que las ayuden
a alcanzar nuevos objetivos. La gestión de proyectos basada en una metodología
ordenada, sistemática y rigurosa facilita la administración de los proyectos que
enfrentan cada día las empresas y sus administradores. El adecuado conocimiento
y aplicación de estas metodologías para gestión de proyectos permiten crear un
ambiente de trabajo propicio y con menor variabilidad para obtener resultados
efectivos.
XPDL (XML Process Definition Language) es un lenguaje para la definición de un
flujo de trabajo propuesto por la WfMC (Workflow Management Coalition). El
objetivo de este lenguaje es proporcionar una manera estándar que permita la
importación y exportación de las definiciones de procesos.
El presente trabajo de tesis presenta el desarrollo de una herramienta software
basada en el lenguaje XPDL, la cual fue concebida con el propósito de realizar el
seguimiento y control de cualquier tipo de proyecto de software, gestionando su
avance, plazos, esfuerzos, recursos y ofreciendo la información necesaria sobre
cada elemento para su administración oportuna, permite crear la instancia de una
metodología a través de una interfaz grafica, así como apoyar con el manejo de
otros elementos críticos en los proyectos informáticos como es la gestión de la
configuración.
Cabe resaltar que el presente proyecto es parte del componente de desarrollo de
herramientas que viene realizando el Grupo de Investigación y Desarrollo en
Ingeniería de Software y Sistemas de Información de la PUCP como parte del
Proyecto COMPETISOFT (Mejora de Procesos para Fomentar la Competitividad de
la Pequeña y Mediana Industria de Software de Ibero América). / Tesis
|
446 |
Um estudo sobre o conceito de média com alunos do ensino médioStella, Cristiane Aparecida 20 October 2003 (has links)
Made available in DSpace on 2016-04-27T16:57:59Z (GMT). No. of bitstreams: 1
dissertacao_cristiane_aparecida_stella.pdf: 1011477 bytes, checksum: 8af2fd47e78cf6fc9a0e5454c0cd1994 (MD5)
Previous issue date: 2003-10-20 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The aim of this study is to identify interpretations of the concept of arithmetic mean held by High School students following the Brazilian curriculum. With this aim in mind, we investigate the characteristics of the concept of mean that are emphasised in the High School Mathematics Curriculum and in research studies related to understanding the teaching and learning processes associated with this concept. We begin our research with some considerations about the concept of mean from historical and epistemological perspectives. We go on to attempt to identify aspects of the concept emphasised in the following teaching instruments: official documents (PCNs), textbooks, and systems of curriculum evaluation (ENEM and SAEB). We also determine different approaches to the concept that are proposed in Mathematics Education research studies, choosing as a basis for our analyses the theoretical model of Batanero (2000). As a result of these investigations, we selected some questions to be used in interviews of students from the third year of High School, with questions chosen to take into account the different approaches associated with teaching instruments and the research studies. Analysis of the interviews indicate that, on the one hand, students perform well in relation to problems involving weighted means and in problems of construction (problems in which they construct distributions of data sets). On the other hand, most of the students interviewed see mean as algorithm and have difficulties in solving problems in which they have to calculate means on the basis of graphically presented data. These results suggest problems in the teaching and learning of mean that go beyond the student and are associated with structural questions which have their beginning in official documents, reaching the students by means of mathematics textbooks and forms of evaluation / O objetivo deste trabalho é identificar as interpretações do conceito de média, de alunos do Ensino Médio, que seguem o currículo brasileiro. Para alcançar este objetivo pesquisamos as características do conceito de média enfatizadas no currículo de Matemática do Ensino Médio e em pesquisas que visam compreender a aprendizagem de tal conceito. Iniciamos nossa pesquisa com algumas considerações do conceito de média sob o ponto de vista histórico e epistemológico. Em seguida, buscamos identificar os aspectos do conceito de média enfatizados em instrumentos de ensino como: documentos oficiais (PCN s), livros didáticos do Ensino Médio, os sistemas de avaliação ENEM e SAEB. Também consideramos as abordagens ao conceito propostas em pesquisas de Educação e escolhemos, como base para nossas análises, em particular, o modelo teórico proposto por Batanero (2000). A luz destas investigações, selecionamos algumas questões para aplicarmos nas entrevistas a alunos da 3ª série do Ensino Médio, de tal forma que contemplasse os diferentes elementos do conceito e as diferentes abordagens enfatizadas nos instrumentos de ensino e nas pesquisas que foram apresentadas. Os resultados obtidos indicam que os alunos apresentaram um bom desempenho com problemas que envolvem média aritmética ponderada e em problemas de construção (problemas em que o aluno constrói a distribuição dos dados). Em contrapartida, a maioria dos alunos pesquisados tem uma interpretação algorítmica do conceito de média e apresentam dificuldade para resolver problemas que envolvem o cálculo de média quando os dados são apresentados na forma gráfica. Tais resultados sugerem problemas no aprendizado de média que vão além do aluno, mas têm a ver com uma questão estrutural que começa nos documentos oficiais, percorre os livros didáticos, as formas de avaliação até chegar ao aluno
|
447 |
Isometrias: análise de documentos curriculares e uma proposta de situações de aprendizagem para o ensino médioCerqueira, Ana Paula Ferreia de 25 November 2005 (has links)
Made available in DSpace on 2016-04-27T17:13:01Z (GMT). No. of bitstreams: 1
Ana Cerqueira.pdf: 1570620 bytes, checksum: 3496da2b04cd3f14e86b1d78c9db51fd (MD5)
Previous issue date: 2005-11-25 / Made available in DSpace on 2016-08-25T17:25:34Z (GMT). No. of bitstreams: 2
Ana Cerqueira.pdf.jpg: 1943 bytes, checksum: cc73c4c239a4c332d642ba1e7c7a9fb2 (MD5)
Ana Cerqueira.pdf: 1570620 bytes, checksum: 3496da2b04cd3f14e86b1d78c9db51fd (MD5)
Previous issue date: 2005-11-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The aim of this research was to investigate the insertion of isometries in the
mathematics curriculum, both from an official perspective and in terms of questions
related to practice. To this end, it was divided into two parts. The first part considered
the characteristics of isometries emphasised in official teaching instruments, such as
the National Curriculum Parameters (PCN) and mathematics textbooks. In the PCN, a
rupture was identified between the levels of Middle School and High School. In the
Middle School parametesr, isometric transformations figure highly, while at the High
School level they are not explicity included at all. In relation to the Middle School
textbooks analised, isometries were not incorporated in a uniform manner: one
collection did not consider the topic, while in the other they were comprehensively
covered for all Middle School grades. To analise the activities presented in this second
collection, a classification system based on four level of complexity of the conceptual
field of Symmetry (Vergnaud, 1997) was developed. This enabled the description of a
gradual progression in the appropriation of concepts associated with symmetry. In the
High School textbooks, no continuation of this progression was found, as it was difficult
to locate activities belonging to the conceptual field of symmetry in either of the
collections analised. In the second part of the study, a set of situations was designed
for High School students. The results indicated that although the students, all of whom
studied at night, had never studied symmetry before, they appropriated with success
the idea of axial symmetry as a property of a figure and experienced symmetry as a
relationship between two distinct figures. There were also signs that they could have
considered symmetry as an object with its own properties / O objetivo desta pesquisa foi investigar a inserção das isometrias no currículo
de matemática, tanto sob o ponto de vista oficial como da prática. Para
alcançar esse objetivo, o trabalho dividiu-se em duas partes: na primeira, foram
consideradas as características das isometrias enfatizadas nos instrumentos
oficiais de ensino, tais como: Parâmetros Curriculares Nacionais e Livros
Didáticos do Ensino Fundamental e Médio avaliados pelo Programa Nacional
do Livro Didático/2005. Nos PCN, identificou-se uma ruptura no tratamento
entre as duas etapas do ensino e nos PCN-EF as isometrias estão bastante
presentes, ao passo que nos PCNEM a inclusão desse tópico não se encontra
explícita. Em relação aos Livros Didáticos do Ensino Fundamental analisados,
a incorporação das isometrias não era uniforme, ou seja, uma coleção não
aborda o tema , enquanto na outra, as isometrias foram citadas em todas as
séries. Para analisar as atividades dessa coleção, um sistema de classificação
foi desenvolvido que se baseou em quatro níveis de complexidades do Campo
Conceitual da Simetria, de acordo com Vergnaud (1997). Esta análise permitiu
descrever uma progressão gradativa da apropriação de conceitos relacionados
à simetria. Nos livros do Ensino Médio, foi difícil localizar atividades que
trataram o Campo Conceitual da Simetria de forma sistemática. Na segunda
parte, foi elaborado e desenvolvido um conjunto de situações de ensino para
alunos do Ensino Médio (noturno). Os resultados indicaram que, embora os
alunos não tivessem estudado o conceito de simetria antes, eles se
apropriaram com sucesso da idéia de simetria como propriedade de uma figura
e, também, vivenciaram a simetria axial como uma relação entre duas figuras
distintas. Além disso, o desenvolvimento dos alunos diante das situações
indicou que eles poderiam ter trabalhado também com simetria, como objeto
em um nível de complexidade mais elevado do Campo Conceitual da Simetria
|
448 |
Preservação digital: autenticidade e integridade de documentos em bibliotecas digitais de teses e dissertações / Digital preservation: authenticity and integrity of documents in digital libraries of theses and dissertations.Corrêa, Amarílis Montagnolli Gomes 09 September 2010 (has links)
Os avanços tecnológicos impõem um grande desafio para a preservação do patrimônio digital. Além de garantir a longevidade e acessibilidade dos documentos, é necessário mantê-los autênticos e íntegros para que os usuários confiem neles como fonte de informação e objeto de estudo. Instituições guardiãs precisam assumir a preservação de suas coleções digitais e construir repositórios digitais confiáveis. Este trabalho recorre a um estudo exploratório para conhecer as práticas de preservação da autenticidade e integridade dos documentos que compõem os acervos das bibliotecas digitais de teses e dissertações das três universidades estaduais paulistas (Universidade de São Paulo - USP, Universidade Estadual Paulista Júlio Mesquita Filho - Unesp e Universidade Estadual de Campinas - Unicamp). As práticas dessas universidades demonstram a necessidade de melhorias para que elas sejam efetivamente capazes de assumir a responsabilidade de salvaguardar o patrimônio digital. / Technological innovations raise a set of great challenges to the preservation of digital heritage. Besides assuring the longevity and accessibility of digital documents, it is also important to preserve their authenticity and integrity so one can trust and use digital documents as information source and study objects. Memory organizations must assume an active role in preserving their digital collections and building trusted digital repositories. This dissertation searches through an exploratory study to uncover the practices of the digital libraries of theses and dissertations of the three state universities of Sao Paulo (Universidade de São Paulo - USP, Universidade Estadual Paulista Júlio de Mesquita Filho - Unesp e Universidade Estadual de Campinas - Unicamp) for preserving the authenticity and integrity of their collections. Their preservation practices show that improvements need to be done so they can in fact take the responsibility of preserving digital heritage.
|
449 |
Contribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico / Contributions to topic taxonomy construction in a specific domain using statistical learningMoura, Maria Fernanda 26 October 2009 (has links)
A mineração de textos vem de encontro à realidade atual de se compreender e utilizar grandes massas de dados textuais. Uma forma de auxiliar a compreensão dessas coleções de textos é construir taxonomias de tópicos a partir delas. As taxonomias de tópicos devem organizar esses documentos, preferencialmente em hierarquias, identificando os grupos obtidos por meio de descritores. Construir manual, automática ou semi-automaticamente taxonomias de tópicos de qualidade é uma tarefa nada trivial. Assim, o objetivo deste trabalho é construir taxonomias de tópicos em domínios de conhecimento restrito, por meio de mineração de textos, a fim de auxiliar o especialista no domínio a compreender e organizar os textos. O domínio de conhecimento é restrito para que se possa trabalhar apenas com métodos de aprendizado estatístico não supervisionado sobre representações bag of words dos textos. Essas representações independem do contexto das palavras nos textos e, conseqüentemente, nos domínios. Assim, ao se restringir o domínio espera-se diminuir erros de interpretação dos resultados. A metodologia proposta para a construção de taxonomias de tópicos é uma instanciação do processo de mineração de textos. A cada etapa do processo propôem-se soluções adaptadas às necessidades específicas de construçao de taxonomias de tópicos, dentre as quais algumas contribuições inovadoras ao estado da arte. Particularmente, este trabalho contribui em três frentes no estado da arte: seleção de atributos n-gramas em tarefas de mineração de textos, dois modelos para rotulação de agrupamento hierárquico de documentos e modelo de validação do processo de rotulação de agrupamento hierárquico de documentos. Além dessas contribuições, ocorrem outras em adaptações e metodologias de escolha de processos de seleção de atributos, forma de geração de atributos, visualização das taxonomias e redução das taxonomias obtidas. Finalmente, a metodologia desenvolvida foi aplicada a problemas reais, tendo obtido bons resultados. / Text mining provides powerful techniques to help on the current needs of understanding and organizing huge amounts of textual documents. One way to do this is to build topic taxonomies from these documents. Topic taxonomies can be used to organize the documents, preferably in hierarchies, and to identify groups of related documents and their descriptors. Constructing high quality topic taxonomies, either manually, automatically or semi-automatically, is not a trivial task. This work aims to use text mining techniques to build topic taxonomies for well defined knowledge domains, helping the domain expert to understand and organize document collections. By using well defined knowledge domains, only unsupervised statistical methods are used, with a bag of word representation for textual documents. These representations are independent of the context of the words in the documents as well as in the domain. Thus, if the domain is well defined, a decrease of mistakes of the result interpretation is expected. The proposed methodology for topic taxonomy construction is an instantiation of the text mining process. At each step of the process, some solutions are proposed and adapted to the specific needs of topic taxonomy construction. Among these solutions there are some innovative contributions to the state of the art. Particularly, this work contributes to the state of the art in three different ways: the selection of n-grams attributes in text mining tasks, two models for hierarchical document cluster labeling and a validation model of the hierarchical document cluster labeling. Additional contributions include adaptations and methodologies of attribute selection process choices, attribute representation, taxonomy visualization and obtained taxonomy reduction. Finally, the proposed methodology was also validated by successfully applying it to real problems
|
450 |
Leituras a vapor: a cultura letrada na Belém oitocentistaNOBRE, Izenete Garcia 27 April 2009 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2013-06-04T17:49:57Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_LeiturasVaporCultura.pdf: 5181568 bytes, checksum: 1278306fa0cb047dc6eda6b3c7e24419 (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-06-11T12:34:46Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_LeiturasVaporCultura.pdf: 5181568 bytes, checksum: 1278306fa0cb047dc6eda6b3c7e24419 (MD5) / Made available in DSpace on 2013-06-11T12:34:46Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_LeiturasVaporCultura.pdf: 5181568 bytes, checksum: 1278306fa0cb047dc6eda6b3c7e24419 (MD5)
Previous issue date: 2009-04 / FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas / Dans la Deuxieme moitié du XIXe siècle, em particulier à partir de 1850, lê quotidien
à Belém a révelé le processus d’intensification de l’urbanisation par une vague
croissante d’immigrés étrangers, notamment portugais demandant l’intensité
intellectuelle et culturelle de laville. Dans ce contexte, il est essentiel que les
perfamances des libraires injecté sur le marché, avant un discours plein de grâce,
l’absence d’un nouveau souffle livresque. Responsable de la fixation des libraires de
la circulation des journaux et les bases de la lecture des espaces conseillers ont
montré de l’intérêt dans le « civilisé » et de « charger » en entrant das la ville, dans
un contexte de modernité, en montrant que le progrès économique qui devrait déjà
avoir eu lieu longtemps. L’objectif de cette thèse est de savoir comment l’histoire est
le processus de circulation des livres en tant que représentant d’une transformation
culturelle dans les habitudes de la population. / Na segunda metade do século XIX, notadamente a partir de 1850, a imprensa diária
em Belém revelou o processo de urbanização crescente intensificado por uma leva
de imigrantes estrangeiros, notadamente portugueses que requereu intensamente a
organização intelectual e cultural da cidade. Nesse contexto foi imprescindível a
atuação de livreiros que injetaram no mercado, antes repletos de um discurso de
carência, de falta um novo fôlego livresco. A fixação de livreiros, responsáveis pela
circulação da imprensa diária e a fundação de espaços vulgarizadores da leitura
demonstravam o interesse em “civilizar” e “instruir”, em inserir a cidade num contexto
de modernidade que pelo avanço econômico que rava já deveria ter ocorrido há
tempos. O objetivo desta dissertação é historiografar como ocorre o processo de
circulação de livros como representativos de uma transformação cultural nos hábitos
da população.
|
Page generated in 0.0732 seconds