81 |
Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering" / A study about arrangement of textual documents applied to unstructured information processing using clustering techniquesWives, Leandro Krug January 1999 (has links)
Atualmente, técnicas de recuperação e análise de informações, principalmente textuais, são de extrema importância. Após o grande BOOM da Internet, muitos problemas que já eram conhecidos em contextos fechados passaram a preocupar também toda a comunidade científica. No âmbito deste trabalho os problemas relacionados à sobrecarga de informações, que ocorre devido ao grande volume de dados a disposição de uma pessoa, são os mais importantes. Visando minimizar estes problemas, este trabalho apresenta um estudo sobre métodos de agrupamento de objetos textuais (documentos no formato ASCII), onde os objetos são organizados automaticamente em grupos de objetos similares, facilitando sua localização, manipulação e análise. Decorrente deste estudo, apresenta-se uma metodologia de aplicação do agrupamento descrevendo-se suas diversas etapas. Estas etapas foram desenvolvidas de maneira que após uma ter sido realizada ela não precisa ser refeita, permitindo que a etapa seguinte seja aplicada diversas vezes sobre os mesmos dados (com diferentes parâmetros) de forma independente. Além da metodologia, realiza-se um estudo comparativo entre alguns algoritmos de agrupamento, inclusive apresentando-se um novo algoritmo mais eficiente. Este fato é comprovado em experimentos realizados nos diversos estudos de caso propostos. Outras contribuições deste trabalho incluem a implementação de uma ferramenta de agrupamento de textos que utiliza a metodologia elaborada e os algoritmos estudados; além da utilização de uma fórmula não convencional de cálculo de similaridades entre objetos (de abordagem fuzzy), aplicada a informações textuais, obtendo resultados satisfatórios. / The Internet is the vital media of today and, as being a mass media, problems known before to specific fields of Science arise. One of these problems, capable of annoying many people, is the information overload problem caused by the excessive amount of information returned in response to the user’s query. Due to the information overload problem, advanced techniques for information retrieval and analysis are needed. This study presents some aids in these fields, presenting a methodology to help users to apply the clustering process in textual data. The technique investigated is capable of grouping documents of several subjects in clusters of documents of the same subject. The groups identified can be used to simplify the process of information analysis and retrieval. This study also presents a tool that was created using the methodology and the algorithms analyzed. The tool was implemented to facilitate the process of investigation and demonstration of the study. The results of the application of a fuzzy formula, used to calculate the similarity among documents, are also presented.
|
82 |
Utilizando o processo de descoberta de conhecimento em banco de dados para identificar candidatos a padrão de análise para bancos de dados geográficosSilva, Carolina Martins Soares January 2003 (has links)
Sistemas de informações geográficas (SIG) permitem a manipulação de dados espaço-temporais, sendo bastante utilizados como ferramentas de apoio à tomada de decisão. Um SIG é formado por vários módulos, dentre os quais o banco de dados geográficos (BDG), o qual é responsável pelo armazenamento dos dados. Apesar de representar, comprovadamente, uma fase importante no projeto do SIG, a modelagem conceitual do BDG não tem recebido a devida atenção. Esse cenário deve-se principalmente ao fato de que os profissionais responsáveis pelo projeto e implementação do SIG, em geral, não possuem experiência no uso de metodologias de desenvolvimento de sistemas de informação. O alto custo de aquisição dos dados geográficos também contribui para que menor atenção seja dispensada à etapa de modelagem conceitual do BDG. A utilização de padrões de análise tem sido proposta tanto para auxiliar no projeto conceitual de BDG quanto para permitir que profissionais com pouca experiência nessa atividade construam seus próprios esquemas. Padrões de análise são utilizados para documentar as fases de análise de requisitos e modelagem conceitual do banco de dados, representando qualquer parte de uma especificação de requisitos que tem sua origem em um projeto e pode ser reutilizada em outro(s). Todavia, a popularização e o uso de padrões de análise para BDG têm sido prejudicados principalmente devido à dificuldade de disponibilizar tais construções aos projetistas em geral. O processo de identificação de padrões (mineração de padrões) não é uma tarefa simples e tem sido realizada exclusivamente com base na experiência de especialistas humanos, tornando o processo lento e subjetivo. A subjetividade prejudica a popularização e a aplicação de padrões, pois possibilita que tais construções sejam questionadas por especialistas com diferentes experiências de projeto. Dessa forma, a identificação ou o desenvolvimento de técnicas capazes de capturar a experiência de especialistas de forma menos subjetiva é um passo importante para o uso de padrões. Com esse objetivo, este trabalho propõe a aplicação do processo de descoberta de conhecimento em banco de dados (DCBD) para inferir candidatos a padrão de análise para o projeto de BDG. Para tanto, esquemas conceituais de BDG são usados como base de conhecimento. DCBD é o processo não trivial de descoberta de conhecimento útil a partir de uma grande quantidade de dados. Durante o desenvolvimento da pesquisa ficou claro que a aplicação do processo de DCBD pode melhorar o processo de mineração de padrões, pois possibilita a análise de um maior número de esquemas em relação ao que é realizado atualmente. Essa característica viabiliza que sejam considerados esquemas construídos por diferentes especialistas, diminuindo a subjetividade dos padrões identificados. O processo de DCBD é composto de várias fases. Tais fases, assim como atividades específicas do problema de identificar padrões de análise, são discutidas neste trabalho.
|
83 |
No encontro da vida cotidiana, novas descobertas em bairro e vida de bairroOliveira, M?rcia Silva de 12 December 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-17T22:13:57Z
No. of bitstreams: 1
MarciaSilvaDeOliveira_TESE.pdf: 170022326 bytes, checksum: 202a50f1668327c507a8edf2ae0ca68a (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-19T20:56:22Z (GMT) No. of bitstreams: 1
MarciaSilvaDeOliveira_TESE.pdf: 170022326 bytes, checksum: 202a50f1668327c507a8edf2ae0ca68a (MD5) / Made available in DSpace on 2017-04-19T20:56:22Z (GMT). No. of bitstreams: 1
MarciaSilvaDeOliveira_TESE.pdf: 170022326 bytes, checksum: 202a50f1668327c507a8edf2ae0ca68a (MD5)
Previous issue date: 2016-12-12 / A presente tese trata da din?mica socioespacial que construiu historicamente o bairro de Nova Descoberta, na cidade do Natal/RN, a partir da segunda metade do s?culo XX. Para isso, aborda a rela??o entre a constru??o do Bairro e da Vida de Bairro e ampara-se no embasamento te?rico-metodol?gico elaborado pelo fil?sofo e soci?logo franc?s Henri Lefebvre, quando prop?e uma leitura da vida social urbana que se descortina no bairro enquanto fragmento privilegiado ou n?cleo de vida social somente compreendido na rela??o com a cidade. Parte do seguinte questionamento: como incluir o espa?o diferencial, pensado por Henri Lefebvre, na an?lise do bairro e da vida de bairro a partir do estudo da realidade de Nova Descoberta? E levanta como hip?tese a afirma??o de que a exist?ncia e a realidade do bairro de Nova Descoberta s?o determinadas e somente explicadas pelo movimento simult?neo e contradit?rio do seu espa?o concebido, percebido e vivido. Para isso, constr?i uma an?lise do bairro de Nova Descoberta como espa?o diferencial, produzido na converg?ncia e na simultaneidade de diferentes l?gicas e dimens?es que se descortinam na produ??o do seu espa?o e fundamenta-se nos estudos do citado autor franc?s acerca do bairro, da vida cotidiana e da vida social urbana, bem como do seu m?todo dial?tico regressivo-progressivo, que prop?e an?lises espa?o-temporais de confronta??o entre a vida moderna, o passado e o poss?vel, se afirmando como uma pesquisa qualitativa, amparada na realiza??o de entrevistas, observa??es in loco, tomada de imagens, consultas em ?rg?os p?blicos e em antigos registros do campo emp?rico. Percorrendo trilhas de investiga??o que ajudaram a entender a forma??o do bairro na cidade, mostramos o processo de consolida??o dos n?cleos iniciais de ocupa??o, Nova Descoberta e Morro Branco, e nos deparamos com a constru??o de um bairro institucionalizado, mas tamb?m percebido e vivido a partir das tramas e redes do vivido que sustentam a mem?ria individual e coletiva, a no??o de pertencimento e a identidade consolidada do espa?o de vida do morador na cidade. Nesse contexto, as novas descobertas realizadas confirmaram nossa hip?tese de que Nova Descoberta, enquanto bairro oficial da cidade, somente pode ser compreendida em sua totalidade como espacialidade concreta, como unidade institucionalizada e como n?cleo de vida social, ou seja, como produto da din?mica simult?nea e contradit?ria de produ??o do seu espa?o concebido, percebido e vivido, que permitiu sua leitura como espa?o diferencial. Constata??o que nos permitiu afirmar que o atual bairro institucionalizado de Nova Descoberta, apresenta duas refer?ncias socioespaciais diferenciadas, Nova Descoberta e Morro Branco, que apontam para a conviv?ncia, por vezes conflituosa, entre o bairro oficial e o bairro cotidiano, onde um n?o nega o outro, mas a ele se soma como parte de uma mesma realidade. Enfim, o trabalho destaca a possibilidade de habitar o bairro como resgate e reafirma??o da vida social urbana, contribuindo para estudos posteriores acerca da rela??o bairro-cidade, vida cotidiana-vida social urbana, na cidade atual. / The present thesis considers the social-spatial dynamics that historically constructed the neighborhood of Nova Descoberta in Natal, Brazil, from the second half of the twentieth century. To make it possible, the thesis addresses the relation between the neighborhood construction and the neighborhood?s life, and supports itself in the theoretical-methodologic basement created by the french philosopher and sociologist, Henri Lefebvre, that proposes a vison of an urban social life that uncover into the neighborhood as a privileged fragment of a social life core, only understood in its city relationship. The thesis starts from the following question: how to include the differential space, thought by Henri Lefebvre, into the analysis of the neighborhood and neighborhood?s life from the study of the Nova Descoberta reality? And it raises as hypothesis, the claim that the existence and the reality of Nova Descoberta district is determined and only explained by the simultaneous and contradictory movement of its conceived, perceived and lived space. The thesis constructs an analysis of Nova Descoberta as a differential space, produced by the convergence and simultaneity of different logical and dimensions that uncover into its space production and bases itself in the study of the quoted writer about the neighborhood, the everyday life and the urban social life, as well as his regressive-progressive dialectical method that proposes spatial-temporal analysis of the confrontation between the modern life, the past and the possible, affirming itself as a qualitative research, based in interviews, in loco observations, images capturing, public agencies consulting and in old empirical scope registers. Walking through research tracks that helped us to understand the formation of the district in the city, we show the process of consolidation of the initial cores of occupation of Nova Descoberta and Morro Branco, and we face the construction of an institutionalized perceived and lived neighborhood from the networks of living that support the individual and collective memory, the notion of belonging and the residents? consolidated identity of the living space in the city. In this context, the new discoveries realized confirmed our hypothesis that Nova Descoberta as an official part of the city can only be understood in its totality, as a concrete spatiality, as institutionalized unity and as the core of social life. In other words, as a product of simultaneous and contradictory dynamics of production of its conceived, realized and lived space that allowed the perception of the neighborhood as a differential space. This finding, allowed us to affirm that the current institutionalized district of Nova Descoberta presents two different social-spatial references: Nova Descoberta and Morro Branco, that points to a coexistence, sometimes conflicting, between the official and the everyday neighborhood, where one does not negate the other, but adds itself to each other as part of the same reality. Finally, the paper highlights the possibility of inhabiting the neighborhood as redemption and reaffirmation of urban social life, contributing to further studies on the relations between neighborhood and town, daily life and urban social life into the city currently.
|
84 |
A ironia como vocação: mais uma epistemologia das ciências sociais / Irony as vocation: one more epistemology of social sciencePaulo Henrique Sette Ferreira Pires Granafei 14 August 2012 (has links)
Conselho Nacional de Desenvolvimento Científico e Tecnológico / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A tese pretende estabelecer o que estaria o mais próximo possível de uma lógica da descoberta para as ciências sociais. A narrativa dessas disciplinas não seria neutra nem
objetiva, mas procuraria produzir, retoricamente, os efeitos de neutralidade e objetividade, evitando a heroicização, a vilanização e a vitimização dos agentes. Isso decorreria da
necessidade de o cientista social validar sua narrativa perante um auditório ideal ou potencialmente universal, abrigando, em princípio, todo o tipo de valores. Essa pluralidade de
visões de mundo não permite que os agentes sejam ingenuamente tratados como heróis, vilões ou vítimas. Com isso, o autor do texto de ciências sociais procuraria simular um ponto de vista de Deus, como ironista supremo, que tudo vê, acima dos participantes imperceptivos de seu relato. Foi feito um estudo de caso a partir do debate sobre populismo no Brasil, no qual foram identificados quatro pontos básicos em torno dos quais girou a controvérsia: o das estruturas prototípicas, o da estruturação imaginária, o da estrutura intersubjetiva e a dinâmica da relação entre grande teoria e pesquisa empírica. / The aim of this thesis is to get as close as possible to a logic of discovery for the social sciences. Those disciplines do not have a neutral and objective narrative, but try to achieve,
rhetorically, neutrality and objectivity effects, avoiding to portrait agents as heroes, villains or victims. It follows from the need to validate scientific narratives in face of an ideally or potentially universal auditory, withholding, in principle, all kinds of values. Such plurality of world visions makes it difficult to naively treat agents as heroes, villains, or victims. As a consequence, the social scientist simulates a Gods Eye view, placing himself in a Supreme Ironist perspective, who sees everything from above, whose vision reaches beyond what nonperceptive agents can see. To make my point, I took as case study the Brazilian controversy over populism. Based on it, four main topics of development were identified: one refered to the prototypical theoretic structures, other to its imaginary structuration, another to its intersubjective structure, and a last one to the relationship of empirical research to grand theory.
|
85 |
Um arcabouço cognitivamente inspirado para representação de conhecimento e raciocínioCarbonera, Joel Luis January 2016 (has links)
Seres humanos são capazes de desenvolver complexas estruturas de conhecimento que podem ser utilizadas de modo flexível para lidar com o ambiente de maneira apropriada. Estas estruturas de conhecimento constituem um núcleo que suporta processos cognitivos, tais como a percepção, a categorização, o planejamento, etc. A Inteligência Artificial, enquanto área de investigação, ocupa-se de desenvolver meios que viabilizem a reprodução destas capacidades cognitivas em agentes artificiais. Por este motivo, a investigação de abordagens que permitam a representação de conhecimento de um modo flexível se revela altamente relevante. Com o objetivo de superar algumas das limitações típicas da teoria clássica, que é adotada por várias abordagens propostas na Inteligência Artificial, este trabalho propõe um arcabouço cognitivamente inspirado para representação de conhecimento e raciocínio que integra aspectos de três diferentes teorias cognitivas a respeito de como conceitos são representados na cognição humana: teoria clássica, teoria do protótipo e teoria do exemplar. O arcabouço resultante é capaz de suportar a composicionalidade, a tipicalidade, a representação de instâncias atípicas dos conceitos, e a representação da variabilidade de indivíduos classificados por cada conceito. Consequentemente, o arcabouço proposto também suporta raciocínio lógico e baseado em similaridade. As principais contribuições deste trabalho são a concepção teórica e a formalização de um arcabouço cognitivamente inspirado para representação de conhecimento e raciocínio. Uma outra contribuição deste trabalho é uma abordagem de raciocínio para classificação que utiliza a abordagem de representação de conhecimento proposta. Além disso, este trabalho também apresenta duas abordagens para seleção de exemplares representativos de cada conceito e uma abordagem para extração de protótipos de conceitos. Nesta tese também é apresentado um sistema para interpretação automática de processos deposicionais que adota o arcabouço proposto. Experimentos realizados em uma tarefa de classificação sugerem que o arcabouço proposto é capaz de oferecer classificações mais informativas que as oferecidas por uma abordagem puramente clássica. / Human beings can develop complex knowledge structures that can be used for dealing with the environment in suitable ways. These knowledge structures constitute a core that supports several cognitive processes, such as perception, categorization, planning, etc. The Artificial Intelligence, as a research field, aims at developing approaches for mimicking these cognitive capabilities in machines. Due to this, it is important to investigate approaches that allow representing the knowledge in flexible ways. In order to overcome some limitations of the classical theory of knowledge representation, which is adopted by several approaches proposed in the Artificial Intelligence field, this work proposes a cognitively-inspired framework for knowledge representation and reasoning which integrates aspects from three different cognitive theories about concept representation in the human cognition: classical theory, prototype theory and exemplar theory. The resulting framework can support compositionality, typicality, representation of atypical instances of concepts, and representation of the variability of the individuals classified by each concept. Consequently, the proposed framework also supports logical reasoning and similarity-based reasoning. The main contributions of this work are the formalization of a cognitively-inspired framework for knowledge representation and reasoning, two approaches for selecting representative exemplars of each concept and an approach of reasoning for classification that integrates logical reasoning and similarity-based reasoning and that is supported by definitions, prototypes and exemplars of concepts. This thesis also presents a system for automatic interpretation of depositional processes application that adopts the proposed framework. The experiments, which were performed on a classification task, suggest that the proposed framework provides classifications that are more informative than the ones provided by a classical approach.
|
86 |
"O framework de integração do sistema DISCOVER" / The Discover integration frameworkRonaldo Cristiano Prati 04 April 2003 (has links)
Talvez uma das maiores capacidades do ser humano seja a sua habilidade de aprender a partir de observações e transmitir o que aprendeu para outros humanos. Durante séculos, a humanidade vem tentado compreender o mundo em que vive e, a partir desse novo conhecimento adquirido, melhorar o mundo em que vive. O desenvolvimento da tecnologia colocou a descoberta de conhecimento em um momento ímpar na história da humanidade. Com os progressos da Ciência da Computação, e, em particular, da Inteligência Artificial - IA - e Aprendizado de Máquina -AM, hoje em dia é possível, a partir de métodos de inferência indutiva e utilizando um conjunto de exemplos, descobrir algum tipo de conhecimento implícito nesses exemplos. Entretanto, por ser uma área de pesquisa relativamente nova, e por envolver um processo tanto iterativo quanto interativo, atualmente existem poucas ferramentas que suportam eficientemente a descoberta de conhecimento a partir dos dados. Essa falta de ferramentas se agrava ainda mais no que se refere ao seu uso por pesquisadores em Aprendizado de Máquina e Aquisição de Conhecimento. Esses fatores, além do fato que algumas pesquisas em nosso Laboratório de Inteligência Computacional - LABIC - têm alguns componentes em comum, motivaram a elaboração do projeto Discover, que consiste em uma estratégia de trabalho em conjunto, envolvendo um conjunto de ferramentas que se integram e interajam, e que supram as necessidades de pesquisa dos integrantes do nosso laboratório. O Discover também pode ser utilizado como um campo de prova para desenvolver novas ferramentas e testar novas idéias. Como o Discover tem como principal finalidade o seu uso e extensão por pesquisadores, uma questão principal é que a arquitetura do projeto seja flexível o suficiente para permitir que novas pesquisas sejam englobadas e, simultaneamente, deve impor determinados padrões que permitam a integração eficiente de seus componentes. Neste trabalho, é proposto um framework de integração de componentes que tem como principal objetivo possibilitar a criação de um sistema computacional a partir das ferramentas desenvolvidas para serem utilizadas no projeto Discover. Esse framework compreende um mecanismo de adaptação de interface que cria uma camada (interface horizontal) sobre essas ferramentas, um poderoso mecanismo de metadados, que é utilizado para descrever tanto os componentes que implementam as funcionalidades do sistema quanto as configurações de experimentos criadas pelos usuário, que serão executadas pelo framework, e um ambiente de execução para essas configurações de experimentos. / One of human greatest capability is the ability to learn from observed instances of the world and to transmit what have been learnt to others. For thousands of years, we have tried to understand the world, and used the acquired knowledge to improve it. Nowadays, due to the progress in digital data acquisition and storage technology as well as significant progress in the field of Artificial Intelligence - AI, particularly Machine Learning - ML, it is possible to use inductive inference in huge databases in order to find, or discover, new knowledge from these data. The discipline concerned with this task has become known as Knowledge Discovery from Databases - KDD. However, this relatively new research area offers few tools that can efficiently be used to acquire knowledge from data. With these in mind, a group of researchers at the Computational Intelligence Laboratory - LABIC - is working on a system, called Discover, in order to help our research activities in KDD and ML. The aim of the system is to integrate ML algorithms mostly used by the community with the data and knowledge processing tools developed as the results of our work. The system can also be used as a workbench for new tools and ideas. As the main concern of the Discover is related to its use and extension by researches, an important question is related to the flexibility of its architecture. Furthermore, the Discover architecture should allow new tools be easily incorporated. Also, it should impose strong patterns to guarantee efficient component integration. In this work, we propose a component integration framework that aims the development of an integrated computational environment using the tools already implemented in the Discover project. The proposed component integration framework has been developed keeping in mind its future integration with new tools. This framework offers an interface adapter mechanism that creates a layer (horizontal interface) over these tools, a powerful metadata mechanism, which is used to describe both components implementing systems' functionalities and experiment configurations created by the user, and an environment that enables these experiment execution.
|
87 |
Utilizando o processo de descoberta de conhecimento em banco de dados para identificar candidatos a padrão de análise para bancos de dados geográficosSilva, Carolina Martins Soares January 2003 (has links)
Sistemas de informações geográficas (SIG) permitem a manipulação de dados espaço-temporais, sendo bastante utilizados como ferramentas de apoio à tomada de decisão. Um SIG é formado por vários módulos, dentre os quais o banco de dados geográficos (BDG), o qual é responsável pelo armazenamento dos dados. Apesar de representar, comprovadamente, uma fase importante no projeto do SIG, a modelagem conceitual do BDG não tem recebido a devida atenção. Esse cenário deve-se principalmente ao fato de que os profissionais responsáveis pelo projeto e implementação do SIG, em geral, não possuem experiência no uso de metodologias de desenvolvimento de sistemas de informação. O alto custo de aquisição dos dados geográficos também contribui para que menor atenção seja dispensada à etapa de modelagem conceitual do BDG. A utilização de padrões de análise tem sido proposta tanto para auxiliar no projeto conceitual de BDG quanto para permitir que profissionais com pouca experiência nessa atividade construam seus próprios esquemas. Padrões de análise são utilizados para documentar as fases de análise de requisitos e modelagem conceitual do banco de dados, representando qualquer parte de uma especificação de requisitos que tem sua origem em um projeto e pode ser reutilizada em outro(s). Todavia, a popularização e o uso de padrões de análise para BDG têm sido prejudicados principalmente devido à dificuldade de disponibilizar tais construções aos projetistas em geral. O processo de identificação de padrões (mineração de padrões) não é uma tarefa simples e tem sido realizada exclusivamente com base na experiência de especialistas humanos, tornando o processo lento e subjetivo. A subjetividade prejudica a popularização e a aplicação de padrões, pois possibilita que tais construções sejam questionadas por especialistas com diferentes experiências de projeto. Dessa forma, a identificação ou o desenvolvimento de técnicas capazes de capturar a experiência de especialistas de forma menos subjetiva é um passo importante para o uso de padrões. Com esse objetivo, este trabalho propõe a aplicação do processo de descoberta de conhecimento em banco de dados (DCBD) para inferir candidatos a padrão de análise para o projeto de BDG. Para tanto, esquemas conceituais de BDG são usados como base de conhecimento. DCBD é o processo não trivial de descoberta de conhecimento útil a partir de uma grande quantidade de dados. Durante o desenvolvimento da pesquisa ficou claro que a aplicação do processo de DCBD pode melhorar o processo de mineração de padrões, pois possibilita a análise de um maior número de esquemas em relação ao que é realizado atualmente. Essa característica viabiliza que sejam considerados esquemas construídos por diferentes especialistas, diminuindo a subjetividade dos padrões identificados. O processo de DCBD é composto de várias fases. Tais fases, assim como atividades específicas do problema de identificar padrões de análise, são discutidas neste trabalho.
|
88 |
Framework Híbrido para Integração de Ferramentas e Reuso do Conhecimento em Problemas Binários de Mineração de DadosCUNHA, Rodrigo Carneiro Leão Vieira da 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T15:50:08Z (GMT). No. of bitstreams: 2
arquivo1928_1.pdf: 1948940 bytes, checksum: ed1bedfc483f596f442e5ff7208e1ed0 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Data Mining surgiu da necessidade de extração do conhecimento a partir de
volumosas massas de dados geradas pelas empresas/instituições. Com o crescimento da área e
o aumento do poder de processamento dos computadores, as organizações que prestam
serviços em KDD (Knowledge Discovery in Database) têm guardado, cada vez mais, um
grande número de documentos e processos referentes a projetos executados no passado.
Por outro lado, hoje, o desenvolvimento de projetos de Data Mining exige do
especialista o uso de diversas ferramentas, linguagens de programação e metodologias
associadas à sua experiência para resolução do problema. Um dos maiores problemas
práticos de KDD é como prover a interoperabilidade entre diferentes plataformas existentes,
de tal forma que os processos fiquem centralizados e documentados em um único ambiente.
Outro grande problema, hoje, é a falta de reuso de conhecimento devido à complexidade e
forte dependência do usuário. Neste contexto, as experiências adquiridas em projetos
anteriores não são devidamente documentadas, gerenciadas e controladas, gerando como
conseqüência a repetição de erros dos projetos anteriores. Em outras palavras, outro grande
problema prático é a falta de plataformas capazes de fazer o reuso do conhecimento adquirido
em projetos realizados no passado.
O principal objetivo deste trabalho é criar um framework híbrido para
desenvolvimento de soluções em Mineração de Dados que integra diversas ferramentas
disponíveis no mercado e disponibiliza um ambiente integrado para reuso do conhecimento na
área de KDD. Este ambiente possibilita a centralização e padronização dos artefatos gerados
ao longo do processo de KDD, assim como aproveita os melhores recursos de cada ferramenta
de mercado disponível.
Para validação do framework foram coletados os metadados de 69 projetos reais de
mineração de dados, 61 lições aprendidas dos profissionais que trabalharam nestes projetos e
654 entidades de conhecimento (congressos, softwares, publicações etc) da área de KDD.
Os estudos apresentados, principalmente para definição do início do projeto,
mostraram ser possível, através do framework, entender as características que levaram os
projetos a serem um sucesso ou fracasso. Assim, o framework é um ambiente que assegura o desenvolvimento de projetos em KDD de alta qualidade que atende às expectativas do cliente dentro do tempo e orçamento previstos
|
89 |
Tag suggestion using multiple sources of knowledgeMEDEIROS, Ícaro Rafael da Silva 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:56:06Z (GMT). No. of bitstreams: 2
arquivo2739_1.pdf: 2586871 bytes, checksum: 3a0e10a22b131714039f0e8ffe875d80 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Nos sistemas de tagging social usuários atribuem tags (palavras-chave) a recursos (páginas
Web, fotos, publicações, etc), criando uma estrutura conhecida como folksonomia,
que possibilita uma melhora na navegação, organização e recuperação de informação.
Atualmente, esses sistemas são muito populares na Web, portanto, melhorar sua qualidade
e automatizar o processo de atribuição de tags é uma tarefa importante. Neste trabalho
é proposto um sistema que automaticamente atribui tags a páginas, baseando-se em
múltiplas fontes de conhecimento como o conteúdo textual, estrutura de hiperlinks
e bases de conhecimento. A partir dessas fontes, vários atributos são extraídos para
construir um classificador que decide que termos devem ser sugeridos como tag.
Experimentos usando um dataset com tags e páginas extraídas do Delicious, um
importante sistema de tagging social, mostram que nossos métodos obtém bons resultados
de precisão e cobertura, quando comparado com tags sugeridas por usuários. Além disso,
uma comparação com trabalhos relacionados mostra que nosso sistema tem uma qualidade
de sugestão comparável a abordagens estado da arte na área. Finalmente, uma avaliação
com usuários foi feita para simular um ambiente real, o que também produziu bons
resultados
|
90 |
Um protocolo de descoberta de servirço para sistemas sensíveis ao contextoCarmo, Ricardo Rios Monteiro do 12 May 2006 (has links)
Made available in DSpace on 2016-12-23T14:33:44Z (GMT). No. of bitstreams: 1
dissertacao-Ricardo_Rios_M_Carmo-200605.pdf: 2611849 bytes, checksum: 5501f5e531cfd2aff3d36b5e51331d54 (MD5)
Previous issue date: 2006-05-12 / Advances in mobile computing and wireless technology are allowing the raising of new computing paradigms. One of them is the Ubiquitous or Pervasive Computing, which is characterised by a highly dynamic environment caused by the user mobility and by the massive use of small mobile devices like PDAs and cellular phones. Ubiquitous Computing allows to explore a new set of applications, the Context-Aware
Applications. Theses applications use contextual information, allowing more exible, adaptable, rich in functionality and user-centred services to be developed. However, context-aware applications require an infrastructure prepared to deal with the nature of the contextual information is needed. Among the many proposed context-aware infrastructures, Infraware has been developed in the Network and Multimedia Research Laboratory of the Federal University of Espírito Santo. Infraware proposes an integrated management model of services that emphasises composition and discovery of services based on semantic description. In particular,
the service discovery has an important role because it is used by the applications to find the right services to execute their tasks. In Pervasive Computing environments, service discovery must consider the nature of the contextual information. Few discovery mechanisms and protocols consider contextual information in the selection process. Moreover, some of them do not consider security and
authentication of data. This master thesis proposes a secure and context-aware service discovery protocol, named SCaSDP, which is part of the Service Manager Module of the
Infraware platform. This protocol presents a generic architecture, allowing its use in many situations of service discovery. / O avanço da computação móovel e da tecnologia da comunicação sem fio facilitaram o surgimento de novos paradigmas. Um destes é a Computação Ubíqua ou Pervasiva, caracterizada por um ambiente altamente dinâmico, ocasionado pela mobilidade de seus usuários e pela utilização de dispositivos móveis, como PDAs e aparelhos de telefonia celular. A Computação Ublíqua permite explorar um novo conjunto de aplicações, dentre elas as Aplicações sensíveis ao contexto. Essas aplicações manipulam informação contextual
possibilitando o desenvolvimento de serviços mais flexíveis, adaptáveis, ricos em funcionalidades e centrados no usuário. Entretanto, para que as aplicacações sensíveis ao contexto possam se beneficiar de tais serviços, é necessária uma infra-estrutura de suporte preparada para lidar com a natureza da informação contextual. Dentre as várias infra-estruturas propostas, a Infraware, em desenvolvimento no Laboratório de Pesquisas em Redes e Multimídia da UFES, prop~oe um modelo de gerência integrada de serviços que enfatiza a utilização de descrições semânticas para composição e descoberta dinâmica de serviços. Em particular, a descoberta de serviços tem um papel fundamental, pois é através dela que aplicações encontram os serviços necessários para executar suas tarefas. Nos ambientes caracterizados pela computação pervasiva, a descoberta de serviços deve considerar a natureza da informação contextual. Poucos mecanismos e protocolos de descoberta consideram informação contextual como atributo de seleção. Além disso, alguns deles não consideram segurança e autenticação de dados. Este trabalho propõe um protocolo de descoberta de serviços para a plataforma Infraware, seguro e sensível ao contexto, denominado SCaSDP - Secure Context-aware Service Discovery Protocol, parte do módulo Gerente de Serviços. Este protocolo apresenta uma arquitetura genérica que
permite a sua utilização em cenários diversos de descoberta de serviços.
|
Page generated in 0.0727 seconds