1 |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da AmazôniaSilva, Ana Carla Macedo da January 2002 (has links)
Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
|
2 |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da AmazôniaSilva, Ana Carla Macedo da January 2002 (has links)
Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
|
3 |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da AmazôniaSilva, Ana Carla Macedo da January 2002 (has links)
Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
|
4 |
Construção automatica de teoria em grafosPistori, Hemerson 24 July 2018 (has links)
Orientador: Jacques Wainer / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-24T05:33:11Z (GMT). No. of bitstreams: 1
Pistori_Hemerson_M.pdf: 2405653 bytes, checksum: e58087898fffa17a509c67aba57846e7 (MD5)
Previous issue date: 1998 / Resumo: Este trabalho apresenta SCOT, um sistema de construção automática de teoria inspirado no programa AM de Douglas Lenat. O AM é conhecido por ter "redescoberto" uma série de conceitos e conjecturas famosos em teoria dos números, aritmética e geometria [Len82]. Apesar do grande interesse despertado por este programa, este linha de pesquisa continua sendo muito pouco explorada. Um dos grandes problemas com o AM é a complexidade do seu conjunto de heurísticas, que é representado através de um sistema de produção contendo 243 regras. Com o SCOT, nós buscamos uma melhor estruturação e organização na representação das heurísticas, facilitando assim a análise e a manipulação das mesmas. A construção automática de teoria é também conhecida como aprendizagem por descoberta ou aprendizagem por exploração / Abstract: In this work we present SCOT, an automatic theory construction system inspired on Lenat's program AM. AM "rediscovered" some well-known concepts and conjectures from number theory, arithmetic and geometry [Len82]. Despite the great interest surrounding that program, further contributions to this research line are scarce. One of the main problem with AM is the great complexity of the heuristic set, which is represented as a production system with 243 rules. With SCOT we propose a revival of the "AM's research", emphasizing the clarity and "manipulability" of the heuristic set. Automatic theory construction is also known as learning by discovery or learning by exploration / Mestrado / Mestre em Ciência da Computação
|
5 |
Um estudo sobre detecção de desvios: aplicação em bancos de dados da Secretaria da Saúde do Rio Grande do SulEstivalet, Verônica Louroza January 2003 (has links)
A mineração de dados é o núcleo do processo de descoberta de conhecimento em base de dados. Durante a mineração podem ser aplicadas diversas técnicas para a extração de conhecimento. Cada técnica disponível visa à realização de um objetivo e é executada de uma forma em particular. O foco desta dissertação é uma destas técnicas conhecida como detecção de desvios. A detecção de desvios é baseada no reconhecimento do padrão existente nos dados avaliados e a capacidade de identificar valores que não suportem o padrão identificado. Este trabalho propõe uma sistemática de avaliação dos dados, com o objetivo de identificar os registros que destoam do padrão encontrado. Para este estudo são aplicadas algumas técnicas de avaliação estatística. Inicialmente é apresentada uma revisão bibliográfica sobre descoberta de conhecimento em base de dados (DCBD) e mineração de dados (MD). Na seqüência, são apresentados os principais conceitos que auxiliam na definição do que é um desvio, quais as técnicas utilizadas para a detecção e a forma de avaliação do mesmo. Dando continuidade ao trabalho, a sistemática CRISP_DM é descrita por ser aplicada aos estudos de casos realizados. A seguir, são descritos os estudos de casos realizados que utilizaram as bases da Secretaria da Saúde do Rio Grande do Sul (SES). Finalmente, são apresentados as conclusões do estudo e possíveis trabalhos futuros.
|
6 |
Um estudo sobre detecção de desvios: aplicação em bancos de dados da Secretaria da Saúde do Rio Grande do SulEstivalet, Verônica Louroza January 2003 (has links)
A mineração de dados é o núcleo do processo de descoberta de conhecimento em base de dados. Durante a mineração podem ser aplicadas diversas técnicas para a extração de conhecimento. Cada técnica disponível visa à realização de um objetivo e é executada de uma forma em particular. O foco desta dissertação é uma destas técnicas conhecida como detecção de desvios. A detecção de desvios é baseada no reconhecimento do padrão existente nos dados avaliados e a capacidade de identificar valores que não suportem o padrão identificado. Este trabalho propõe uma sistemática de avaliação dos dados, com o objetivo de identificar os registros que destoam do padrão encontrado. Para este estudo são aplicadas algumas técnicas de avaliação estatística. Inicialmente é apresentada uma revisão bibliográfica sobre descoberta de conhecimento em base de dados (DCBD) e mineração de dados (MD). Na seqüência, são apresentados os principais conceitos que auxiliam na definição do que é um desvio, quais as técnicas utilizadas para a detecção e a forma de avaliação do mesmo. Dando continuidade ao trabalho, a sistemática CRISP_DM é descrita por ser aplicada aos estudos de casos realizados. A seguir, são descritos os estudos de casos realizados que utilizaram as bases da Secretaria da Saúde do Rio Grande do Sul (SES). Finalmente, são apresentados as conclusões do estudo e possíveis trabalhos futuros.
|
7 |
Um estudo sobre detecção de desvios: aplicação em bancos de dados da Secretaria da Saúde do Rio Grande do SulEstivalet, Verônica Louroza January 2003 (has links)
A mineração de dados é o núcleo do processo de descoberta de conhecimento em base de dados. Durante a mineração podem ser aplicadas diversas técnicas para a extração de conhecimento. Cada técnica disponível visa à realização de um objetivo e é executada de uma forma em particular. O foco desta dissertação é uma destas técnicas conhecida como detecção de desvios. A detecção de desvios é baseada no reconhecimento do padrão existente nos dados avaliados e a capacidade de identificar valores que não suportem o padrão identificado. Este trabalho propõe uma sistemática de avaliação dos dados, com o objetivo de identificar os registros que destoam do padrão encontrado. Para este estudo são aplicadas algumas técnicas de avaliação estatística. Inicialmente é apresentada uma revisão bibliográfica sobre descoberta de conhecimento em base de dados (DCBD) e mineração de dados (MD). Na seqüência, são apresentados os principais conceitos que auxiliam na definição do que é um desvio, quais as técnicas utilizadas para a detecção e a forma de avaliação do mesmo. Dando continuidade ao trabalho, a sistemática CRISP_DM é descrita por ser aplicada aos estudos de casos realizados. A seguir, são descritos os estudos de casos realizados que utilizaram as bases da Secretaria da Saúde do Rio Grande do Sul (SES). Finalmente, são apresentados as conclusões do estudo e possíveis trabalhos futuros.
|
8 |
Data mining no contexto de customer relationship management em uma franquia coca cola companyCarvalho, Renata Azevedo Santos 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:57:51Z (GMT). No. of bitstreams: 2
arquivo3234_1.pdf: 2638292 bytes, checksum: cad6ee42242ce3e75b909176e6eaabc2 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Data Mining é uma área de pesquisa multidisciplinar, incluindo tecnologias de banco
de dados, inteligência artificial, redes neurais, aprendizado de máquina, estatística e
visualização de dados, tendo como objetivo específico a descoberta de conhecimento novo
que por ventura esteja escondido em grandes massas de dados.
Como um dos grandes objetivos de uma corporação é conhecer seus clientes, este
conhecimento precisa ocorrer em vários níveis, desde o tipo de produto desejado até que tipo
de ofertas os clientes estão dispostos a aceitar mesmo que os produtos não sejam essenciais no
momento.
Esta forma de mercado dirigido pode atingir o extremo de uma relação individual com
cada cliente à medida que a empresa deseje investir em segmentações (classificações)
sucessivas da sua clientela.
Sendo assim, esse trabalho tem como finalidade aplicar técnicas de mineração em
conjunto com as diretrizes do CRM à uma franquia da Coca-Cola afim de gerar uma nova
classificação dos seus clientes e auxiliar o cumprimento das metas anuais de venda com a
criação de novas atividades de marketing dado o resultado da análise dos dados minerados
|
9 |
Desenvolvimento de uma Plataforma Híbrida para Descoberta de Conhecimento em Bases de DadosPereira de Amorim, Bruno January 2004 (has links)
Made available in DSpace on 2014-06-12T15:58:31Z (GMT). No. of bitstreams: 2
arquivo4638_1.pdf: 5130002 bytes, checksum: 6fce9704d608c04ee17fdca0537c4f2e (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2004 / As Redes Neurais Artificiais (RNA) têm sido utilizadas com sucesso em tarefas como mapeamento de
funções complexas e reconhecimento de padrões. Este sucesso é resultado da habilidade das RNA em
realizar cálculos com dados complexos ou imprecisos, aprender a partir de exemplos, generalizar a
informação aprendida, extrair padrões e descobrir tendências. Apesar destas vantagens, geralmente
não é muito fácil obter explicações de como uma RNA representa a solução de um problema. Devido a
esta limitação, as RNA têm sido consideradas inadequadas para serem utilizadas em aplicações de
KDD (Knowledge Discovery in Databases) em que o usuário deseja saber o raciocínio usado pela rede
para obter uma dada conclusão.
Sistemas Híbridos Inteligentes (SHI) é uma abordagem de Inteligência Artificial que vem sendo
bastante utilizada na resolução de problemas onde o emprego de uma única técnica não é suficiente
para obter resultados satisfatórios. Tais sistemas se inspiram na integração de duas ou mais técnicas
inteligentes com o intuito de suprir as limitações de cada técnica. A disseminação dos SHI tem
contribuído para a emergência dos Sistemas Neurais Híbridos (SNH). O principal foco de pesquisa em
SNH tem sido a integração de RNA, técnica fortemente baseada em dados, com técnicas que utilizam
representação simbólica, como Lógica Fuzzy e algoritmos simbólicos convencionais. Os Sistemas
Neuro-Fuzzy são um exemplo de SNH que combinam sistemas conexionistas com sistemas fuzzy.
Nestes sistemas é aplicado algum método de extração de regras que permite a representação do
conhecimento incorporado pela rede numa forma compreensível. Além das técnicas de extração de
conhecimento simbólico associadas aos Sistemas Neuro-Fuzzy, diversas técnicas têm sido propostas
para outros modelos neurais.
Esta dissertação tem como principais objetivos investigar o paradigma dos Sistemas Neuro-Fuzzy
e as técnicas de extração de conhecimento simbólico de RNA como uma opção para tornar as RNA
mais adequadas ao processo de KDD; e, como resultado da investigação, modelar e implementar uma
ferramenta de software, a Neural Mining, baseada na abordagem neural híbrida. A ferramenta Neural
Mining integra, em um único ambiente, o modelo Perceptron Multicamadas (Multilayer Perceptron -
MLP); os modelos neuro-fuzzy FWD (Feature-Weighted Detector) e FuNN (Fuzzy Neural Network),
juntamente com suas técnicas de extração de regras; e a técnica TREPAN (Trees Parroting Networks),
que representa o conhecimento incorporado por uma RNA na forma de uma árvore de decisão. Os
modelos e técnicas são avaliados e comparados com relação à capacidade de generalização e
compreensibilidade do conhecimento extraído. Além da análise nas etapas de mineração de dados e
apresentação do conhecimento, também são investigadas duas técnicas de seleção de atributos: a
técnica do modelo FWD e através da árvore de decisão gerada por TREPAN.
A investigação experimental é realizada usando uma base de dados de um problema real e de
larga escala no domínio de análise de crédito ao consumidor. Como os resultados obtidos demonstram
que os ganhos decorrentes do uso de modelos neuro-fuzzy e técnicas de extração de conhecimento
simbólico de RNA são bastante significativos, ao final da investigação, considerando as vantagens de
cada modelo e técnica, são propostas duas soluções neurais híbridas para o processo de KDD
|
10 |
Técnicas de agrupamento de dados na mineração de dados químicosde Aguiar Loureiro, Juliana January 2005 (has links)
Made available in DSpace on 2014-06-12T16:01:13Z (GMT). No. of bitstreams: 2
arquivo7201_1.pdf: 2018800 bytes, checksum: 53a5a6f555847d7a5b53bef8739ece02 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2005 / O processo de descoberta de conhecimento em bases de dados (Knowledge
Discovery in Databases KDD) tem por objetivo extrair informações úteis
(conhecimento) a partir de uma extensa quantidade de dados. Este processo,
por sua vez, se constitui de várias etapas, entre elas, a atividade de mineração
dos dados, representada neste estudo sob forma de an´ alise de agrupamento.
Um problema característico dessa etapa é identificar qual ou quais métodos de
agrupamento podem realmente apresentar uma classificação útil e válida para
o conjunto de dados em estudo. Entre os mecanismos de apoio à triagem e
estudo das técnicas de análise de agrupamento está o conhecimento adquirido
sobre o conjunto de dados, o conhecimento de técnicas estatísticas para
realizar a análise exploratória dos dados e principalmente conhecer bem quais
algoritmos são adequados ao problema de interesse. A presente dissertação
visa considerar os procedimentos de KDD apropriados para a aplicação das
técnicas de análise de agrupamento a um conjunto de dados químicos
|
Page generated in 0.053 seconds