Spelling suggestions: "subject:"data mining (mineração dde dados)"" "subject:"data mining (mineração dee dados)""
1 |
Verificação das relações espaciais entre a distribuição de dados sócio-econômicos e a localização de escolasTagliatti, Clarissa 27 November 2009 (has links)
Made available in DSpace on 2016-06-02T20:00:32Z (GMT). No. of bitstreams: 1
2862.pdf: 3040505 bytes, checksum: 2bd6dab4d5a521b44585650d2bd54cf0 (MD5)
Previous issue date: 2009-11-27 / The process of urban progress, cause the disordered regions growth with some or without structure. In case of school's location, this process can generate excess of school places in some regions while in others there is a de_cit, thus subjecting the students, in some cases, the displacement of several hours. Trying to solve these problems, governments have been investing in programs such as _nancing school transportation, for the conduct of students from more remote regions. This study examined the spatial distribution of public schools comparing with the level of income, education and age of the population, using GIS techniques associated with Knowledge Extraction from Databases (Data Mining). This practice allows for the discovery of hidden information in large databases that may be considered interesting, as you con_rm, extend, or challenges the existing knowledge on the subject. Additionally, it allows a more elaborated on the educational services provided, given the existing demands, contributing to a critical analysis of the situation of these towns, in educational point of view, searching the assignment of a better quality of life for people. The city of Araraquara-SP, is a medium size city, and considering the availability of data and the importance for future applications of the results extracted, was chosen as the object of study. This study used techniques of Spatial Data Mining, allowing the discovery of important information, such as the fact that poor people reside far away from public schools. Besides, the analysis of the data presented de_cit and bad distribution of high schools in the city of Araraquara. These evidences indicated the feasibility of the methodology used also for large databases. / Do processo de crescimento urbano, ocorre o inchaço desordenado de regiões dotadas de pouca ou nenhuma estrutura. No caso de localização de escolas públicas esse processo pode gerar situações inusitadas, nas quais ocorre excesso de vagas escolares, em algumas regiões, enquanto em outras tem-se d_e_cit, sujeitando assim os alunos, em alguns casos, a deslocamentos de várias horas. A fim de sanar tais problemas os governos têm investido em programas como o de financiamento ao transporte escolar, para a condução de alunos oriundos de regiões mais afastadas. Este estudo foi realizado com intuito de verificar a distribuição espacial de escolas públicas frente ao nível de renda, escolaridade e idade da população, utilizando Sistemas de Informação Geográfica associado a técnicas de Extração de Conhecimento a partir de Bases de Dados (Mineração de Dados). Esta prática possibilita a descoberta de informações ocultas dentro de grandes bases de dados, que podem ser consideradas interessantes, a medida que conforme, amplie ou conteste o conhecimento já existente sobre o assunto. Adicionalmente, viabiliza uma avaliação mais elaborada sobre o atendimento educacional, face às demandas existentes, contribuindo assim para uma análise crítica da situação destas cidades, do ponto de vista educacional, na busca da atribuição de melhor qualidade de vida à população. A cidade de Araraquara-SP, por ser de médio porte, e considerando a disponibilidade dos dados e a importância para aplicações futuras dos resultados extra__dos, foi escolhida como objeto de estudo. Este estudo utilizou técnicas de Mineração de Dados Espaciais, possibilitando a descoberta de informações importantes, como por exemplo o fato de pessoas de baixa renda habitarem áreas periféricas distantes de escolas públicas. Além disso, a análise dos dados apresentou deficit e má distribuição de escolas de ensino médio no município de Araraquara. Estas evidências demonstram a viabilidade da metodologia empregada também para grandes bases de dados.
|
2 |
Mineração multi-relacional: o algoritmo GFP-growth.Pizzi, Luciene Cristina 25 May 2006 (has links)
Made available in DSpace on 2016-06-02T19:05:21Z (GMT). No. of bitstreams: 1
DissLCP.pdf: 1200368 bytes, checksum: 728208bb18c724a37e9c9e51c0521b56 (MD5)
Previous issue date: 2006-05-25 / Financiadora de Estudos e Projetos / Data mining is the phase of the knowledge discovery in database process where an
algorithm is applied to the available data, in order to prove a hypothesis or discover a still
unknown pattern. The traditional data mining techniques can deal only with single tables;
however it is interesting to look for patterns involving several related tables, aiming to
analyze the existing relation between the entities present in one table and the data of the same
entities present in another table.
Depending on the relationship existing between these tables, applying a traditional
algorithm to the joint table is not sufficient, as the joint table may contain duplicated attribute
values which interfere in the analysis process of the generated rules.
In order to solve this problem, this project adopts an approach which consists on
looking for association rules mining the joint table. The adopted process considers the groups
of tuples, where each group is formed by tuples of the same entity.
Following this approach the GFP-Growth algorithm was developed, which is presented
in this monograph along with its results and comparisons with other multi-relational
algorithms. / A mineração de dados é a etapa do processo de descoberta de conhecimento na qual um
algoritmo é aplicado sobre os dados disponíveis, com o intuito de provar uma hipótese ou
descobrir algum padrão até então desconhecido. As técnicas tradicionais de mineração de
dados tratam uma única tabela, no entanto é interessante buscar padrões que envolvam
múltiplas tabelas relacionadas, com o intuito de analisar a relação existente entre os dados de
uma entidade presentes em uma tabela e os dados dessa mesma entidade presentes em uma
outra tabela.
Dependendo do tipo de relacionamento existente entre essas tabelas, não basta realizar a
junção das mesmas para aplicar um algoritmo tradicional de mineração de dados na tabela
resultante, pois essa tabela pode conter duplicação de valores de atributos que interferem no
processo de análise das regras geradas.
Para resolver esse problema, este trabalho adota uma abordagem que consiste na busca
por regras de associação, realizando a mineração na tabela resultante da junção. O processo
adotado considera agrupamentos de tuplas, sendo que cada agrupamento é formado pelas
tuplas de uma mesma entidade.
Seguindo essa abordagem foi desenvolvido o algoritmo GFP-Growth, o qual é
apresentado nesta monografia juntamente com seus resultados e comparações com outros
algoritmos multi-relacionais.
|
3 |
Aprendizado supervisionado incremental de Redes Bayesianas para mineração de dados.Yoshida, Murilo Lacerda 29 August 2007 (has links)
Made available in DSpace on 2016-06-02T19:05:25Z (GMT). No. of bitstreams: 1
DissMLY.pdf: 1150965 bytes, checksum: b52b13360fef92e8f025d95e6667d557 (MD5)
Previous issue date: 2007-08-29 / The objective of this work is to introduce two algorithms for supervised Bayesian network incremental learning, AIP (Algorithm for simple Bayesian network numerical parameters supervised incremental learning) and ABC
(Algorithm for Bayesian network supervised incremental learning in layers). In order to develop these algorithms we studied relevant works about the Bayesian networks concepts, the algorithms for supervised Bayesian network learning and the algorithms for incremental supervised Bayesian network learning. To improve the performance of the ABC algorithm, we studied the AD-Tree structure and
implemented it on the algorithm. To measure the quality of the networks learned by the algorithms we used these networks learnt to classify a test set, resulting in the correct classification rate (ICC). To do that we studied the test set classification process and the propagation of evidences along the Bayesian network. The result
of the studies is described on this work, along with the results and discussions about the experiments made with the introduced algorithms. / Esse trabalho tem como objetivo propor dois algoritmos para aprendizado incremental supervisionado de redes Bayesianas, o AIP (Aprendizado Incremental ingênuo de Parâmetros) e o ABC (Aprendizado Bayesiano em Camadas). Para isso se pesquisou conceitos teóricos de redes Bayesianas, algoritmos de
aprendizado de redes Bayesianas e métodos de aprendizado incremental de redes Bayesianas relevantes na literatura. Para melhorar o desempenho do aprendizado incremental se pesquisou uma estrutura de representação de
conhecimento chamada AD-Tree. Para aferir a qualidade das redes Bayesianas produzidas se utilizou essas redes para classificar conjuntos de teste, obtendo assim o índice de classificação correta (ICC). Foi pesquisado o processo de
classificação de conjuntos de teste e o processo de propagação de evidências. O resultado dessas pesquisas está descrito no trabalho, junto com os resultados e discussões sobre os experimentos feitos com os algoritmos propostos.
|
4 |
A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dadosGalvão, Sebastian David Carvalho de Oliveira 29 October 2007 (has links)
Made available in DSpace on 2016-06-02T19:05:28Z (GMT). No. of bitstreams: 1
1698.pdf: 1287729 bytes, checksum: 3b1a05110798861ad7e42fd67b1694d6 (MD5)
Previous issue date: 2007-10-29 / Universidade Federal de Minas Gerais / The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been
applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In
this master s thesis a new Conditional Independence based approach to induce BCs
from data is proposed and implemented. Such approach is based on the Markov Blanket
concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes / As técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como
empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs)
podem ser consideradas como uma forma de representação do conhecimento baseada no
raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo
de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e
Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o
relacionamento entre as variáveis de um determinado conjunto de dados, mas como este
é um problema NP-completo o espaço de busca se torna muito amplo na maioria das
aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do
espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta
dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que
visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir
de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC
(Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos
através de experimentos realizados com 10 conjuntos de dados mostram que o
MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um
classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)
|
5 |
Algoritmo narfo para mineração de regras de associação generalizadas não redundantes baseada em uma ontologia difusaMiani, Rafael Garcia 29 April 2009 (has links)
Made available in DSpace on 2016-06-02T19:05:33Z (GMT). No. of bitstreams: 1
2522.pdf: 1514825 bytes, checksum: ebe56f7053e2af32e46a9f292c53aa9c (MD5)
Previous issue date: 2009-04-29 / Financiadora de Estudos e Projetos / Traditional approaches for mining generalized association rules are based only on database contents, and focus on exact matches among items. However, in many applications, the use of some background knowledge, as ontologies, can enhance the discovery process and generate semantically richer rules. In this way, this paper proposes the NARFO algorithm, a new
algorithm for mining non-redundant and generalized association rules based on fuzzy ontologies. Fuzzy ontology is used as background knowledge, to support the discovery
process and the generation of rules. One contribution of this work is the generalization of nonfrequent itemsets that helps to extract meaningful knowledge. NARFO algorithm also contributes at post-processing stage with its generalization and redundancy treatment. / Abordagens tradicionais para mineração de regras de associação generalizadas são somente baseadas no conteúdo do banco de dados, tendo um maior foco em combinações exatas entre os itens. No entanto, em muitas aplicações, o uso de um conhecimento de apoio, como ontologias, pode aprimorar o processo de descoberta de conhecimento e gerar regras de associação semanticamente mais ricas. Desse modo, neste trabalho de mestrado foi desenvolvido o algoritmo NARFO, um novo algoritmo para a mineração de regras de associação generalizadas não redundantes baseada em uma ontologia difusa. A ontologia difusa é utilizada como um conhecimento prévio de apoio, para dar suporte ao processo de descoberta e geração das regras. Uma importante contribuição desse algoritmo é a implementação da generalização de itemsets não frequentes durante o processamento do algoritmo que auxilia na obtenção de regras significantes. O algoritmo NARFO também contribui na etapa de pós-processamento, com seu tratamento de generalização e redundância.
|
6 |
Abordagem chem-risk: avaliação, gerenciamento e comunicação de riscos químicos em alimentos empregando descoberta de conhecimento em bases de dados, lógica fuzzy e ontologiasMagalhães Junior, Walter Coelho Pereira de 31 May 2011 (has links)
Made available in DSpace on 2016-06-02T19:05:52Z (GMT). No. of bitstreams: 1
3863.pdf: 3890839 bytes, checksum: 2673ad557bc976e88a3245a8854caa82 (MD5)
Previous issue date: 2011-05-31 / This research presents the Chem-Risk approach which is applied to chemical food safety domain, in order to circumvent a problem often encountered: data with little semantic or presenting low quality results that lead to results of low quality, unreliable and therefore inadequate to the reality of domain analyzed. In response to this purpose, the approach creates a Flexible Base Platform to properly pre-process the results of laboratory tests in agricultural food, allowing so many other variables, here considered as food risk factors, are observed in this analysis. Managed by the platform, the concepts of fuzzy logic and ontologies enable the incorporation of new risk factors, improve data quality and produce a superior technical expertise to that offered by traditional approaches used in the context of Brazilian public policies that aim to assess chemical risks and maximize the chemical safety of agricultural food. Due to the complexity and scope required for the ontology, a new approach to ontological engineering is presented. Data mining techniques used here play a key role, helping government officials and experts to extract higher risk levels of non-trivial knowledge, from the superior knowledge provided by the incorporation of fuzzy logic and ontology during the preprocessing step. The results obtained in mining step reveal a more faithfully semantic to the reality of food chemical safety, complement this reality and increase the level of expertise in favor of non-trivial decisions. By the other hand, if there were no proper preprocessing at the semantic level, the results, although apparently correct, would be concealing its false basis and, and thus presenting results completely wrong before the reality of chemical safety of agricultural food worldwide. We believe that what makes our real case study more remarkable is that it helps to improve the health of global population and, by extension, save our own lives. / Esta pesquisa apresenta a abordagem Chem-Risk a qual é aplicada ao domínio mundial da segurança química alimentar, visando contornar um problema freqüentemente encontrado: dados com pouca semântica, apresentando baixa qualidade, que levam a resultados de baixa qualidade, pouco confiáveis e, portanto, inadequados para corretamente expressarem a realidade do domínio analisado. Em atendimento a esta finalidade, a abordagem Chem-Risk cria uma Plataforma Base Flexível para adequadamente pré-processar os resultados das análises laboratoriais em alimentos agropecuários, permitindo que inúmeras outras variáveis, aqui consideradas como fatores de risco alimentar, sejam consideradas nestas análises. Gerenciados por esta plataforma, conceitos da lógica fuzzy e ontologias viabilizam a incorporação dos novos fatores de risco, aprimoram a qualidade dos dados e produzem um conhecimento técnico superior, àquele oferecido pelas abordagens tradicionalmente empregadas no contexto das políticas públicas brasileiras, que visam avaliar os riscos químicos e maximizar a segurança química dos alimentos agropecuários. Devido à complexidade e escopo requeridos para a ontologia, uma nova abordagem de engenharia ontológica é apresentada. As técnicas de mineração de dados aqui empregadas desempenham um papel fundamental, auxiliando as autoridades governamentais e especialistas de risco a extraírem maiores níveis de conhecimentos não-triviais, a partir do conhecimento superior fornecido pela incorporação da lógica fuzzy e ontologia, durante a etapa de préprocessamento dos dados. Os resultados alcançados na etapa de mineração revelam uma semântica mais fidedigna à realidade da segurança química alimentar, complementam esta realidade e ampliam o nível de conhecimento especializado em favor de decisões não triviais. Por outro lado, se não houvesse adequado pré-processamento de dados a nível semântico, os resultados, apesar de aparentemente corretos, estariam encobrindo bases falsas e, portanto, estariam completamente equivocados perante a realidade da segurança química mundial dos alimentos agropecuários. Acreditamos que o que torna o nosso estudo de caso mais notável é que ele ajuda a melhorar a saúde da população mundial e, por extensão, salvar nossas próprias vidas.
|
7 |
Mineração de dados em múltiplas tabelas fato de um data warehouse.Ribeiro, Marcela Xavier 19 May 2004 (has links)
Made available in DSpace on 2016-06-02T19:05:14Z (GMT). No. of bitstreams: 1
DissMXR.pdf: 889186 bytes, checksum: fe616fa6309b5ac267855726e8a6938b (MD5)
Previous issue date: 2004-05-19 / Financiadora de Estudos e Projetos / The progress of the information technology has allowed huge amount of data to be stored. Those data, when submitted to a process of knowledge discovery, can bring interesting results. Data warehouses are repositories of high quality data. A procedure that has been adopted in big companies is the joint use of data warehouse and data mining technologies, where the process of knowledge discovery takes advantage over the high quality of the warehouse s data. When the data warehouse has information about more than one subject, it also has more than one fact table. The joint analysis of multiple fact tables can bring interesting knowledge as, for instance, the relationship between purchases and sales in a company. This research presents a technique to mine data from multiple fact tables of a data warehouse, which is a new kind of association rule mining. / O progresso da tecnologia de informação permitiu que quantidades cada vez maiores de dados fossem armazenadas. Esses dados, no formato original de armazenamento, não trazem conhecimento, porém, quando tratados e passados por um processo de extração de conhecimento, podem revelar conhecimentos interessantes. Os data warehouses são repositórios de dados com alta qualidade. Um procedimento que vem sendo amplamente adotado nas grandes empresas é a utilização conjunta das
tecnologias de data warehouse e da mineração de dados, para que o processo de descoberta de
conhecimento pela alta qualidade dos dados do data warehouse. Data warehouses que
envolvem mais de um assunto também envolvem mais de uma tabela fato (tabelas que representam o assunto do data warehouse). A análise em conjunto de múltiplos assuntos de um data warehouse pode revelar padrões interessantes como o relacionamento entre as compras e as vendas de determinada organização. Este projeto de pesquisa está direcionado ao desenvolvimento de técnicas de mineração de dados envolvendo múltiplas tabelas fato de um data warehouse, que é um novo tipo de mineração de regras de associação.
|
8 |
Extração de forma compacta de regras fuzzy de uma rede BayesianaHsien, Yin 02 July 2010 (has links)
Made available in DSpace on 2016-06-02T19:05:47Z (GMT). No. of bitstreams: 1
3324.pdf: 1850607 bytes, checksum: 92205ea8790a4197a10996b4ec47aa7d (MD5)
Previous issue date: 2010-07-02 / Universidade Federal de Minas Gerais / The decision support tools are importants in many domains of our society. But there is a need to make users understand the decisions made by those tools in order to increase the faith of the users on the results. In the literature, Bayesian networks are considered as a probabilistic classification system with good performance. But it still need a better presentation of it results to make it more understandable to the users. In other hand, the fuzzy logic ofer potential to deal with imprecision and uncertainty, as well as a linguistic representation, which facilitates user's understanding. The combination of Bayesian networks and fuzzy logic is proposed by the method BayesFuzzy, which make use of fuzzy rules as a form of explanation of a Bayesian network, it aims to obtain a decision support tool with good performance and easy to be understood by users. So we are proposiing the method Pruned BayesFuzzy (PBF), it is a BayesFuzzy incorporated with minimum certainty degree, default rule and Rule Post-Pruning as a form to select the most important rules for classification between all the rules generated, it also simplifies those rules. The results of PBF show an improvement in understanding but a loss in correct classification rate. But the improvement in understanding is promising enough to further research and enhance of the PBF. Then beside PBF, we also propose the Pruned BayesFuzzy 2 (PBF2), which is PBF incorporated with a feature selection technique based on Markov Blanket. With the incorporation of this technique, it's possible to deal with situations that contains a large amount of variables inside of the Markov Blanket of the class variable. The results show a loss in correct classification rate, that is already expected when we try to simplify further more the Markov Blanket. However, the availability to be able to deal with big scale problems is something to be considered. / As ferramentas de apoio à decisão são importantes em diversos domínios da nossa sociedade. Porém há uma necessidade do usuário entender as decisões feitas por tais ferramentas para ter uma confiança maior sobre os resultados. Na literatura técnica, as redes Bayesianas são consideradas como um sistema probabilístico de classificação com bom desempenho em termos de precisão. Mas ainda necessitam de uma forma de apresentação mais compreensível para os usuários. Por outro lado, a lógica fuzzy oferece potencial para lidar com imprecisão e incerteza, assim como a representação linguística, o que facilita a compreensão dos usuários. A combinação das redes Bayesianas com a lógica fuzzy é proposta pelo método BayesFuzzy que utiliza regras fuzzy como explicação de uma rede Bayesiana, com o objetivo de obter uma ferramenta de apoio à decisão de bom desempenho e que seja fácil de ser compreendida pelos usuários. O BayesFuzzy, entretanto, apresenta limitações com relação ao número de regras geradas e isto torna seus resultados, muitas vezes, de difícil interpretação. Assim, neste trabalho de mestrado é proposto o método Pruned BayesFuzzy (PBF). O PBF tem como base o BayesFuzzy e incorpora algumas técnicas de minimização do número de regras para otimizar a compreensibilidade dos resultados gerados. Dentre as técnicas incorporadas estão o mínimo grau de certeza, a regra default e a poda Rule Post- Pruning como formas de selecionar dentre as regras geradas, as mais importantes para a classificação e ao mesmo tempo simplificando estas regras. Os resultados do PBF mostram que houve um ganho grande em relação à compreensibilidade, mas também uma perda na taxa de classificação correta. Porém o ganho de compreensibilidade é bastante promissor o que estimula a pesquisa e a seqüência dos trabalhos com o PBF. Além do PBF, este trabalho propõe também o Pruned BayesFuzzy 2 (PBF2) que é o PBF incorporando uma técnica de seleção de atributos baseado em Markov Blanket. Com a incorporação desta técnica, é possível lidar com situações que contém uma quantidade grande de variáveis dentro do Markov Blanket da variável classe. Os resultados mostram que houve perda na taxa de classificação correta, o que é de se esperar quando tentamos simplificar mais ainda o Markov Blanket. A viabilidade de poder resolver problemas reais de grande escala e com algumas características específicas é ainda algo a ser considerado.
|
9 |
Recuperação de documentos baseados em informação semântica no ambiente AMMO.Corrêa, Adriana Cristina Giusti 25 August 2003 (has links)
Made available in DSpace on 2016-06-02T19:06:03Z (GMT). No. of bitstreams: 1
DissACGC.pdf: 1152663 bytes, checksum: b9af98519cb385cdf69ae9a80dbb5bf1 (MD5)
Previous issue date: 2003-08-25 / This study presents techniques used for extracting semantic information from texts and
strategies for semantic information-based document retrieval. These techniques and strategies
have been adopted so as to develop a Document Manipulation System based on Semantic
Information. Previously established values of similarity and relevance are used in the document
retrieval process.. The organization of semantic information, user interfaces, manipulation of
imprecise information and the extraction and retrieval mechanism are discussed. The
impreciseness in the semantic information is treated through similarity values in order to
compare the query´spredicates with the database results. Relevance values specified for the
query´s predicates have been used to classify the resulting documents. A prototype of the system
has been developed. This prototype can be incorporated into the AMMO environment
(Authoring and Manipulation of Multimedia Objects), whose aim is to provide resources for
creating, storing and manipulating multimedia applications. / Neste trabalho são apresentadas técnicas utilizadas na extração de informação semântica
de textos e estratégias para recuperação de documentos baseada em informação semântica, que
foram adotadas para o desenvolvimento de um Sistema para Manipulação de Documentos
baseada em Informação Semântica. Para a recuperação de documentos são considerados valores
de similaridade e relevância estabelecidos. A organização da informação semântica, as interfaces
com o usuário, a manipulação das informações imprecisas, o mecanismo de extração e
recuperação são discutidos. A imprecisão inerente à informação semântica é tratada através de
valores de similaridade para comparar os termos requeridos na consulta e os consultados no
banco de dados. Os valores de relevância especificados para os termos envolvidos na consulta
são utilizados para classificar os documentos resultantes. Foi desenvolvido um protótipo do
sistema, que pode ser incorporado ao ambiente AMMO (Authoring and Manipulation of
Multimedia Objects), que tem por objetivo fornecer recursos para a criação, armazenamento e
manipulação de aplicações multimídia.
|
10 |
Mineração de regras de associação sequenciais em séries temporais e visualização: aplicação em dados agrometeorológicosCano, Marcos Daniel 03 August 2012 (has links)
Made available in DSpace on 2016-06-02T19:06:12Z (GMT). No. of bitstreams: 1
5971.pdf: 5628502 bytes, checksum: 38bfe45912e4f91f4ad8c7fb5fb815db (MD5)
Previous issue date: 2012-08-03 / Universidade Federal de Minas Gerais / Technological development brought improvements in the technology of climate sensors and Earth's surface image acquisition, gathering increasing amounts of data. Generally, when these data are submitted to mining algorithms, the output is the production of hundreds or even thousands of textual patterns, making the task of data analysis by the domain expert even harder. Hence, it is crucial, to support experts, the development of a tool that helps to identify and display patterns of interest. In this context, this research project at Master Science level aims to develop a technique for mining association rules in time series allowing agrometeorological data analysis over time. / O avanço tecnológico tem propiciado melhorias nos diversos sensores utilizados para medições dos dados climáticos e de imageamento da superfície terrestre, coletando quantidades cada vez maiores de dados. Quando esses dados são submetidos aos algoritmos de mineração para serem explorados ocorre, em geral, a produção de centenas ou ate mesmo milhares de padrões textuais, dificultando ainda mais a tarefa de analise dos dados pelo especialista de domínio. Assim, e crucial, para apoiar os especialistas, o desenvolvimento de um ferramental que auxilia na identificação e visualização dos padrões de interesse. Neste contexto, este projeto de pesquisa em nível de mestrado visa desenvolver uma técnica de mineração de regras de associação em series temporais permitindo a analise de dados agrometeorológicos ao longo do tempo.
|
Page generated in 0.131 seconds