Spelling suggestions: "subject:"descoberta"" "subject:"descobertas""
111 |
Aplicação do processo de descoberta de conhecimento em banco de dados acadêmico utilizando as tarefas de agrupamento e classificação / Applying the knowledge discovery process in academic databases using clustering and classification tasksAsseiss, Maraísa da Silva Guerra [UNESP] 30 June 2017 (has links)
Submitted by MARAÍSA DA SILVA GUERRA null (maraisa.guerra@ifms.edu.br) on 2017-07-29T00:12:01Z
No. of bitstreams: 1
relatorio.pdf: 8678616 bytes, checksum: 003c94cceff80c4879b62a63399f0ff9 (MD5) / Approved for entry into archive by Luiz Galeffi (luizgaleffi@gmail.com) on 2017-08-03T14:47:26Z (GMT) No. of bitstreams: 1
asseiss_msg_me_ilha.pdf: 8678616 bytes, checksum: 003c94cceff80c4879b62a63399f0ff9 (MD5) / Made available in DSpace on 2017-08-03T14:47:26Z (GMT). No. of bitstreams: 1
asseiss_msg_me_ilha.pdf: 8678616 bytes, checksum: 003c94cceff80c4879b62a63399f0ff9 (MD5)
Previous issue date: 2017-06-30 / Nos últimos anos a quantidade de dados armazenados diarimente em empresas e instituições aumentou consideravelmente e um dos motivos que contribuiu para isso é a crescente importân- cia dada à informação. De forma geral, esses dados são meramente armazenados e, portanto, subutilizados pelos seus detentores, enquanto poderiam ser estudados a fim de obter novos co- nhecimentos, informações e relacionamentos. Neste contexto, surge o processo de descoberta de conhecimento em banco de dados. Este trabalho apresenta uma introdução a banco de dados, uma revisão bibliográfica sobre o processo de descoberta de conhecimento em banco de dados, a descrição de cada etapa deste processo, uma explanação sobre as tarefas de agrupamento e classificação, além de resumir brevemente as técnicas de particionamento e árvore de decisão. É exposto um estudo sobre o sistema Weka, em que apresenta-se conceitos, funcionalidades e exemplifica-se diversas formas de utilização do sistema. O objetivo principal deste trabalho é propor uma metodologia para descoberta de novos conhecimentos em bancos de dados acadê- micos baseada no processo de descoberta de conhecimento em banco de dados, sendo esta uma metodologia mais simplificada e de execução mais direcionada. Como parte da metodologia este trabalho contribui ainda com uma aplicação desenvolvida em Python como forma de apoio a etapas da metodologia. A metodologia proposta conta com a ferramenta Weka para execução dos algoritmos de data mining e prevê a execução das tarefas de agrupamento e classifica- ção. Por fim o trabalho retrata dois estudos de caso envolvendo bancos de dados acadêmicos reais e a execução de todas as etapas da metodologia proposta, com a utilização do sistema Weka. Os estudos de caso abordam as tarefas de agrupamento e classificação e as técnicas de particionamento e árvores de decisão, com a utilização dos algoritmos SimpleKMeans e J4.8, respectivamente. Os resultados obtidos através dos estudos mostram que a metodologia pro- posta é capaz de gerar conhecimentos novos e úteis, tanto na análise de dados de desempenho acadêmico quanto na análise de dados socioeconômicos dos alunos. / In the past years the amount of data stored daily in companies increased considerably and one of the reasons that contributed to this fact is the increasing importance given to information. In general these data are merely stored and therefore underused by its owners, while they could be studied in order to find out new knowledge, information and relationship. In this context, the knowledge discovery in database process arises. This work presents an introduction to databa- ses, a bibliographic review about the knowledge discovery in databases process, a description of each step of this process, an explanation about the clustering and classification tasks and the summarization os the partition and decision tree techniques. A study of the Weka system is shown, in wich are presented concepts, functionalities and examples of use forms for the sys- tem. The main objective of this work is the proposal of a methodology for knowledge discovery in academic databases based on the KDD process. The presented methodology is a more sim- plified and directed version of the KDD. As part of the methodology this work also presents an application developed in Python programming language as a support tool for the methodology steps. The presented methodology uses the Weka tool for running the data mining algorithms and considers the clustering and classification tasks. Lastly this work describes two case stu- dies involving real academic databases and the execution of all the steps from the proposted methodology using the Weka system. The case studies addresses the clustering and classifica- tion tasks, as well as the partitioning and decision trees techniques, using the SimpleKMeans and J4.8 algorithms respectively. The obtained results show that the methodology is capable of generating new and useful knowledge, both by analyzing academic performance data and by analyzing students’ socioeconomic data.
|
112 |
Agrupamento de dados fuzzy colaborativo / Collaborative fuzzy clusteringLuiz Fernando Sommaggio Coletta 19 May 2011 (has links)
Nas últimas décadas, as técnicas de mineração de dados têm desempenhado um importante papel em diversas áreas do conhecimento humano. Mais recentemente, essas ferramentas têm encontrado espaço em um novo e complexo domínio, nbo qual os dados a serem minerados estão fisicamente distribuídos. Nesse domínio, alguns algorithmos específicos para agrupamento de dados podem ser utilizados - em particular, algumas variantes do algoritmo amplamente Fuzzy C-Means (FCM), as quais têm sido investigadas sob o nome de agrupamento fuzzy colaborativo. Com o objetivo de superar algumas das limitações encontradas em dois desses algoritmos, cinco novos algoritmos foram desenvolvidos nesse trabalho. Esses algoritmos foram estudados em dois cenários específicos de aplicação que levam em conta duas suposições sobre os dados (i.e., se os dados são de uma mesma npopulação ou de diferentes populações). Na prática, tais suposições e a dificuldade em se definir alguns dos parâmetros (que possam ser requeridos), podemn orientar a escolha feita pelo usuário entre os algoitmos diponíveis. Nesse sentido, exemplos ilustrativos destacam as diferenças de desempenho entre os algoritmos estudados e desenvolvidos, permitindo derivar algumas conclusões que podem ser úteis ao aplicar agrupamento fuzzy colaborativo na prática. Análises de complexidade de tempo, espaço, e comunicação também foram realizadas / Data mining techniques have played in important role in several areas of human kwnowledge. More recently, these techniques have found space in a new and complex setting in which the data to be mined are physically distributed. In this setting algorithms for data clustering can be used, such as some variants of the widely used Fuzzy C-Means (FCM) algorithm that support clustering data ditributed across different sites. Those methods have been studied under different names, like collaborative and parallel fuzzy clustring. In this study, we offer some augmentation of the two FCM-based clustering algorithms used to cluster distributed data by arriving at some constructive ways of determining essential parameters of the algorithms (including the number of clusters) and forming a set systematically structured guidelines as to a selection of the specific algorithm dependeing upon a nature of the data environment and the assumption being made about the number of clusters. A thorough complexity analysis including space, time, and communication aspects is reported. A series of detailed numeric experiments is used to illustrate the main ideas discussed in the study
|
113 |
Sistema automático para negociação de ações usando técnica de mineração de dados com detecção de mudança de conceitoSOUZA, Victor Lorena de Farias 19 October 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-01-22T14:22:26Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5) / Made available in DSpace on 2016-01-22T14:22:26Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação_Mestrado_Victor_Lorena.pdf: 1644188 bytes, checksum: 4a53bf1f4dc89599b68bd29f20b7fd59 (MD5)
Previous issue date: 2015-10-19 / FACEPE / Uma série temporal financeira representa as cotações dos preços das ações e apresenta
comportamento similar a um fluxo de dados. Para a descoberta de padrões presentes em seus
dados alguns trabalhos utilizam técnicas de mineração de dados que são fundamentadas na
ideia de que os dados históricos guardam a memória essencial para prever a direção futura
dos preços. Métodos tradicionais propostos na literatura consideram que o ambiente é estático,
ou seja, que o mecanismo gerador da série financeira é o mesmo durante todo o intervalo de
tempo de interesse. Porém, no caso de séries temporais financeiras, isso pode não ocorrer. Para
resolver este problema, esta dissertação propõe a abordagem PAA-IDPSO-CD (Aproximação
por Valor Agregado de Segmento - Otimização por Enxame de Partículas Auto Adaptativa com
detecção de mudança de conceito) para descoberta de padrões em séries temporais financeiras. A
abordagem proposta objetiva lidar explicitamente com mudanças de conceito na série e descobrir
os melhores padrões representativos dos dados das séries temporais que serão utilizados junto
a uma estratégia de investimento formulada para automatizar as operações a serem feitas no
mercado de ações. Isso possibilitará a redução das incertezas e dos riscos envolvidos nas compras
e vendas de ações e auxiliará os investidores a maximizar o lucro nas suas operações feitas no
mercado de ações. A fim de alcançar melhores resultados são propostas diferentes estruturas
de partículas, utilizadas pelo IDPSO, junto a diferentes regras de decisão. Primeiramente, é
utilizada uma estrutura básica para a partícula, em que se opera apenas na posição comprado no
mercado financeiro. É proposto também uma segunda estrutura que é capaz de operar tanto na
posição comprado quanto na posição vendido. Os experimentos do presente estudo comparam os
resultados das versões do método proposto entre si e com os resultados obtidos pelas abordagens
Buy and Hold (B&H) e SAX-GA (Aproximação por Valor Agregado Simbólico - Algoritmos
Genéticos). Para isso, foram realizados Teste t Pareado com nível de confiança de 95% em vinte
ações. O presente estudo conclui que o PAA-IDPSO-CD apresentou resultados estatisticamente
melhores que o B&H e o SAX-GA para todas as vinte ações em que os testes foram executados
(pvalor <0;05). Além disso, a estratégia que opera nas posições comprado e vendido é melhor
quando comparada àquela que opera apenas na posição comprado. No estudo comparativo em
onze ações não houve diferença estatística e em outras sete a estratégia comprado e vendido
obteve melhores resultados (pvalor < 0; 05). / Financial time series represents the prices of stock over time and presents similar behavior
to a data stream. Mining techniques, which are based on the idea that the historical data retain
the essential memory to predict the future direction, are used to make the patterns discovery
in the time series data. In this context, this study proposes the PAA-IDPSO-CD (Piecewise
Aggregate Approximation - Improved self-adaptive particle swarm optimization with Concept
Drift) approach aiming to find patterns in financial time series. The purpose of this study is the
discovery of the best representative patterns of the time series data to be used by a designed
investment strategy to automate the operations to be made in the stock market. Thus, reducing
the uncertainties and risks involved in buying and selling operations of stocks and help investors
maximize the profit in their operations made in the stock market. In order to achieve best
results, different particle structures, used by IDPSO, along with different decision rules are
proposed. First, a basic structure to the particle is employed, it operates only in the Long position
in the financial market. Subsequently, this structure develops to be able to operate both in
Long and Short position. The experiments of this study comparing the results of the various
versions of the proposed approach with each other and with those obtained by the Buy and
Hold (B&H) and SAX-GA techniques, for that, were performed Paired t test with a confidence
level of 95% in twenty stocks. The achieved results show that the PAA-IDPSO-CD outperforms
B&H and SAX-GA for all twenty stocks in which the tests were performed (pvalue < 0:05).
Furthermore, the long-short operating strategy is better than that operating only in the long
position. In the comparative study in eleven actions there was no statistical difference and in
other seven long-short strategy outperforms (pvalue < 0:05).
|
114 |
Descoberta de conhecimento em bases de dados e estratégias de relacionamento com clientes: um estudo no setor de serviçosFernandes, Marcelo Pires 12 February 2008 (has links)
Made available in DSpace on 2016-03-15T19:26:36Z (GMT). No. of bitstreams: 1
Marcelo Pires Fernandes.pdf: 425391 bytes, checksum: 82c6fd61293544d4f47d5a6eec0f6580 (MD5)
Previous issue date: 2008-02-12 / The research problem to be studied is related to the way companies from the services industry use customer databases to discover useful knowledge about their customers, in order to improve the development of relationship strategies with them. This issue is important mainly because due to the increasing of concurrence and customer demand, the company needs to relate differently with their customers, so that thy can keep in its portfolio the most profitable ones. In this way, the theory has suggested a deeper integration among distinct disciplines as Relationship Marketing, CRM and Data Mining. In this current study, it was investigated the
way the theory presents and describes database analysis processes and, as a result, some proposals were found out, that segment the processes of discovering knowledge in databases in stages like problem understanding, data understanding, data preparation, data modeling data, model evaluation and deployment. The target population was composed by companies from the services industry from São Paulo and Rio de Janeiro cities and a quantitative research was made by applying a questionnaire to 67 professionals from the target population. In this research, themes as utilization level from stages of process of discovering knowledge in databases, utilization level of data mining techniques and utilization level of relationship strategies were investigated. It was discovered that the companies researched have a high utilization level of the stages of knowledge discovery identified in the theory, just only a
small part of the data mining techniques are uniformly used by the companies researched and, at last, the strategies with the highest utilization levels are that related to the acquisition of new customers and identification of profitable ones. This last discover was a little bit surprising, because it is opposed to the way of thinking of some authors who defend
companies should focus on their relationship strategies in the customer retention. These results can be used to support companies, in subjects related to the development of customer relationship strategies, based in an integrated analysis of business issues, customer information, as well quantitative models of analysis from this information, in order to turn it into useful knowledge to the making decision. / O problema de pesquisa a ser investigado está associado ao modo como empresas do setor de serviços utilizam bases de dados para descobrir conhecimento sobre o cliente e embasar o desenvolvimento de estratégias de relacionamento. Este tema é importante, visto que em função do aumento da concorrência e da exigência dos clientes, as empresas precisam tratar seus clientes de forma diferenciada, de forma a manter em sua carteira aqueles mais rentáveis. Neste sentido, a literatura tem sugerido uma integração cada vez mais intensa entre disciplinas como Marketing de Relacionamento, CRM e Mineração de Dados. O presente trabalho estudou o modo como a literatura apresenta e descreve processos de análise de bases de dados e algumas propostas foram encontradas, propostas que segmentam o processo de descoberta de conhecimento em bases de dados em etapas como entendimento do problema, entendimento e preparação dos dados, modelagem dos dados, avaliação do modelo e implementação da solução desenvolvida. O universo estudado foi o de empresas do setor de serviços que atuam nas cidades de São Paulo e do Rio de Janeiro e uma pesquisa quantitativa foi realizada por meio da aplicação de um questionário a 67 respondentes. Nesta pesquisa, foi investigado o nível de utilização das etapas dos processos de descoberta de conhecimento em bases de dados, as técnicas de mineração utilizadas, bem como as estratégias de relacionamento adotadas com clientes. Constatou-se que as empresas pesquisadas possuem um alto nível de utilização das etapas de descoberta de conhecimento identificadas na
literatura, que elas utilizam de forma uniforme apenas algumas das técnicas de mineração de dados identificadas na literatura e que, do ponto de vista de estratégias de relacionamento com clientes, as estratégias de aquisição de novos clientes e identificação dos melhores clientes possuem um nível de utilização superior ao de estratégias de retenção de clientes (considerando resultados da amostra). Esta última constatação, de certo modo, contraria o pensamento de algumas correntes teóricas, que defendem que as empresas devem focar suas estratégias de relacionamento na retenção de clientes. Estes resultados pode servir de apoio aos gestores das empresas, no que se refere aos processos de desenvolvimento de estratégias de relacionamento com clientes, sustentados em análise integrada dos aspectos de negócio envolvidos, informações sobre o cliente, bem como modelos quantitativos de análise destas informações, de forma a transformá-las em conhecimento útil para a tomada de decisão.
|
115 |
Investigação dos mecanismos comportamentais delineadores da composição de assembléias de formigasSales, Tatiane Archanjo de 23 February 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-05-20T19:43:49Z
No. of bitstreams: 1
tatianearchanjodesales.pdf: 1871876 bytes, checksum: 6bdeefe279a3c1e633ba1cbae84bdf3c (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-07-02T11:28:21Z (GMT) No. of bitstreams: 1
tatianearchanjodesales.pdf: 1871876 bytes, checksum: 6bdeefe279a3c1e633ba1cbae84bdf3c (MD5) / Made available in DSpace on 2016-07-02T11:28:21Z (GMT). No. of bitstreams: 1
tatianearchanjodesales.pdf: 1871876 bytes, checksum: 6bdeefe279a3c1e633ba1cbae84bdf3c (MD5)
Previous issue date: 2012-02-23 / FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais / Buscando identificar os mecanismos formadores das assembleias de formigas em campo rupestre, este estudo foi dividido em três partes. A primeira investigou a habilidade das espécies em descobrir recursos alimentares e a influência dos comportamentos na sua permanência nos mesmos. Iscas atrativas foram oferecidas em uma área de campo rupestre no Parque Estadual do Ibitipoca, MG. Foram realizados 60 registros, referentes a 10 iscas/quadrante, totalizando 40 horas de filmagem. Das nove espécies mais freqüentes Pheidole obscurithorax, Pheidole radoszkowskii, Pheidole sp.6 e Crematogaster sericea foram as que apresentaram maiores valores para habilidade de descoberta e tenderam a permanecer por mais tempo nas iscas; Camponotus crassus, Camponotus renggeri, Ectatomma edentatum, Camponotus genatus, Pachycondyla striata foram espécies com menores taxas de permanência, podendo ser consideradas como submissas devido à menor habilidade competitiva. Os comportamentos também influenciaram na permanência e variaram entre agonísticos e de coexistência em função da espécie e do contexto no qual ocorreu a interação. As duas espécies com maior habilidade em descobrir os recursos - C. sericea e P. obscurithorax - foram selecionadas para a segunda parte do estudo. Objetivando avaliar mecanismos competitivos em locais distantes e próximos aos seus ninhos, foi averiguada a influência da distância do recurso ao ninho na agressividade e abundância, bem como o status hierárquico durante o forrageamento. Foi estabelecido um plot de observação para cada ninho composto por oito iscas: quatro localizadas a 1,5m de distância dos ninhos e quatro a 0,5m. As iscas foram observadas uma por vez, totalizando 256 registros/espécie. Os comportamentos registrados foram ataque e avançar. Para ambas as espécies a distância do alimento ao ninho não influenciou na agressividade (Z= 1,44; p=0,07 C. sericea; Z= 1,44; p=0,07 P. obscurithorax); a abundância de P. obscurithorax foi maior nas iscas próximas ao seu ninho (F= 7,30; p<0,01), enquanto que para C. sericea não diferiu entre iscas próximas e distantes (F=2,19; p=0,14). Apesar de fortes competidoras, C. sericea e P. obscurithorax forragearam de acordo com seus status hierárquico, sendo a primeira territorialista e a segunda agressiva não territorialista. Na terceira parte foram investigados os padrões comportamentais de agressividade entre colônias de C. sericea e P. obscurithorax localizadas próximas (2,40m) e distantes (15,60m) entre si baseado na Hipótese do Inimigo Querido. Foram capturados 50 indivíduos/colônia para execução de encontros diádicos. Foram realizados 10 encontros/tratamento: controle, interespecífico próximo e interespecífico distante. Os comportamentos observados foram: inspeção, toque de antena, auto-grooming,
viii
evitar, avançar, abertura de mandíbula, morder, curvar o gáster e luta. Para cada ato foi atribuído um valor, utilizado no cálculo do índice de agressão. Verificou-se maior agressividade de C. sericea quando confrontadas com P. obscurithorax provenientes da colônia próxima (t=-4,935; p<0,001). Em contraste, não houve diferença significativa na agressividade exibida entre operárias de P. obscurithorax e C. sericea provenientes da colônia distante (t=0,617; p=0,995). A agressividade de C. sericea direcionada aos seus vizinhos atesta que, além de haver o reconhecimento entre diferentes espécies, P. obscurithorax pode ser considerada uma forte competidora, não sendo aplicável a hipótese do inimigo querido a estas espécies. / In order to identify the mechanisms that form the ant assemblages in the rupestrian, this study was divided into three parts. In the first was investigated the species ability to find food resources and the behaviors influence of their permanence in the same resources. Baits were offered in a rupestrian area in Parque Estadual do Ibitipoca, MG. Were made 60 records, on a 10 baits/quadrant, totaling 40 hours of recording. Of the nine most common species Pheidole obscurithorax, Pheidole radoszkowskii, Pheidole sp.6 and Crematogaster sericea showed highest values for discovery ability and tended to stay longer in the baits. Camponotus crassus, Camponotus renggeri, Ectatomma edentatum, Camponotus genatus, Pachycondyla striata were species with lower permanence rates, may be considered as submissive species due to lower competitive ability. The behavior also influenced the permanence and ranged between agonistic coexistence depending on the species and the context in which the interaction occurred. The two species with greater ability to find resources – P. obscurithorax and C. sericea – were selected for the second part of the study. In order to evaluate competitive mechanisms in places far and near to their nests, has been investigated the influence of distance from the resource until the nest in the aggression and abundance, and the hierarchical status during the foraging. We established an observation plot for each nest, composed by eight baits: four located 1.5m away from the nests and four 0.5m. The baits were observed one at a time, totaling 256 records/species. The behaviors recorded were attack and advance. For both species, the distance of the food to the nest had no effect on aggression (Z= 1,44; p=0,07 C. sericea; Z= 1,44; p=0,07 P. obscurithorax); the abundance of P obscurithorax was higher in the baits near its nest (F = 7.30, p <0.01), while for C. sericea did not differ between near and far baits (F=2,19; p=0,14). In spite of being strong competitors, C. sericea and P. obscurithorax foraged according to their hierarchical status, being the first territorialist and the second aggressive not territorialist. In the third part, we investigated the behavioral patterns of aggressiveness among C. sericea and P. obscurithorax colonies located near (2.40 m) and far (15.60 m) from each other based on the Dear Enemy Hypothesis. We captured 50 individuals/colony to perform dyadic encounters. Were conducted 10 meetings/treatment: control, near interspecific and far interspecific. The behaviors observed were: inspection, antenna touch, self-grooming, avoidance, forward, open jaw, bite, bend the gaster and fight. For each action was assigned a value, used to calculate the aggression rate. Was found more aggressiveness of C. sericea when confronted with P. obscurithorax from the nearby colony (t=-4,935; p<0,001). In contrast, there were no significant difference in
x
aggressiveness displayed between workers of P. obscurithorax and C. sericea from the far colony (t=0,617; p=0,995). The aggressiveness of C. sericea directed to their neighbors certifies that, in addition to the recognition between different species, P. obscurithorax also can be considered a strong competitor, then Dear Enemy Hypothesis cannot be applicable to these species.
|
116 |
Otimização multiobjetivo e programação genética para descoberta de conhecimento em engenhariaRusso, Igor Lucas de Souza 26 January 2017 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-04-19T15:28:50Z
No. of bitstreams: 1
igorlucasdesouzarusso.pdf: 2265113 bytes, checksum: 0eb7e55f7354359d8fb9419e6e6da17f (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-04-20T12:28:17Z (GMT) No. of bitstreams: 1
igorlucasdesouzarusso.pdf: 2265113 bytes, checksum: 0eb7e55f7354359d8fb9419e6e6da17f (MD5) / Made available in DSpace on 2017-04-20T12:28:17Z (GMT). No. of bitstreams: 1
igorlucasdesouzarusso.pdf: 2265113 bytes, checksum: 0eb7e55f7354359d8fb9419e6e6da17f (MD5)
Previous issue date: 2017-01-26 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A área de Otimização envolve o estudo e emprego de métodos para determinação dos
parâmetros que levam à obtenção de soluções ótimas, de acordo com critérios denominados
objetivos. Um problema é classificado como multiobjetivo quando apresenta objetivos
múltiplos e conflitantes, que devem ser otimizados simultaneamente. Recentemente tem
crescido o interesse dos pesquisadores pela análise de pós-otimalidade, que consiste na
busca por propriedades intrínsecas às soluções ótimas de problemas de otimização e que
podem lançar uma nova luz à compreensão dos mesmos. Innovization (inovação através
de otimização, do inglês innovation through optmization) é um processo de descoberta de
conhecimento a partir de problemas de otimização na forma de relações matemáticas
entre variáveis, objetivos, restrições e parâmetros. Dentre as técnicas de busca que
podem ser utilizadas neste processo está a Programação Genética (PG), uma meta
heurística bioinspirada capaz de evoluir programas de forma automatizada. Além de
numericamente válidos, os modelos encontrados devem utilizar corretamente as variáveis
de decisão em relação às unidades envolvidas, de forma a apresentar significado físico
coerente. Neste trabalho é proposta uma alternativa para tratamento das unidades através
de operações protegidas que ignoram os termos inválidos. Além disso, propõe-se aqui uma
estratégia para evitar a obtenção de soluções triviais que não agregam conhecimento sobre
o problema. Visando aumentar a diversidade dos modelos obtidos, propõe-se também a
utilização de um arquivo externo para armazenar as soluções de interesse ao longo da
busca. Experimentos computacionais são apresentados utilizando cinco estudos de caso
em engenharia para verificar a influência das ideias propostas. Os problemas tratados
aqui envolvem os projetos de: uma treliça de 2 barras, uma viga soldada, do corte de
uma peça metálica, de engrenagens compostas e de uma treliça de 10 barras, sendo este
último ainda não explorado na literatura de descoberta de conhecimento. Finalmente, o
conhecimento inferido no estudo de caso da estrutura de 10 barras é utilizado para reduzir
a dimensionalidade do problema. / The area of optimization involves the study and the use of methods to determine the
parameters that lead to optimal solutions, according to criteria called objectives. A
problem is classified as multiobjective when it presents multiple and conflicting objectives
which must be simultaneously optimized. Recently, the interest of the researchers
has grown in the analysis of post-optimality, which consists in the search for intrinsic
properties of the optimal solutions of optimization problems. This can shed a new light on
the understanding of the optimization problems. Innovization (from innovation through
optimization) is a process of knowledge discovery from optimization problems in the form
of mathematical relationships between variables, objectives, constraints, and parameters.
Genetic Programming (GP), a search technique that can be used in this process, is a
bio-inspired metaheuristic capable of evolving programs automatically. In addition to
be numerically valid, the models found must correctly use the decision variables with
respect to the units involved, in order to present coherent physical meaning. In this work,
a method is proposed to handle the units through protected operations which ignore
invalid terms. Also, a strategy is proposed here to avoid trivial solutions that do not add
knowledge about the problem. In order to increase the diversity of the models obtained,
it is also proposed the use of an external file to store the solutions of interest found
during the search. Computational experiments are presented using five case studies in
engineering to verify the influence of the proposed ideas. The problems dealt with here are
the designs of: a 2-bar truss, a welded beam, the cutting of a metal part, composite gears,
and a 10-bar truss. The latter was not previously explored in the knowledge discovery
literature. Finally, the inferred knowledge in the case study of the 10-bar truss structure
is used to reduce the dimensionality of that problem.
|
117 |
Framework para construção de aplicações adaptativas em nuvem multimídiaMartins, Rodrigo Ferreira 10 September 2015 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-06-07T14:54:57Z
No. of bitstreams: 1
rodrigoferreiramartins.pdf: 1789352 bytes, checksum: 9d2bb55856b7bf33c9dd2abbd5125259 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-07T14:57:16Z (GMT) No. of bitstreams: 1
rodrigoferreiramartins.pdf: 1789352 bytes, checksum: 9d2bb55856b7bf33c9dd2abbd5125259 (MD5) / Made available in DSpace on 2017-06-07T14:57:16Z (GMT). No. of bitstreams: 1
rodrigoferreiramartins.pdf: 1789352 bytes, checksum: 9d2bb55856b7bf33c9dd2abbd5125259 (MD5)
Previous issue date: 2015-09-10 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Atualmente os tradicionais computadores de mesa e laptops estão perdendo mercado para dispositivos mais pervasivos, como smartphones, tablets e wearables que em sua grande maioria têm limitações de hardware devido às restrições de tamanho, peso e duração da bateria. As aplicações mais populares nos dias de hoje envolvem multimídia e algumas vezes consomem mais recursos do que esses dispositivos são capazes de suportar,
por exemplo, realidade aumentada, jogos e o uso de computação para estender a capacidade cognitiva como reconhecimento facial e de fala, processamento de linguagem natural,aprendizagem de máquina, planejamento e tomada de decisão. Nesse contexto, mesmo a já tão popular cloud computing não serve como solução por si só, uma vez que a latência e o jitter criam uma restrição para aplicações interativas. Este trabalho propõe um framework para a construção de aplicações multimídia adaptativas que, no lado cliente, permite explorar recursos dos dispositivos alcançáveis, sejam móveis ou não, a fim de
tornar as aplicações mais imersivas. Não apenas os recursos quantitativos, mas também os qualitativos são levados em consideração para distribuir as tarefas. Quanto à nuvem, a proposta apropria-se da ideia de edge cloud computing para aumentar a Qualidade de Serviço (QoS) e permitir que regras de negócio também sejam levadas em consideração durante a distribuição das tarefas, bem como na sintonização do serviço. / Currently traditional desktop computers and laptops are losing market share to more
pervasive devices such as smartphones, tablets and wearables that usually have hardware
limitations due to restrictions on size, weight, and battery life. The most popular applications
today involve multimedia and sometimes consume more resources than these
devices are capable of supporting, for example, augmented reality, games, and the use of
computing to extend the cognitive ability as facial and speech recognition, natural language
processing, machine learning, planning and decision making. In this context, even
the widespread cloud computing does not serve as a single-handed solution, since the
latency and jitter create a restriction for interactive applications. This work proposes a
framework for building adaptive multimedia applications, which, on the client side, allows
for exploring resources from reachable devices, whether mobile or not, in order to make
applications more immersive. Not only quantitative, but also qualitative resources are
considered to distribute tasks. Regarding the cloud side, the proposal appropriates the
idea of edge cloud computing to increase Quality of Service (QoS) and allow business rules
to be also taken into account during the distribution of tasks and service tuning.
|
118 |
Mineração de dados aplicada à classificação do risco de evasão de discentes ingressantes em instituições federais de ensino superiorAMARAL, Marcelo Gomes do 08 July 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-07-11T14:35:16Z
No. of bitstreams: 3
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5) / Made available in DSpace on 2017-07-11T14:35:16Z (GMT). No. of bitstreams: 3
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
Previous issue date: 2016-07-08 / As Instituições Federais de Ensino Superior (IFES) possuem um
importante papel no desenvolvimento social e econômico do país, contribuindo
para o avanço tecnológico e cientifico e fomentando investimentos. Nesse
sentido, entende-se que um melhor aproveitamento dos recursos educacionais
ofertados pelas IFES contribui para a evolução da educação superior, como um
todo. Uma maneira eficaz de atender esta necessidade é analisar o perfil dos
estudantes ingressos e procurar prever, com antecedência, casos indesejáveis
de evasão que, quanto mais cedo identificados, melhor poderão ser estudados
e tratados pela administração. Neste trabalho, propõe-se a definição de uma
abordagem para aplicação de técnicas diretas de Mineração de Dados
objetivando a classificação dos discentes ingressos de acordo com o risco de
evasão que apresentam. Como prova de conceito, a análise dos aspectos
inerentes ao processo de Mineração de Dados proposto se deu por meio de
experimentações conduzidas no ambiente da Universidade Federal de
Pernambuco (UFPE). Para alguns dos algoritmos classificadores, foi possível
obter uma acurácia de classificação de 73,9%, utilizando apenas dados
socioeconômicos disponíveis quando do ingresso do discente na instituição,
sem a utilização de nenhum dado dependente do histórico acadêmico. / The Brazilian's Federal Institutions of Higher Education have an
important role in the social and economic development of the country,
contributing to the technological and scientific advances and encouraging
investments. Therefore, it is possible to infer that a better use of the educational
resources offered by those institutions contributes to the evolution of higher
education as a whole. An effective way to meet this need is to analyze the
profile of the freshmen students and try to predict, as soon as possible,
undesirable cases of dropout that when earlier identified can be examined and
addressed by the institution's administration. This work propose the
development of a approach for direct application of Data Mining techniques to
classify newcomer students according to their dropout risk. As a viability proof,
the proposed Data Mining approach was evaluated through experimentations
conducted in the Federal University of Pernambuco. Some of the classification
algorithms tested had an classification accuracy of 73.9% using only
socioeconomic data available since the student's admission to the institution,
without the use of any academic related data.
|
119 |
Visualização de operações de junção em sistemas de bases de dados para mineração de dados. / Visualization of join operations in DBMS for data mining.Maria Camila Nardini Barioni 13 June 2002 (has links)
Nas últimas décadas, a capacidade das empresas de gerar e coletar informações aumentou rapidamente. Essa explosão no volume de dados gerou a necessidade do desenvolvimento de novas técnicas e ferramentas que pudessem, além de processar essa enorme quantidade de dados, permitir sua análise para a descoberta de informações úteis, de maneira inteligente e automática. Isso fez surgir um proeminente campo de pesquisa para a extração de informação em bases de dados denominado Knowledge Discovery in Databases KDD, no geral técnicas de mineração de dados DM têm um papel preponderante. A obtenção de bons resultados na etapa de mineração de dados depende fortemente de quão adequadamente o preparo dos dados é realizado. Sendo assim, a etapa de extração de conhecimento (DM) no processo de KDD, é normalmente precedida de uma etapa de pré-processamento, onde os dados que porventura devam ser submetidos à etapa de DM são integrados em uma única relação. Um problema importante enfrentado nessa etapa é que, na maioria das vezes, o usuário ainda não tem uma idéia muito precisa dos dados que devem ser extraídos. Levando em consideração a grande habilidade de exploração da mente humana, este trabalho propõe uma técnica de visualização de dados armazenados em múltiplas relações de uma base de dados relacional, com o intuito de auxiliar o usuário na preparação dos dados a serem minerados. Esta técnica permite que a etapa de DM seja aplicada sobre múltiplas relações simultaneamente, trazendo as operações de junção para serem parte desta etapa. De uma maneira geral, a adoção de junções em ferramentas de DM não é prática, devido ao alto custo computacional associado às operações de junção. Entretanto, os resultados obtidos nas avaliações de desempenho da técnica proposta neste trabalho mostraram que ela reduz esse custo significativamente, tornando possível a exploração visual de múltiplas relações de uma maneira interativa. / In the last decades the capacity of information generation and accumulation increased quickly. With the explosive growth in the volume of data, new techniques and tools are being sought to process it and to automatically discover useful information from it, leading to techniques known as Knowledge Discovery in Databases KDD where, in general, data mining DM techniques play an important role. The results of applying data mining techniques on datasets are highly dependent on proper data preparation. Therefore, in traditional DM processes, data goes through a pre-processing step that results in just one table that is submitted to mining. An important problem faced during this step is that, most of the times, the analyst doesnt have a clear idea of what portions of data should be mined. This work reckons the strong ability of human beings to interpret data represented in graphical format, to develop a technique to visualize data from multiple tables, helping human analysts when preparing data to DM. This technique allows the data mining process to be applied over multiple relations at once, bringing the join operations to become part of this process. In general, the use of multiple tables in DM tools is not practical, due to the high computational cost required to explore them. Experimental evaluation of the proposed technique shows that it reduces this cost significantly, turning it possible to visually explore data from multiple tables in an interactive way.
|
120 |
[en] A PROTOCOL FOR RESOURCE DISCOVERY AND SELECTION IN MOBILE AD HOC GRIDS / [pt] UM PROTOCOLO PARA DESCOBERTA E SELEÇÃO DE RECURSOS EM GRADES MÓVEIS AD HOCLUCIANA DOS SANTOS LIMA 21 December 2007 (has links)
[pt] Nos últimos anos, o uso de dispositivos móveis em grades
computacionais
tem sido alvo de crescente investigação. Entretanto, um
problema mais desafiador,
referente ao estabelecimento dinâmico de grades móveis,
baseadas
exclusivamente em redes sem fio ad hoc, ainda tem sido
pouco investigado. Uma
contribuição desta tese é a proposta de uma arquitetura de
software específica para
grades móveis, que pode ser igualmente aplicável a redes
sem fio infraestruturadas
e ad hoc. Em grades fixas, a responsabilidade de prover um
serviço
computacional é compartilhada entre dispositivos com
relativa abundância de
recursos, se comparadas a grades móveis. Nestas últimas, é
interessante que a
descoberta e a seleção de recursos para execução de
tarefas sejam tratadas
conjuntamente, de modo a promover a seleção automática dos
dispositivos com
maior disponibilidade de recursos, considerando-se os
requisitos da aplicação.
Entretanto, tais elementos têm sido tradicionalmente
tratados em separado na
literatura relacionada a grades móveis e, em grande parte
das abordagens
existentes, assume-se que a seleção de recursos seja
executada de forma manual
pelos usuários da grade móvel. Esta tese propõe, como uma
outra contribuição,
um protocolo que integra as fases de descoberta e seleção
automática de recursos
em grades móveis, permitindo que a provisão de serviços
computacionais seja
escalonada entre os dispositivos com maior disponibilidade
dos recursos
requeridos pelo serviço. Devido à característica dinâmica
dos recursos que
correspondem às requisições dos usuários em uma grade
móvel (por exemplo,
tempo de CPU livre e memória disponível), o protocolo
baseia-se unicamente no
envio, sob demanda, de requisições via broadcast. No
entanto, principalmente em
redes sem fio ad hoc de saltos múltiplos, essa estratégia
pode acarretar uma
sobrecarga nos dispositivos envolvidos, tanto na difusão
de requisições quanto no
encaminhamento de respostas. Uma terceira contribuição
desta tese é o
desenvolvimento de um mecanismo que permite reduzir a
sobrecarga, devido à
difusão de mensagens de resposta, por meio da supressão de
respostas excedentes ao longo da rede. O mecanismo, embora
implementado no contexto do protocolo
proposto nesta tese, pode ser aplicado também a outros
protocolos de descoberta
baseados no envio de requisições via broadcast. Os
resultados experimentais,
obtidos em redes de testes e em plataformas de simulação,
mostram que o
protocolo proposto provê um balanceamento de carga
eficiente entre os
dispositivos, mediante o aumento do número de requisições.
Além disso, pode-se
observar que o mecanismo de supressão de respostas é
escalável no que diz
respeito ao crescimento do número de dispositivos, em
comparação com
protocolos de descoberta baseados puramente no envio de
requisições por
broadcast em redes sem fio ad hoc. / [en] In the last few years, the use of mobile devices in
computational grids has
seen a growing interest. Nevertheless, a more challenging
issue, the dynamic
establishment of mobile grids on wireless ad hoc networks,
has been so far only
partially addressed. The first contribution of this thesis
is the proposal of a
software architecture for mobile grids that can be used
for both infrastructured and
ad hoc wireless networks. In the execution of conventional
applications in grids,
the responsibility to provide the service is shared among
the most resourceful
mobile devices. In mobile grids, it is fundamental that
resource discovery and
selection of resources are jointly handled. This calls for
a mechanism that
promotes the automatic selection of the best resource
providers amongst the
discovered nodes, taking into account the requirements of
the application.
Discovery and selection, however, have been traditionally
handled separately and
in most approaches the selection of resources and services
requires explicit
intervention by the user of the mobile grid. As a second
contribution of this thesis,
we propose a protocol that integrates the phases of
resource discovery and
automatic selection in mobile grids, allowing that
computational resource
provisioning is scheduled among the most resourceful
nodes. Due to the dynamics
of the resources needed in a mobile grid (for example,
free CPU time and
available memory), the protocol is based solely on demand-
driven broadcasts.
However, mainly in multihop ad hoc wireless networks, this
strategy can incur in
overhead at the involved devices, due to the diffusion of
requests and replies. A
third contribution of this thesis is the development of a
mechanism that allows to
reduce this overhead by means of the suppression of
redundant replies in the
network. The mechanism has been implemented in the context
of the proposal
protocol, but can be applied as well to other query-based
discovery protocols
based on broadcasts. The experimental results obtained
from executions in a
testbed and through simulations show that the proposed
protocol provides
efficient load balancing between devices with an
increasing number of requests. Moreover, it can be
observed that the mechanism for suppression of replies
scales
well with respect to an increasing number of devices when
compared to other
discovery protocols in wireless ad hoc networks that are
purely based on requests
via broadcast.
|
Page generated in 0.0356 seconds