Spelling suggestions: "subject:"ciências dda computação"" "subject:"ciências daa computação""
341 |
Algoritmos para o problema da clique máxima : análise e comparação experimentalZuge, Alexandre Prusch January 2017 (has links)
Orientador : Prof. Dr. Renato Carmo / Tese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 28/09/2017 / Inclui referências : f. 107-113 / Resumo: O problema da Clique Máxima (CM) é um problema fundamental e há uma grande motivação pela busca de algoritmos tão eficientes quanto possível para resolvê-lo de forma exata. Como esperado para um problema NP-difícil, os melhores algoritmos com desempenho de pior caso conhecido tem custo de tempo exponencial. Por outro lado, resultados experimentais encontrados na literatura indicam que instâncias de tamanho considerável podem ser resolvidas usando algoritmos baseados na técnica de branch-and-bound. Com isso, observa-se uma distância entre os melhores resultados analíticos e os melhores resultados experimentais. Uma possível explicação para discrepância aparente entre teoria e prática foi encontrada pela análise de instâncias aleatórias. Diversos algoritmos de branch- and-bound para a solução exata do CM foram estudados, analisados e implementados. Com base nos resultados analíticos é proposta uma metodologia para comparação experimental de algoritmos, que tem como principal ponto positivo o fato de que algoritmos podem ser comparados independente de detalhes de implementação e execução. Vários algoritmos foram testados como prova de conceito. Também foram estudadas instâncias de pior caso para algoritmos de branch-and-bound que só utilizam coloração como limitante superior, resultando em um custo exponencial de tempo para estes algoritmos. Uma nova família de algoritmos foi desenvolvida, capaz de resolver tais instâncias em tempo polinomial. Recentemente, técnicas de resolvedores para problemas de satisfatibilidade têm sido aplicadas em algoritmos para CM. Tais técnicas dependem de uma redução entre os dois problemas, mas o significado em termos do grafo fica obscurecido nas descrições originais. Algumas técnicas foram estudadas e convertidas para uma descrição que não usa termos referentes aos problemas de satisfatibilidade. A implementação de vários algoritmos estudados foi disponibilizada em um repositório de acesso público. Palavras-chave: Solução exata. Branch-and-bound. Análise de algoritmos. Comparação experimental. / Abstract: e Maximum Clique problem (CM) is a fundamental problem and there is a great motivation for the development of efficient exact algorithms to solve it. As expected for a NP-hard problem, the best algorithms where worst case analyses have been conducted present exponential running times. On the other hand, experimental results available in the literature show that instances of considerable size can be solved by branch and bound algorithms. Therefore, there is an apparent gap between the best theoretical results and the best experimental results. One possible explanation for this discrepancy between theory and practice was found through the analyses of random instances. Several exact branch and bound algorithm for CM were studied, analyzed and implemented. Based on these analytical results, a new methodology for the comparison of algorithms is proposed, where algorithms can be tested and compared regardless of implementation and execution details. Several algorithms were tested as a proof of concept. Worst case instances for some branch and bound algorithms were studied, namely algorithms that adopt only coloring-based bounding techniques to reduce the search space. These algorithms present exponential time cost for the studied instances. A new family of algorithms was developed, which is able to solve the mentioned instances in polinomial time. Recently, techniques from satisfiability solvers have been used in algorithms for CM. Such techniques depend on a reduction between the problems, and the original descriptions in terms of propositional calculus obscures their graph theoretic meaning. Some of these techniques were studied and converted to a description that uses only graph theory terminology. The implementation of several algorithms was made available in a public access repository. Keywords: Exact solution. Branch-and-bound. Analysis of algorithms. Experimental comparison.
|
342 |
Um estudo do uso de testes de qualificação na plataforma Amazon Mechanical Turk.SOUSA, Ianna Maria Sodré Ferreira de. 03 May 2018 (has links)
Submitted by Lucienne Costa (lucienneferreira@ufcg.edu.br) on 2018-05-03T21:05:40Z
No. of bitstreams: 1
IANNA MARIA SODRÉ FERREIRA DE SOUSA – TESE (PPGCC) 2017.pdf: 3044330 bytes, checksum: 5ec0f15ac650d61c186921dd2c1ef9f7 (MD5) / Made available in DSpace on 2018-05-03T21:05:40Z (GMT). No. of bitstreams: 1
IANNA MARIA SODRÉ FERREIRA DE SOUSA – TESE (PPGCC) 2017.pdf: 3044330 bytes, checksum: 5ec0f15ac650d61c186921dd2c1ef9f7 (MD5)
Previous issue date: 2017-07-19 / Muitos sistemas de computação por humanos usam mercados de trabalho crowdsourcing para recrutar trabalhadores. No entanto, devido à natureza aberta desses mercados, garantir que os resultados produzidos pelos trabalhadores possuam uma qualidade suficientemente alta ainda é uma tarefa desafiadora, particularmente em mercados de microtarefas, onde a avaliação precisa ser feita de forma automática. A pré-seleção de trabalhadores adequa- dos é um mecanismo que pode melhorar a qualidade dos resultados obtidos. Isso pode ser feito considerando as informações do cadastro pessoal do trabalhador, o comportamento histórico do trabalhador no sistema ou o uso de testes de qualificação customizados. En- tretanto, pouco se sabe sobre como os solicitantes usam testes de qualificação na prática e se estes tem influência na qualidade dos resultados apresentados pelos trabalhadores. Este estudo visa avançar esse conhecimento. Por meio de análise de distribuições, classificação e agrupamento, as tarefas e os solicitantes foram caracterizados utilizando dados obtidos da plataforma Amazon Mechanical Turk em dois períodos de tempo distintos. Os resultados mostram que a maioria das tarefas (94% e 87%, para a coleta de dados1 e 2,respectivamente) usa algum teste de qualificação para a pré-seleção de trabalhadores e que o tipo e o número de testes de qualificação não são determinados pela classe da tarefa. Os solicitantes, em sua maioria, submetem tarefas com apenas um único teste de qualificação do tipo reputação, no entanto, os solicitantes mais ativos na plataforma usam, exclusivamente, teste de qualificação customizado. Para avaliar o impacto do uso de testes de qualificação customizados na qualidade dos resultados produzidos, foram realiza dos experimentos com três tipos diferentes de tarefas usando tanto trabalhadores qualificados (mestres ou trabalhadores pré-selecionados) como não qualificados. Os resultados mostram que a pontuação média alcançada pelos trabalhadores pré-selecionados foi sempre maior que a alcançada por trabalhadores que não foram pré-selecionados. Além disso, o desempenho de trabalhadores pré-selecionados foi muito próximo dos trabalhadores considerados mestres e, em alguns cenários, melhor, indicando assim, que é possível obter resultados mais acurados em plataformas de trabalho on-line de microtarefas quando se usa testes de qualificação.
|
343 |
Reconhecimento de fragmentos de impressões digitais baseado em cristas e poros /Angeloni, Marcus de Assis. January 2013 (has links)
Orientador: Aparecido Nilceu Marana / Banca: Aura Conci / Banca: José Remo Ferreira Brega / Resumo: Dentre as diversas características biométricas possíveis de serem utilizadas para identificação de pessoas, a impressão digital é a mais utilizada. Os sistemas atuais de identificação automática de impressões digitais são baseados nos padrões das cristas e nas minúcias, classificadas como características de primeiro e segundo níveis, respectivamente. No entanto, com a evolução dos sensores de captura das impressões digitais e a crescente demanda por sistemas mais seguros, torna-se possível e ne-cessário o uso de um conjunto adicional de características discriminativas presentes no interior das cristas, conhecidas como características de terceiro nível, onde se enquadram os poros. Pesquisas recentes têm focado em aplicações de reconhecimento de impressões digitais nas quais as técnicas baseadas em características de primeiro e segundo níveis geralmente apresentam baixas taxas de reconhecimento correto, tal como no reconhecimento de fragmentos de impressões digitais. Esta dissertação de mestrado teve como objetivo propor, implementar e avaliar o uso de poros no método baseado em cristas utilizando a Transformada de Hough, a fim de mitigar os casos de falsos positivos, comuns neste tipo de problema. Foram avaliados os métodos de extração automática de poros basedo em filtros isotrópicos e adaptativos, e o uso dos poros auxiliando na etapa de registro e comparação das imagens. Resultados experimentais realizados sobre a base pública de fragmentos de impressões digitais PolyU HRF mostraram uma redução de aproximadamente 5% no EER e 15% no FAR100 e FAR1000 em relação ao método baseado em cristas original / Abstract: Among the several biometric traits possible to be used for identifying people, fin-gerprint is the most used. Current automated fingerprint identification systems are based on the ridge pattern and minutiae, classified as first and second level features, respectively. However, with the improving of fingerprint sensors and the growing demand for more secure systems, it is possible and necessary to use an additio-nal discriminative features set present in the ridges, known as third level features, where the sweat pores are classified. Recent researches have focused on fingerprint recognition applications in which fingerprint techniques based on first and second levels features usually have low rates of correct recognition, such as the fragments of fingerprints recognition. This Master's dissertation aimed to propose, implement and evaluate the use of pores in the ridge-based fingerprint matching method using Hough Transform, in order to mitigate the false positives cases, that commonly occur in this type of problem. We evaluate the isotropic-based and adaptive-based automatic pore extraction methods, and the use of pores assisting in the images registration and comparison steps. Experimental results on the public database PolyU HRF, composed by partial fingerprint images, showed a reduction of about 5% in EER, and 15% in FAR100 and FAR1000, when compared to the original ridge-based approach / Mestre
|
344 |
Avaliação da utilização de leaderboards em disciplinas introdutórias de programação.MEDEIROS, Kláudio Henrique Mascarenhas. 15 May 2018 (has links)
Submitted by Kilvya Braga (kilvyabraga@hotmail.com) on 2018-05-15T14:15:08Z
No. of bitstreams: 1
KLÁUDIO HENRIQUE MASCARENHAS MEDEIROS - DISSERTAÇÃO (PPGCC) 2016.pdf: 295444 bytes, checksum: 39e4e99b14909cdff8524e2e85703da8 (MD5) / Made available in DSpace on 2018-05-15T14:15:08Z (GMT). No. of bitstreams: 1
KLÁUDIO HENRIQUE MASCARENHAS MEDEIROS - DISSERTAÇÃO (PPGCC) 2016.pdf: 295444 bytes, checksum: 39e4e99b14909cdff8524e2e85703da8 (MD5)
Previous issue date: 2016 / Dentre as práticas importantes para alunos de programação introdutória está a realização de exercícios. Existem disciplinas de programação que disponibilizam aos alunos um grande conjunto de problemas. Apesar dessa disponibilidade, existe o problema de que as disciplinas contém alunos que não são motivados a resolvê-los. A gamificação consiste no uso de elementos e dinâmicas existentes em jogos em contextos que não são jogos e nos últimos anos tem sido considerada uma possível solução para o problema de desengajamento de alunos em contextos educacionais. Um dos elementos de jogos utilizados em contextos gamificados é o leaderboard. Os leaderboards são tabelas que exibem indivíduos ordenados de acordo com um critério de pontuação e criam competições que podem estimular os alunos a serem mais ativos. Neste trabalho, nós propomos e avaliamos um design de leaderboards para disciplinas introdutórias de programação, como intuito de incentivar os alunos a resolverem mais exercícios de programação. Nós elicitamos requisitos baseados nos aspectos positivos e negativos dos leaderboards e tomamos decisões de design para atendê-los. A avaliação do design foi feita através de um experimento de curta duração e um estudo longitudinal durante um período letivo. Nós encontramos indícios de que os leaderboards exercem efeito positivo sobre os alunos, fazendo-os exercitar mais. A atribuição de pontuação igual para todos os tipos de problemas permite que mais alunos tenham chances de alcançar altas posições nos leaderboards. A implantação de leaderboards de menor duração incentivou alunos menos ativos na disciplina, mesmo que por poucos dias. / Among the important practices to students of introductory programming is the exercise solving. There are programming courses that offer a large set of problems to students. Despite this availability, there are cases of courses that have students that are not motivated to solve these problems. Gamification is the use of game elements and dynamics in nongame contexts and recently has been considered to be a possible solution for the problem of disengagement of students on educational contexts. One of the game elements used in gamified contexts is the leaderboard. The leaderboards are charts that shows individuals ranked accordingly to a score criteria and creates competition environments that may stimulate studentstobemoreactive. In this work, we propose and evaluate a leaderboarddes ign for introductory programming courses, in order to motivate the students to solve more programming exercises. We elicited requisites based on the positive and negative aspects of leaderboards and made design decisions for fulfill those requirements. The evaluation of the design is done through an short-length experiment and a longitudinal study during a semester. We found evidences that the leaderboards have a positive effecton the students,motivating them to do more exercises. The attribution of the same score for all exercises allowed more students tore achhighranks on the leaderboards. The implantation of short-lengthleaderboards motivated less-active students on the course, even for a few days.
|
345 |
Estratégia paralela para alinhamento múltiplo de sequências com algoritmo genético multi-ilhaMiranda, Lídia Araujo January 2009 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2009. / Submitted by Allan Wanick Motta (allan_wanick@hotmail.com) on 2010-07-16T19:38:07Z
No. of bitstreams: 1
2009_LidiaAraujoMiranda.pdf: 5472186 bytes, checksum: 3bc128515fab954a95e110f39e6c356c (MD5) / Approved for entry into archive by Lucila Saraiva(lucilasaraiva1@gmail.com) on 2010-07-19T14:24:14Z (GMT) No. of bitstreams: 1
2009_LidiaAraujoMiranda.pdf: 5472186 bytes, checksum: 3bc128515fab954a95e110f39e6c356c (MD5) / Made available in DSpace on 2010-07-19T14:24:14Z (GMT). No. of bitstreams: 1
2009_LidiaAraujoMiranda.pdf: 5472186 bytes, checksum: 3bc128515fab954a95e110f39e6c356c (MD5)
Previous issue date: 2009 / O Alinhamento Múltiplo de Sequências genéticas (AMS) é executado milhares de vezes ao dia por cientistas, a fim de identificar regiões de semelhança entre três ou mais sequências. Os alinhamentos múltiplos assim obtidos são usados na resolução de problemas complexos, como a determinação do histórico evolutivo das espécies. Por se tratar de um problema NP-completo, geralmente são utilizadas soluções heurísticas para a sua resolução. Dentre soluções adotadas, destaca-se o Algoritmo Genético (AG), que é um método iterativo não-determinístico, baseado nos princípios da Evolução das Espécies de Darwin. Apesar de apresentar soluções boas para o AMS, os algoritmos genéticos demandam um alto poder de processamento, que se traduz em um alto tempo de execução. Por essa razão, algumas estratégias paralelas foram propostas na literatura para acelerar a obtenção de alinhamentos múltiplos com AGs, geralmente utilizando a estratégia da ilha como base de paralelização. A presente dissertação de mestrado propõe e avalia uma estratégia paralela que utiliza Algoritmo Genético para o Alinhamento Múltiplo de Sequências, inspirada no modelo Multi-ilha. De maneira diferente das abordagens para AMS existentes na literatura, a estratégia proposta utiliza 3 Super Ilhas, onde cada Super Ilha implementa um modelo tradicional de ilhas. Os resultados obtidos com bases reais de proteínas mostram que a estratégia proposta é capaz de encontrar alinhamentos múltiplos de melhor qualidade em menor tempo, quando comparada com a estratégia de ilha tradicional. _______________________________________________________________________________ ABSTRACT / The Multiple Sequence Alignment (MSA) between genetic sequences is exhaustively
done by scientists trying to identify matching regions within three or
more sequences. The resulting multiple alignments are used in complex problems
like the one of establishing genetic relationships between biological sequences.
The MSA has been shown to be an NP-complete problem, therefore heuristic
solutions are usually used to solve it. One of the solutions that has shown good
results for MSA is the Genetic Algorithm (GA), a non deterministic iterative
method, based on Charles Darwin's theory of evolution. Though presenting good
results, the GA demands high amount of computing power, taking usually a lot
of time to be executed. To speed up the sequential algorithms execution, parallel
algorithms were proposed in the literature, most of them using the island
strategy of parallelization. This masters dissertation proposes and evaluates a
parallel strategy that uses Genetic Algorithms to the Multiple Sequence Alignment
based on the Multi-island parallelization strategy. Di erently from other
MSA strategies, the proposed strategy creates three Super Islands and each one
executes a GA parallelized by the island strategy. The results were obtained with
real protein banks and revealed that the proposed strategy is capable of nding
better multiple alignments in a smaller amount of time, when compared to the
conventional island strategy.
|
346 |
As novas formas de mediação disponíveis pelos sítios dos Tribunais de Justiça Estaduais: produtos e serviços de informação jurídica em rede : estudo de caso do Tribunal de Justiça do Estado do MaranhãoBottentuit, Aldinar Martins 18 December 2000 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Estudos Sociais Aplicados, Departamento de Ciência da Informação e Documentação, 2000. / Submitted by Marcos Felipe Gonçalves Maia (felipehowards@gmail.com) on 2010-08-04T09:38:41Z
No. of bitstreams: 1
2000 Aldinar Martins.pdf: 10049580 bytes, checksum: bef6f896f210100f6b86ba5fa086d736 (MD5) / Approved for entry into archive by janne cury nasser(janne@bce.unb.br) on 2010-08-11T15:08:00Z (GMT) No. of bitstreams: 1
2000 Aldinar Martins.pdf: 10049580 bytes, checksum: bef6f896f210100f6b86ba5fa086d736 (MD5) / Made available in DSpace on 2010-08-11T15:08:00Z (GMT). No. of bitstreams: 1
2000 Aldinar Martins.pdf: 10049580 bytes, checksum: bef6f896f210100f6b86ba5fa086d736 (MD5) / Pesquisa sobre as novas formas de mediação disponíveis pêlos sítios dos tribunais de justiça estaduais, com um estudo de caso do Tribunal de Justiça do Estado do Maranhão - TJMA. Á crescente disponibilidade e multiplicação da informação jurídica - doutrina, legislação e jurisprudência, tanto nacional quanto estrangeira- em rede eletrônica tem possibilitado aos operadores jurídicos e ao cidadão o convívio no ciberespaço com um conjunto representativo de matéria jurídica. Acompanhando as transformações no campo da informação e da tecnologia, o Tribunal de Justiça do Estado do Maranhão criou, em novembro de 1998, a sua página na Internet. Objetivou-se, assim, identificar os tipos de informação institucional, serviços e produtos disponíveis em rede (www) pelo sítio do Superior Tribunal de Justiça-STJ e dos Tribunais de Justiça Estaduais, com vistas a possibilitar uma comparação com o do Tribunal de Justiça do Estado do Maranhão. A metodologia empregada foi o estudo de caso, sendo adotadas três técnicas: a pesquisa bibliográfica, a pesquisa dos sítios dos tribunais de justiça estaduais através de checklist e a entrevista semi-estruturada direcionada aos coordenadores envolvidos com a política de gestão do sítio do TJMA. Procedeu-se ao mapeamento de cada sítio, tendo-se como produto um perfil dos mesmos, no tocante às suas semelhanças e peculariedades. Para desenvolvimento da pesquisa, considerou-se como pressuposto que os Tribunais de Justiça Estaduais, como órgãos que visam atender à sociedade na prestação de serviços jurisdicionais, mantendo o sentimento de justiça e cidadania, podem utilizar o potencial da comunicação interativa e coletiva em rede, no sentido de possibilitar aos operadores jurídicos novas formas de intercâmbio e de acesso às informações, serviços e produtos. Analisam-se os dados da pesquisa com base em contribuições teórico-conceituais de diversos autores e apresentam-se as conclusões a partir das variáveis: serviços e produtos disponíveis pêlos sítios desses tribunais, informação institucional e gestão do sítio do TJMA. _________________________________________________________________________________ ABSTRACT / Research about new of mediation available through the sites from States' courts of
with a case investigation from the State of Maranhão'8 a Court of justice (TJMA). The
prescent availablity and multiplication of jurisdical Information - doctrine, legislation and
jurisprudence, as nacional as foreingn one - on eletronlc net hás allowed jurisdical operators and
citizen to cohabit in the ciberspace with a representative set of jurisdical material. Comming along
with transformations on information and technological fields, the Stale of Maranhão's Court of
justice hás created on november, 1998, his own Internet page. Só, aimed to identify the kinds of
institutional information, services and products available on net (www) through the Higt Court of
justice - ST J and Stats' Courtes' of Justice's sites, in order to allow a cmparation with State of
Maranhão's lourt of justice's. the methodology that was used was the case investigation and hawe
been adopted three technics: the bibliographcal and documental research, the courts of justice's
sites from other states through checklist, and the half estructured interview leaded to the coordinatiors
envolved with the administration politics of TJMA site. Proceded the mapping of each
site, and houving na outline of each one of them gs a result, according to their similarities and
peculiarídties. In order to increase this research, have sonsidered as a presuppose that states1
courts of justice, as na institution that seek to attend the soclety on giving juridical services,
maintainning a feeling of justice and citizenhood, it can use potential that interative collective
communication has on net, in order to allow juridical operation new forms of interchange and for
access to the informations, services and products. Analyze the data from the serearch based on
theoric-conceptual contribuitions from various authors and show the conclusions from the various:
services and products available through the sites of these courts, institutional information and
TJMA site administration.
|
347 |
Innovative Behavior Model of Software ProfessionalsMonteiro, Cleviton Vinicius Fonseca 25 November 2014 (has links)
Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-06T18:40:57Z
No. of bitstreams: 2
DISSERTAÇÃO Cleviton Vinicius Fonseca Monteiro.pdf: 2456824 bytes, checksum: d373c5c6116f63a58b2bffd2b1772776 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T18:40:57Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Cleviton Vinicius Fonseca Monteiro.pdf: 2456824 bytes, checksum: d373c5c6116f63a58b2bffd2b1772776 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-11-25 / CAPES,
Emerging Leaders in the Americas Program (ELAP) / Background: Innovation has been recognized as an important, if not essential condition to gain competitive advantage and survive in the software industry. From the initial moments of any innovation process, the company`s employees play an essential role. They are the ones who should engage in the search for opportunities as well as generate and implement new ideas. Their behavior towards innovation is called innovative behavior and it can be observed at different levels on each professional.
Goal: The aim of this study is to build a model to explain which factors influence the innovative behavior of individuals in software development teams. To achieve higher explanatory power and close the gap of current researches, which are mostly based on quantitative data, this model was built grounded on deep analysis of rich qualitative and quantitative data.
Method: A mix method research composed of a systematic literature review (SLR) and two industrial case studies were used to analyze the phenomenon of innovative behavior. The SLR analyzed 80 primary studies, from an initial set of 10.399 articles. The first case study was conducted on a small Canadian software firm, involving 2 projects and 6 participants, and its results were used to produce an initial model. The second case study was performed on a large Brazilian software organization, involving 8 projects and over 60 participants.
Results: The resulting model, called IBMSW, confirmed several antecedents from previous models as well as proposed new antecedents of innovative behavior. In particular, the findings showed that the individual’s personality exert influence on individual’s innovative behavior and two competing explanations were identified.
Conclusion: The results obtained provided explanatory power to the innovative behavior model as well as showed the importance to study such phenomena in the software industry. In addition, several recommendations for practitioners from different organizational levels were provided based on the IBMSW.
|
348 |
Algoritmos particionais semissupervisionados com ponderação automática de variáveisMACARIO FILHO, Valmir 10 January 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-02-19T18:48:11Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE Valmir Macario Filho.pdf: 4240940 bytes, checksum: 4f9034afca3528b01bdc7b2ac14aff39 (MD5) / Made available in DSpace on 2016-02-19T18:48:11Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE Valmir Macario Filho.pdf: 4240940 bytes, checksum: 4f9034afca3528b01bdc7b2ac14aff39 (MD5)
Previous issue date: 2015-01-10 / FACEPE / Nas aplicações tradicionais de aprendizagem de máquina, os classificadores utilizam ape-
nas dados rotulados em seu treinamento. Os dados rotulados, por sua vez, são difíceis,
caros, consomem tempo e requerem especialistas humanos para serem obtidos em algu-
mas aplicações reais. Entretanto, dados não rotulados são abundantes e fáceis de serem
obtidos mas há poucas abordagens que os utilizam no treinamento. Para contornar esse
problema existe a aprendizagem semissupervisionada. A aprendizagem semissupervisio-
nada utiliza dados não rotulados, juntamente com dados rotulados, com a finalidade de
melhorar o desempenho dos algoritmos. A abordagem semissupervisionada, geralmente,
obtém resultados melhores do que se utilizassem apenas poucos padrões rotulados em
uma abordagem supervisionada ou se utilizassem apenas padrões não rotulados numa
abordagem não supervisionada. Um algoritmo semissupervisionado pode se basear em
algoritmos de agrupamento não supervisionado, geralmente, adicionando-se um termo ou
estratégia que faz uso de informações rotuladas para guiar o processo de aprendizagem
deste algoritmo. Os algoritmos de agrupamento são bastante influenciados pelo cálculo
da similaridade entre dois items, ou seja, a distância entre dois itens. Quando o algoritmo
semissupervisionado é um extensão de um algoritmo de agrupamento, este também é
bastante influenciado por esta distância. Desse modo, distâncias adaptativas são utiliza-
das para que o algoritmo tenha capacidade de se adequar a diferentes distribuições dos
dados, geralmente, melhorando o desempenho em relação aos algoritmos que não utili-
zam uma distância adaptativa. Este trabalho apresenta novos algoritmos de agrupamento
semissupervisionado baseados no algoritmo Fuzzy C-Means que utilizam distâncias adap-
tativas com ponderação automática de variáveis. Estudos experimentais no contexto da
aprendizagem a partir de dados parcialmente rotulados são apresentados. Além disso, o
comportamento dos algoritmos é discutido e os resultados examinados através de testes
estatísticos de Friedman. Desse modo, foi possível certificar que os novos algoritmos de
agrupamento semissupervisionado com distâncias adaptativas apresentam desempenho
melhor que algoritmos já consolidados na literatura. / In traditional machine learning applications, one uses only labeled data to train the al-
gorithm. Labeled data are difficult, expensive, time consuming and require human ex-
perts to be obtained in some real applications. However, unlabeled data are abundant
and easy to be obtained but there has been few approaches to use them in training.
Semi-supervised learning addresses this problem. The semi-supervised learning uses large
amount of unlabeled data, together with the labeled data, to build better algorithms.
The semi-supervised approach, usually, obtains better results than if using a few labeled
patterns in a supervised approach or using only standard not supervised approach. The
semi-supervised algorithm can be an extension of an unsupervised algorithm. Such algo-
rithm can be based on unsupervised clustering algorithms, adding a term or strategy, that
makes use of labeled information to guide the learning process of the algorithm. Unsuper-
vised algorithms are greatly influenced by calculating the similarity between two items,
ie, the distance between two items. When the semi-supervised algorithm is an extension
of an unsupervised algorithm, it is also quite influenced by this distance. Thus, adaptive
distances are utilized, so the algorithm is able to adapt to different data distributions, gen-
erally improving performance compared to algorithms that use the standard Euclidean
distance. This work presents new algorithms for semi-supervised clustering based on Fuzzy
C-Means algorithm using adaptive distances with automatic variable weighting. Exper-
imental studies in the context of learning from partially labeled data are presented. In
addition, the behavior of the algorithm is discussed and the results are investigated using
the Friedman Test. Thus, it was possible to certify that the performance of the new semi-
supervised clustering algorithms are better than other consolidated algorithms.
|
349 |
Model for the Innovation Teaching (MoIT): um modelo baseado em Design Thinking, Lean Startup e Ágil para estudantes de graduação em computaçãoPAULA, Danielly Ferreira Oliveira de 02 March 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-02-19T18:52:18Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Danielly Ferreira Oliveira de Paula.pdf: 9568559 bytes, checksum: 3c861a80a2f9571f8b258acf8fa54ffe (MD5) / Made available in DSpace on 2016-02-19T18:52:18Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Danielly Ferreira Oliveira de Paula.pdf: 9568559 bytes, checksum: 3c861a80a2f9571f8b258acf8fa54ffe (MD5)
Previous issue date: 2015-03-02 / CAPES / Startups de software são responsáveis por desenvolver produtos com um enorme impacto
no mercado e contribuição significativa para a economia local e global. Porém, oito de
dez startups de TI falham com até três anos de sua criação, sendo a falha ocasionada
principalmente pela inexperiência da equipe em desenvolvimento de novos produtos. Esta
falha é impulsionada devido à falta de um programa nas universidades que fomente
a atividade empreendedora nos alunos. Dessa forma, grande parte dos estudantes de
computação sentem dificuldades em identificar problemas e validar soluções. As abordagens
Lean Startup e Ágil são normalmente utilizadas por equipes de software para desenvolver
produtos, porém não são suficientes para a criação de produtos inovadores. Alguns modelos
existentes recomendam também o uso do Design Thinking durante o processo de criação
de softwares inovadores, porém ainda não há um consenso na literatura sobre qual a
melhor forma de combinar Design Thinking com processos de desenvolvimento de software.
Portanto, a proposta deste trabalho de mestrado é testar dois modelos já existentes que
integram Design Thinking, Lean Startup e Ágil com a finalidade de conceber um novo
modelo baseado na análise das validações dos testes. O objetivo é integrar de forma mais
natural o processo de Design Thinking a métodos já utilizados por equipes de software,
reduzindo a curva de aprendizado. Os modelos selecionados foram: o modelo Hildenbrand e
da Nordstrom. Estes foram testados em duas equipes de estudantes do Tech Center Recife.
O Tech Center foi um ambiente desenvolvido pelo Centro de Informática da Universidade
Federal de Pernambuco em parceria com a empresa BlackBerry, cujo objetivo era fomentar
o espírito empreendedor nos estudantes de computação através do ensino da inovação. As
equipes desenvolviam aplicativos mobile utilizando Lean Startup e SCRUM, porém não
seguiam nenhum modelo que envolvesse práticas de design. Para fins de testes dos dois
modelos, cada equipe do Tech Center seguiu um modelo diferente afim de desenvolver
um aplicativo mobile com caráter de produto. Ao final, foram analisadas as opiniões
dos usuários e as dificuldades da equipe. Baseado nesses resultados, um terceiro modelo
foi concebido. O terceiro e novo modelo MoIT (Model for the Innovation Teaching) foi
testado por uma das equipes com a finalidade de melhorar o aplicativo desenvolvido
anteriormente, e consequentemente diminuir as dificuldades anteriores em relação ao
desenvolvimento, além de promover uma maior satisfação nos usuários. Como resultado,
o novo modelo apresentou um bom potencial de aprendizagem, visto que os estudantes
conseguiram melhorar consideravelmente o aplicativo e assim, obtiveram uma excelente
taxa de aceitação dos usuários. Além disso, estão obtendo reconhecimento, ao reproduzir
os conceitos e práticas aprendidos, em seus novos empregos. / Software startups are responsible for developing products with a huge impact on the market
and significant contribution to the local and global economy. However, eight out of ten
IT-startups fail up to three years of its creation. The failure is caused mainly by the team’s
inexperience in developing new products. This failure is driven by a lack of a program
in universities that encourages entrepreneurial activity among students. Consequently,
the majority of computing students have difficulty in identifying problems and validate
solutions. The Lean Startup and Ágil approaches are commonly used by software teams
to develop products, but they are not sufficient for the creation of innovative products.
There are models that recommend the use of Design Thinking throughout the process of
creating innovative softwares, but there is still no consensus in the literature about the
best way to combine Design Thinking with software development processes. Therefore,
the purpose of this master’s thesis is to test two existing models that combine Design
Thinking, Lean Startup and Ágil in order to create a new model based on the analysis
of the tests’ validation. The aim is to integrate more naturally the Design Thinking
process to the methods already in use by a software team, and consequently reducing the
learning curve. The two selected models were Hildebrand and Nordstrom. Those models
were tested in two teams of students from Tech Center Recife. The Tech Center was an
environment created by the Computer Center of Universidade Federal de Pernambuco in
partnership with BlackBerry. The Tech Center aimed to encourage the entrepreneurial
spirit in computing students by teaching innovation. It was composed of 12 students of
computing and a coordinator. They were used to develop mobile applications using Lean
Startup and SCRUM, but they did not follow any model involving design practices. With
the purpose of testing the two models, each team of Tech Center followed a different
model in order to develop a mobile application with the character of a product. Finally,
the user’s opinion and the difficulties of the team were analyzed. Based on those results,
a third model was created. The Model for the Innovation Teaching (MoIT) was tested
by one of the teams in order to improve the application that was developed previously,
consequently decrease the previous difficulties related to the development, and promote
greater satisfaction among users. As a result, the new model showed a good potential
for learning, as the students were able to considerably improve the application and thus
it had an excellent users’ acceptance. Besides that, they are also gaining recognition to
reproduce the concepts and practices in their new jobs.
|
350 |
SKDQL: Uma linguagem declarativa de especificação de consultas e processos para descoberta de conhecimento em bancos de dados e sua implementaçãoPereira dos Santos Silva, Marcelino January 2002 (has links)
Made available in DSpace on 2014-06-12T15:59:24Z (GMT). No. of bitstreams: 2
arquivo5095_1.pdf: 666231 bytes, checksum: 6f519135fd58b1147e646d9a791953df (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2002 / As ferramentas e técnicas empregadas para análise automática e inteligente dos
imensos repositórios de dados de indústrias, governos, corporações e institutos científicos são
os objetos tratados pelo campo emergente da Descoberta de Conhecimento em Bancos de
Dados (Knowledge Discovery in Databases - KDD). No contexto do MATRIKS, um
framework para KDD, SKDQL (Structured Knowledge Discovery Query Language) é a
proposta de uma linguagem de consulta estruturada para KDD, seguindo os padrões de SQL
dentro de uma arquitetura aberta e extensível, suportando a heterogeneidade, iteratividade e
interatividade dos processos de KDD, com recursos para acesso, limpeza, transformação,
derivação e mineração de dados, bem como manipulação de conhecimento
|
Page generated in 0.0903 seconds