Spelling suggestions: "subject:"analise por conglomerate"" "subject:"canalise por conglomerate""
1 |
Modelagem estatística para gestão de carteira de clientesBrevi, Flaviane Peccin 13 March 2013 (has links)
Resumo: O setor de telecomunicações brasileiro entrou num processo contínuo de expansão após as privatizações que ocorreram na década de 1990. Com esse processo, entraram nesse mercado novos competidores e novas tecnologias. Isso foi benéfico para o consumidor, que atualmente tem mais opções de escolha de prestadoras do serviço. Por outro lado, as empresas que oferecem esse serviço precisam quantificar as probabilidades de esses clientes pagarem pelo serviço prestado. Nesse contexto, este trabalho tem por objetivos mapear as variáveis que podem ser consideradas fatores de risco para inadimplência, construir um modelo preditivo para estimar a probabilidade de pagamento das faturas mensais e avaliar a possibilidade da implantação desse modelo num sistema automático de decisão. Para o desenvolvimento dos modelos, foram considerados 43.339 clientes da empresa em estudo, que contrataram os serviços entre janeiro e dezembro de 2007. Esses clientes foram acompanhados por doze meses para avaliar sua performance quanto ao pagamento de suas faturas mensais. Dessa forma, a amostra foi dividida em dois grupos, denominados bons e maus. Clientes bons são aqueles que, durante os doze meses, atingiram no máximo cinco dias em atraso, no total de 23.095 clientes. Maus são aqueles que atingiram 90 dias ou mais de atraso para pagamento de pelo menos uma fatura no período observado, no total de 20.244 clientes. Os clientes que tiveram atraso maior que cinco dias em alguma das faturas, mas não atingiram noventa dias de atraso foram classificados como indeterminados e não fazem parte da amostra em estudo. Com o objetivo de segmentar a amostra em grupos homogêneos, antes de desenvolver o modelo preditivo, foi aplicada a Análise de Cluster. Por meio dessa metodologia, não foi possível obter agrupamentos de clientes. Isso se deve à homogeneidade do grupo em estudo, que gera alta concentração num único cluster. Para obter os modelos preditivos que estimam a probabilidade de pagamento, foi utilizada a Regressão Logística. As variáveis preditoras foram consideradas no modelo por duas formas: a primeira utilizando variáveis dummies; a segunda, o WOE (Weight of Evidence). Em ambas as formas de ajuste do modelo, foram identificados fatores de risco semelhantes, tais como parcelamento, alertas de fraude, altos valores de fatura e baixos históricos de pagamentos, clientes novos, tipo de produto contratado e perfil de consumo. Além desses, algumas regiões podem ser apontadas como fatores de risco, identificadas por meio de CEP, cidade e estado.
|
2 |
Consolidação e validação da ferramenta Rapid Alignment Free Tool for Sequences Similarity Search to Groups (RAFTS3GROUPS) : um software rápido de clusterização para big data e buscador consistente de proteínas ortólogasNichio, Bruno Thiago de Lima January 2016 (has links)
Orientador : Prof. Dr. Roberto Tadeu Raittz / Coorientadores : Dra. Jeroniza Nunes Marchaukoski e Dr. Vinícius Almir Weiss / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 16/09/2016 / Inclui referências ao final dos capítulos / Resumo: Uma das principais análises envolvendo sequências biológicas, imprescindíveis e complexas, é a análise de homologia. A necessidade de desenvolver técnicas e ferramentas computacionais que consigam predizer com mais eficiência grupos de ortólogos e, ao mesmo tempo, lidar com grande volume de informações biológicas, ainda é um grande gargalo a ser superado pela bioinformática. Atualmente, não existe uma única ferramenta eficiente na detecção desses grupos, pois ainda requerem muito esforço computacional e tempo. Metodologias já consolidadas, como o BLAST 'todos contra todos', RBH e ferramentas como o OrthoMCL, demandam um alto custo computacional e falham quando há ortologia, necessitando de uma intervenção manual sofisticada. Diante desse cenário, neste trabalho, aprensentamos um breve review referente às técnicas, desenvolvidas entre 2011 até metade de 2017, para a detecção de ortólogos, descrevendo 12 ferramentas e contextualizando os principais problemas ainda a serem superados. A maioria das ferramentas utiliza o algoritmo BLAST como algoritmo padrão predição de homologia entre sequências. Apresentamos também uma nova abordagem para a clusterização de homólogos, a ferramenta RAFTS3groups. Para validarmos a ferramenta utilizamos como base de dados o UniProtKB/Swiss-Prot com outras ferramentas de clusterização o UCLUST e CD-HIT. RAFTS3groups mostrou-se ser mais de 4 vezes mais rápido que o CD-HIT e equiparável em volume de clusters e de tempo à ferramenta UCLUST. Para análise e consolidação de homologia, introduzimos uma nova aplicação auxiliar à ferramenta RAFTS3groups, na clusterização de ortólogos, o script DivideCluster. Comparamos com o método BLAST 'todos contra todos', analisando 9 genomas completos de Herbaspirillum spp. disponíveis no NCBI genbank. RAFTS3groups mostrou-se tão eficiente quanto o método, apresentando cerca de 96% de correlação entre os resultados de clusterização de core e pan genoma obtidos. Palavras-chave: homologia, clusterização, alignment-free, k-means, RAFTS3. / Abstract: One of the main tests involving biological sequences, essential and complex, is the analysis of homology. The study of homologous genes involved in processes such as cell cycle, DNA repair in simpler organisms, even with large evolutionary distance, there are genes that are shared between primates, yeasts and bacteria, which we call (core-genome). The need to develop computational tools and techniques that can predict more efficiently ortologs groups and handle large volume of biological information is still a problem to be resolved by Bioinformatics. We don't have a single powerful tool in detecting groups that still require a lot of effort and computing time. Tools, already consolidated, as the BLAST ' 'all-against-all' ', RBH, OrthoMCL, demand a high computational cost and fail when there is orthology, requiring manual intervention. In this scenario, in this work we presents a brief review on main techniques, developed between 2011 until early 2016, for the detection of orthologs groups, describing 12 tools and being developed currently and the main problems main problems still to be overcome. We note that most tools uses the BLAST as default prediction of homology between sequences. We also present a new approach for the analysis of homology, the RAFTS3groups tool. We use as the database UniProtKB /Swiss-Prot with the clustering tools the UCLUST and the CD-HIT. RAFTS3groups proved to be more than 4 times faster than CD-HIT and comparable in volume to clusters and time with UCLUST tool. In Homology analysis we introduced a new clustering strategy of orthology, the DivideCluster algorithm aplication built into the RAFTS3groups. Compared with the BLAST 'all-against-all', analyzing 9 complete genomes from Herbaspirillum spp. available by NCBI genbank. RAFTS3groups was shown to be as efficient as the method, showing approximately 96% of the correlation among the clustering results of core and pan genome obtained. Key-words: homology, clustering, alignment-free, k-means clustering, RAFTS3.
|
3 |
Avaliação genética multirracial para ganho de peso pré-desmama em bovinos de uma população compostaBocchi, Adriana Luize [UNESP] 01 August 2006 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:35:45Z (GMT). No. of bitstreams: 0
Previous issue date: 2006-08-01Bitstream added on 2014-06-13T19:25:20Z : No. of bitstreams: 1
bocchi_al_dr_botfmvz.pdf: 486157 bytes, checksum: a2166e71337056d5b24c8e775b2b208b (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Universidade Estadual Paulista (UNESP) / Os compostos são formados pelo cruzamento de várias raças tendo como objetivo a manutenção dOs compostos são formados pelo cruzamento de várias raças tendo como objetivo a manutenção de níveis heteróticos elevados e exploração das diferenças genéticas aditivas entre os diferentes recursos genéticos utilizados nas suas formações. A dificuldade na avaliação genética destes animais é a grande variedade de composições genéticas dentro de um mesmo rebanho. Novos modelos têm sido estudados com a inclusão de efeitos aditivos e não aditivos, entretanto, poucos trabalhos com raças tropicais. O objetivo do trabalho foi estudar modelos com efeitos não-aditivos diretos e maternos em uma população composta em clima tropical, tentando minimizar esses efeitos para obtenção dos valores genéticos dos animais avaliados. Foram utilizados dados de animais de uma população composta. Foram comparados três modelos que incluíram os efeitos fixos de grupo contemporâneo, ordem de parto e heterose direta e materna e os efeitos aleatórios de efeito genético aditivo direto e materno. As análises foram realizadas em duas etapas, na primeira foram estudadas as estimativas dos efeitos raciais e de heterose indiviual e materna e na segunda etapa calculadas as variâncias, herdabilidades e os valores genéticos dos animais. Quando o efeito materno não foi considerado no modelo pareceu superestimar o efeito aditivo racial. Os efeitos aditivos raciais, racial materno e de heterose individual e materna influenciaram significativamente o ganho médio diário no pré-desmame, obtendo diferentes estimativas entre os tipos biológicos. Considerando o arquivo de dados corrigidos para os efeitos não-aditivos diretos e maternos, a herdabilidade direta foi de 0,22 e a materna de 0,20. O efeito racial materno e de heterose individual e materna foram importantes fontes de... / The composite are formed by the crossing of several breeds as objective the maintenance of high heteróticos levels and exploration of the addictive genetic differences among the different genetic resources used in their formations. The difficulty in the genetic evaluation of these animals is the great variety of genetic compositions inside of a same flock. New models have been studied with the inclusion of addictive effects and non-addictive, however, few works with tropical breeds. The objective of the work was to study models with direct and maternal non-addictive effects in a population composed in tropical climate, trying to minimize those effects for obtaining the genetic values of the analysed animals. There were used data of composite population. They were compared three models that included the fixed effects of contemporary group, birth order and direct and maternal heterosis and the random effects of direct and maternal addictive genetic effect. The analyses were accomplished in two stages, in the first they were studied the estimates of the racial effects and individual and maternal heterosis; and in the second stage calculated the variances, heritability and the genetic values of the animals. When the maternal effect was not considered in the model seemed to overestimate the racial addictive effect. The racial addictive, maternal racial and individual and maternal heterosis effects significantly influenced the preweaning daily gain, obtaining different estimates among the biological types. Considering the data file corrected for the direct and maternal non-addictive effects, the direct herdabilidade was 0.22 and the maternal was 0.20. The maternal racial effect and individual and maternal heterosis were important variation sources for the preening daily gain and they should be considered during the genetic evaluation of a multiracial population.
|
4 |
Duas metodologias aplicadas à classificação de precipitação convectiva e estratiforme com radar meteorológicoDamian, Eloá Alano 11 May 2012 (has links)
Resumo: A influência da chuva nas diversas áreas da atividade humana torna indispensável o seu monitoramento. A maioria das precipitacções pode ser classificada em dois grupos: sistemas convectivos e estratiformes. Os sistemas estratiformes são caracterizados por chuvas leves e moderadas e grande área de cobertura. Já os convectivos estão associados com altas taxas de precipitação. Devido às acentuadas diferenças que existem entre os dois sistemas, ser capaz de classificálos contribui para a melhora da estimativa de precipitação. Além disso, a classificação torna possível também a identificação, previsão e acompanhamento de tempestades severas (sistemas convectivos), resultados que podem ainda ser utilizados nos alertas de temporais, nchentes e inundações, com aplicações diretas em diversas áreas da atividade humana (energia, agricultura, turismo, defesa civil, entre outros). Tudo isso justifica a necessidade de um critério para separar e classificar os diferentes tipos de chuva que podem ocorrer na região de abrangência do radar. O objetivo deste trabalho é classificar os sistemas meteorológicos em convectivo ou estratiforme, de acordo com as características peculiares a cada evento. Para tanto, duas técnicas são aplicadas. A primeira é um método de reconhecimento de padrões, o chamado Support Vector Machine (SVM), técnica que, a partir de dados previamente classificados, cria um hiperplano separador entre as classes, através do qual novos dados podem ser classificados. Assumindo como padrão imagens de radar classificadas por especialista, os resultados obtidos pelo método apresentam um maior índice de acerto, quando comparados com as soluções obtidas por uma técnica de separação da chuva já existente. O segundo método bordado é uma técnica de análise de agrupamentos, o K-means, que classifica um conjunto de dados em um determinado número de grupos, baseado na similaridade ou dissimilaridade entre os dados. Em relação á classificação feita pelo especialista, o SVM apresenta melhores resultados. Porém, o K-means mostra resultados melhores quando a comparação é feita com a técnica de classificação já existente na literatura. Além disso, o K-means mostrou-se mais eficiente com relação a tempo de execução, e possui a vantagem de não necessitar de dados previamente classificados, já que a classificação, neste caso, é muito subjetiva. Quando a comparação é feita entre as duas técnicas propostas, observa-se que mais de 85% dos dados obtiveram a mesma classificação.
|
5 |
O que é real para estudantes, leigos e cientistas?Teixeira, Reginaldo Manoel January 2014 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Educação Científica e Tecnológica, Florianópolis, 2014. / Made available in DSpace on 2015-02-05T20:27:50Z (GMT). No. of bitstreams: 1
327895.pdf: 2959616 bytes, checksum: ce5aef4cda155e614aa79fce078e1237 (MD5)
Previous issue date: 2014 / O conhecimento científico é uma forma particular de apreensão da realidade, assim sendo, nosso trabalho tem como objetivo contribuir para o aprofundamento de questões relacionadas ao julgamento de realidade e à aprendizagem de ciências, buscando na ideia de sentimento de realidade suporte conceitual para mediar essa reflexão. Partimos do pressuposto que o interesse por ciências é um elemento do domínio afetivo relacionado com o sentimento de realidade atribuído aos objetos científicos. Para tanto, desenvolvemos nossa investigação com estudantes, leigos e cientistas. Todos os participantes da pesquisa responderam a um questionário de intensidade de realidade de diversos objetos. Os estudantes também responderam a um questionário de interesse por ciências. Os objetos do questionário de intensidade de realidade foram classificados com base na Teoria dos Três Mundos de Karl Popper. Para fins de análise, classificamos os objetos em agrupamentos, de acordo com os dados de cada grupo de participantes por meio da uma técnica multivariada denominada análise de clusters. Buscamos no teste U de Mann-Whitney suportes estatísticos, com o objetivo de ancorar nossos resultados. A partir de nossos resultados, concluímos que existem diferenças entre o nível de realidade atribuído pelos cientistas, estudantes e leigos, tanto aos objetos científicos como aos demais; as diferenças entre níveis de realidade também são encontradas entre estudantes com elevado interesse e estudantes com baixo interesse; o interesse por ciências está relacionado com o nível de sentimento de realidade atribuído aos objetos científicos. Essas conclusões mostram a necessidade de levarmos em conta o grau de sentimento de realidade dos estudantes pelos objetos científicos. Nesse sentido, buscamos, em estudos teóricos anteriores, identificar as dimensões afetiva, cognitiva, social e sensorial que constituem o sentimento de realidade. Assim, acreditamos que devemos investir em abordagens didáticas que levem em consideração as dimensões que compõem o sentimento de realidade, a fim de aumentar o nível desse sentimento e, consequentemente, aumentar o interesse dos estudantes por ciências. Finalizamos nossa reflexão fazendo uma análise ontológica de um objeto com base da Teoria dos Três Mundos (TTM) de Popper, pois conjecturamos que essa análise, mesmo para os objetos científicos, pode mostrar quais aspectos devem ser considerados com maior ênfase nessas abordagens para obtenção de melhores resultados na aprendizagem científica.<br> / Abstract : Scientific knowledge is a particular way of apprehending reality, therefore, our work aims to contribute to the understanding of issues related to the examination of reality and science learning, based on the idea of sense of reality used here as a conceptual support to this reflection. We assume that interest in science is a component of the affective domain related to the sense of reality attributed to scientific objects. We develop our research with students, laymen and scientists. All participants of the survey answered a questionnaire on intensity of reality of various objects. Students also answered a questionnaire on interest in science. The objects of the intensity of reality questionnaire were classified based on the Three Worlds Theory of Karl Popper. For analysis purposes, we classify objects into groups, according to the data of each group of participants through a so-called multivariate cluster analysis technique. We seek the Mann- Whitney statistical test supports, in order to anchor our results. Based on our results, we conclude that there are differences between the level of reality given by scientists, students and laymen, regarding to the scientific object as the other objects; the differences between levels of reality are also found among students with high interest and low interest students; interest in science is related to the level of sense of reality attributed to scientific objects. These findings show the need to take into account the degree of students' sense of reality of scientific objects. In this sense, based on previous theoretical studies, we seek to identify cognitive, social, affective and sensory dimensions that constitute the sense of reality. Thus, we believe that we must invest in teaching approaches that take into account the dimensions which compose the sense of reality in order to increase the level of this feeling and thereby to increase student interest in science. Finally, we develop an ontological analysis of an object based on the Three Worlds Theory (TTM ) Popper since we consider that even for scientific objects this analysis can show which aspects must be placed greater emphasis on these approaches in order to obtain more effective results in scientific learning.
|
Page generated in 0.1034 seconds