Spelling suggestions: "subject:"mineração dde dados"" "subject:"mineração dde lados""
301 |
Modelo de classificação multivariável para identificação de enchentes: um estudo empírico no sistema de monitoramento de rios e-noe / Multivariate classification model for identification of floods: an empirical study in the monitoring of e-noe riversBrito, Lucas Augusto Vieira 17 May 2019 (has links)
Nas últimas décadas, as enchentes vêm causando muitos problemas nas cidades, principalmente em grandes centros urbanos devido à alteração da paisagem natural e à impermeabilização do terreno. Geralmente esses eventos estão relacionados a eventos extremos de chuva, junto a um insuficiente sistema de drenagem para dar vazão ao escoamento gerado. Um ponto agravante - que colabora com o aumento da magnitude das enchentes - é o crescimento populacional desordenado. Assim, faltam políticas públicas, como um estudo prévio da região para alocação de pessoas de maneira eficiente. Na literatura, existem algumas soluções, como o uso da tecnologia de Redes de Sensores Sem Fio (RSSF), que podem ser implantadas no cenário urbano como forma de monitoramento de enchentes. Nesse cenário, um dos principais desafios para elaboração desses sistemas é emitir alertas para que desastres maiores sejam evitados. Porém, a utilização de uma única fonte de dados, unida a possíveis falhas que as RSSFs podem sofrer, acaba comprometendo o monitoramento e o alerta de enchentes. Uma outra abordagem é a utilização de modelos hidrológicos criados a partir de um estudos prévios do solo e da estrutura da bacia, pois eles são capazes de reproduzir o comportamento do escoamento da bacia a partir de séries temporais como entrada. Existem muitos modelos hidrológicos com diversas estruturas de dados e detalhamento da bacia hidrográfica, dos mais complexos - capazes de reproduzir a física dos processos de infiltração e o escoamento de água - até os mais simplificados, que utilizam parâmetros de ajustes que não são necessariamente relacionados aos fenômenos físicos envolvidos nesses processos. Porém, muitos desses modelos precisam de uma grande quantidade de dados para o seu desenvolvimento, tornando-os muito complexos e custosos. Dessa forma, esta dissertação de mestrado apresenta um modelo de identificação de enchentes baseado na mineração de dados e aprendizado de máquina, com o intuito de diminuir a complexidade e o custo dos modelos hidrológicos e a dependabilidade de uma única variável de sistemas de RSSF, além da vantagem de ser facilmente generalizável sem perder a eficiência na identificação de enchente. As variáveis utilizadas para o desenvolvimento do modelo são os dados de estações meteorológicas e o nível de água do canal. Assim, é utilizada a metodologia do Cross Industry Standard Process for Data Mining (CRISP-DM) para a mineração dos dados, por ser uma técnica objetiva que contém as melhores práticas para a exploração dos dados. Os resultados revelam que o modelo desenvolvido obteve uma acurácia de aproximadamente 87:8%, com o algoritmo Random_Forest. Além disso, nos testes de adaptabilidade e comparação com o Storm Water Management Model (SWMM)-um modelo hidrológico amplamente conhecido na literatura-, em uma mesma região de estudo, o modelo desenvolvido obteve resultados relevantes no contexto de identificação de enchente. Isso mostra que o modelo desenvolvido possui grande potencial de aplicação, principalmente por sua simplicidade de implementação e replicação sem comprometer a qualidade de identificação da ocorrência de enchentes. Consequentemente, algumas das principais contribuições deste trabalho são: (i) o modelo multivariável de identificação de enchente diminui a complexidade, custos e tempo de desenvolvimento em relação aos modelos hidrológicos e; (ii) o avanço do estado da arte em comparação aos trabalhos computacionais, por não depender de variáveis fixas e utilizar multivariáveis para identificar o padrão de enchentes. / In recent decades, floods have caused many problems in cities, especially in large urban centers due to the alteration of the natural landscape and the waterproofing of the terrain. Generally, these events are related to extreme rainfall events, together with an insufficient drainage system to give flow to the flow generated. An aggravating point - which contributes to the increase in flood magnitude - is disordered population growth. Thus, public policies are lacking, such as a prior study of the region for the efficient allocation of people. In the literature, there are some solutions, such as the use of the Wireless Sensor Networks (WSN) technology, which can be implemented in the urban scene as a form of flood monitoring. In this scenario, one of the major challenges in designing these systems is to issue alerts so that major disasters are avoided. However, the use of a single data source, coupled with the possible flaws that WSNs may suffer, endangers flood monitoring and alertness. Another approach is the use of hydrological models created from previous soil studies and basin structure, as they are able to reproduce basin flow behavior from time series as input. There are many hydrological models with diverse data structures and details of the hydrographic basin, of the most complex - capable of reproducing the physics of the infiltration processes and the water flow - to the more simplified, that use parameters of adjustments that are not necessarily related to the phenomena involved in these processes. However, many of these models need a lot of data for their development, making them very complex and costly. This dissertation presents a flood identification model based on data mining and machine learning in order to reduce the complexity and cost of hydrological models and the dependability of a single variable of WSN systems. of the advantage of being easily generalizable without losing efficiency in the identification of flood. The variables used for the development of the model are the data of meteorological stations and the water level of the channel. Thus, the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology for data mining is used, since it is an objective technique that contains the best practices for data mining. The results show that the developed model obtained an accuracy of approximately 87.8%, with the algorithm Random_Forest. In addition, in the adaptive and comparative tests with the Storm Water Management Model (SWMM), a hydrological model widely known in the literature, in the same region of study, the developed model obtained relevant results in the context of flood identification. This shows that the developed model has great application potential, mainly for its simplicity of implementation and replication without compromising the quality of the identification of the occurrence of floods. Consequently, some of the main contributions of this work are: (i) the multivariate model of flood identification decreases the complexity, costs and development time in relation to the hydrological models; (ii) the advance of the state of the art in comparison to the computational works, because it does not depend on fixed variables and use multivariable to identify the flood pattern.
|
302 |
Análise espaço-temporal de data streams multidimensionais / Spatio-temporal analysis in multidimensional data streamsNunes, Santiago Augusto 06 April 2015 (has links)
Fluxos de dados são usualmente caracterizados por grandes quantidades de dados gerados continuamente em processos síncronos ou assíncronos potencialmente infinitos, em aplicações como: sistemas meteorológicos, processos industriais, tráfego de veículos, transações financeiras, redes de sensores, entre outras. Além disso, o comportamento dos dados tende a sofrer alterações significativas ao longo do tempo, definindo data streams evolutivos. Estas alterações podem significar eventos temporários (como anomalias ou eventos extremos) ou mudanças relevantes no processo de geração da stream (que resultam em alterações na distribuição dos dados). Além disso, esses conjuntos de dados podem possuir características espaciais, como a localização geográfica de sensores, que podem ser úteis no processo de análise. A detecção dessas variações de comportamento que considere os aspectos da evolução temporal, assim como as características espaciais dos dados, é relevante em alguns tipos de aplicação, como o monitoramento de eventos climáticos extremos em pesquisas na área de Agrometeorologia. Nesse contexto, esse projeto de mestrado propõe uma técnica para auxiliar a análise espaço-temporal em data streams multidimensionais que contenham informações espaciais e não espaciais. A abordagem adotada é baseada em conceitos da Teoria de Fractais, utilizados para análise de comportamento temporal, assim como técnicas para manipulação de data streams e estruturas de dados hierárquicas, visando permitir uma análise que leve em consideração os aspectos espaciais e não espaciais simultaneamente. A técnica desenvolvida foi aplicada a dados agrometeorológicos, visando identificar comportamentos distintos considerando diferentes sub-regiões definidas pelas características espaciais dos dados. Portanto, os resultados deste trabalho incluem contribuições para a área de mineração de dados e de apoio a pesquisas em Agrometeorologia. / Data streams are usually characterized by large amounts of data generated continuously in synchronous or asynchronous potentially infinite processes, in applications such as: meteorological systems, industrial processes, vehicle traffic, financial transactions, sensor networks, among others. In addition, the behavior of the data tends to change significantly over time, defining evolutionary data streams. These changes may mean temporary events (such as anomalies or extreme events) or relevant changes in the process of generating the stream (that result in changes in the distribution of the data). Furthermore, these data sets can have spatial characteristics such as geographic location of sensors, which can be useful in the analysis process. The detection of these behavioral changes considering aspects of evolution, as well as the spatial characteristics of the data, is relevant for some types of applications, such as monitoring of extreme weather events in Agrometeorology researches. In this context, this project proposes a technique to help spatio-temporal analysis in multidimensional data streams containing spatial and non-spatial information. The adopted approach is based on concepts of the Fractal Theory, used for temporal behavior analysis, as well as techniques for data streams handling also hierarchical data structures, allowing analysis tasks that take into account the spatial and non-spatial aspects simultaneously. The developed technique has been applied to agro-meteorological data to identify different behaviors considering different sub-regions defined by the spatial characteristics of the data. Therefore, results from this work include contribution to data mining area and support research in Agrometeorology.
|
303 |
Tomada de decisões em sistemas financeiros utilizando algoritmos de aprendizado de máquina supervisionado / Decision making in financial systems using supervised machine learning algorithmsOtte Júnior, Luís Carlos 17 October 2018 (has links)
Embora existam soluções para sistemas de cobrança e telecomunicações que apresentem relatórios para auxílio à cobrança de clientes, ambas carecem de informações que apoiem a tomada de decisões, nas análises estratégicas e na propensão de pagamento. Desse modo, o objetivo deste projeto é implementar ferramentas e soluções inteligentes a fim de reduzir o desperdício de tempo e aumentar a produtividade do gestor, decorrentes da necessidade da análise e cruzamento de todos os dados para tomar qualquer ação durante os processos de cobrança e gestão de custos. / Although there are solutions for billing and telecommunications systems to present reports to support debt collection, both lack information to support decision making in strategic analysis and propensity to pay. Thus, the goal of this project is to implement intelligent tools and solutions taht are able to increase their productivity and reduce waste of managers time, due to the need of analyzing and crossing all the data to take action during the collection processes and cost management.
|
304 |
Classificação semissupervisionada de séries temporais extraídas de imagens de satélite / Semi-supervised classification of time series extracted from satellite imagesAmaral, Bruno Ferraz do 29 April 2016 (has links)
Nas últimas décadas, com o crescimento acelerado na geração e armazenamento de dados, houve um aumento na necessidade de criação e gerenciamento de grandes bases de dados. Logo, a utilização de técnicas de mineração de dados adequadas para descoberta de padrões e informações úteis em bases de dados é uma tarefa de interesse. Em especial, bases de séries temporais têm sido alvo de pesquisas em áreas como medicina, economia e agrometeorologia. Em mineração de dados, uma das tarefas mais exploradas é a classificação. Entretanto, é comum em bases de séries temporais, a quantidade e complexidade de dados extrapolarem a capacidade humana de análise manual dos dados, o que torna o processo de supervisão dos dados custoso. Como consequência disso, são produzidos poucos dados rotulados, em comparação a um grande volume de dados não rotulados disponíveis. Nesse cenário, uma abordagem adequada para análise desses dados é a classificação semissupervisionada, que considera dados rotulados e não rotulados para o treinamento do classificador. Nesse contexto, este trabalho de mestrado propõe 1) uma metodologia de análise de dados obtidos a partir de séries temporais de imagens de satélite (SITS) usando tarefas de mineração de dados e 2) uma técnica baseada em grafos para classificação semissupervisionada de séries temporais extraídas de imagens de satélite. A metodologia e a técnica de classificação desenvolvidas são aplicadas na análise de séries temporais de índices de vegetação obtidas a partir de SITS, visando a identificação de áreas de plantio de cana-de-açúcar. Os resultados obtidos em análise experimental, realizada com apoio de especialistas no domínio de aplicação, indicam que a metodologia proposta é adequada para auxiliar pesquisas em agricultura. Além disso, os resultados do estudo comparativo mostram que a técnica de classificação semissupervisionada desenvolvida supera métodos de classificação supervisionada consolidados na literatura e métodos correlatos de classificação semissupervisionada. / The amount of digital data generated and stored as well as the need of creation and management of large databases has increased significantly, in the last decades. The possibility of finding valid and potentially useful patterns and information in large databases has attracted the attention of many scientific areas. Time series databases have been explored using data mining methods in serveral domains of application, such as economics, medicine and agrometeorology. Due to the large volume and complexity of some time series databases, the process of labeling data for supervised tasks, such as classification, can be very expensive. To overcome the problem of scarcity of labeled data, semi-supervised classification, which benefits from both labeled and unlabeled data available, can be applied to classify data from large time series databases. In this Master dissertation, we propose 1) a framework for the analysis of data extracted from satellite image time series (SITS) using data mining tasks and 2) a graph-based semi-supervised classification method, developed to classify temporal data obtained from satellite images. According to experts in agrometeorology, the use of the proposed method and framework provides an automatic way of analyzing data extracted from SITS, which is very useful for supporting research in this domain of application. We apply the framework and the proposed semi-supervised classification method in the analysis of vegetation index time series, aiming at identifying sugarcane crop fields, in Brazil. Experimental results indicate that our proposed framework is useful for supporting researches in agriculture, according to experts in the domain of application. We also show that our method is more accurate than traditional supervised methods and related semi-supervised methods.
|
305 |
Proposição de um algoritmo para identificação biométrica de pessoas baseado nos padrões de veias das mãos. / Proposition of an algorithm for biometric identification of people based on hands vein pattern.Janes, Ricardo 15 December 2015 (has links)
Esta tese tem por finalidade apresentar o desenvolvimento de um sistema biométrico de baixo custo, capaz de identificar pessoas pela análise dos padrões de veias das mãos com obtenção de imagens no espectro infravermelho próximo. O sistema foi montado fisicamente através da construção de um protótipo e então foram aquisitadas e armazenadas 520 imagens da parte dorsal da mão direita de 52 diferentes usuários, após isto foi realizada a extração de uma região de interesse definida pela maior porção quadrada da parte dorsal da mão. Em seguida foram aplicados três diferentes métodos de equalização e suavização da imagem na fase de pré-processamento, para posterior extração das características das veias com a utilização da transformada de Curvelet na função \"wrapping\" e aplicação do algoritmo Padrão Binário Local (LBP) para a digitalização do conteúdo extraído. No próximo passo, uma análise de identificação foi realizada usando cinco diferentes métodos de classificação. Em primeiro lugar, foi utilizado um classificador probabilístico Naive Bayes, em seguida um classificador baseado em aprendizagem por regressão linear Kernel Nearest Neighbor (K-NN), ainda foram aplicados dois algoritmos baseados em árvores de decisão C4.5 e Random Forest e finalmente um algoritmo baseado em redes neurais artificiais Multilayer Perceptron. Os classificadores foram testados utilizando o método de validação cruzada, e as informações foram separadas por 10 folds sendo que 10% dos dados foram utilizados para treino e 90% dos dados foram utilizados para teste. Com os mesmos dados resultantes da fase de pré-processamento, dois algoritmos foram aplicados para seleção de características, sendo o primeiro baseado na correlação da função de seleção de recursos e o segundo na seleção de atributos pelo conceito da entropia dos dados. Os resultados provam que o método de equalização de histograma adaptativa por limite de contraste na fase de pré-processamento apresentou os melhores resultados. Quanto aos classificadores, os melhores resultados foram obtidos com o uso da rede neural artificial proposta e as taxas de falsa aceitação (FAR) e falsa rejeição (FRR) obtidas após o processamento foram estimadas em 0,038 e 0,003 respectivamente. Foram realizados ainda testes com a quantidade mínima de imagens necessárias para identificação de pessoas e chegou-se ao valor de cinco imagens por usuário. Finalmente a avaliação da permanência do sistema biométrico foi realizada através da análise de imagens capturadas após um ano da primeira análise e os resultados mostram que o sistema é robusto, apesar das imagens conterem pequenas alterações, proporcionais às variações do índice de massa corporal dos usuários. / The system has been assembled as a prototype then were acquired and storaged 520 images from the dorsal side of the right hand of 52 different users, and then is accomplished an extracting of a region of interest defined by the largest square portion of the dorsal hand. Then a pre-processing of image has been applied using three different methods of image equalization and smoothing for later extraction of the veins characteristics using the Curvelet Transform in \"wrapping\" function and application of the Local Binary Pattern algorithm (LBP) for scanning the extracted content. On the next step, an identification analysis has been performed using five different classification methods. First, a probabilistic Naive Bayes classifier was used, second a classifier based on linear regression called Kernel Nearest Neighbor (K-NN) was applied, third and fourth two algorithms based on decision trees, C4.5 and Random Forest were tested, and finally an algorithm based on artificial neural networks Multilayer Perceptron was performed. The classifiers have been tested using the cross-validation method, and the information was separated by 10 folds wherein 10% of the data were used for training and 90% of the data were used for testing. From the same data resulted of the pre-processing step, two algorithms have been applied for selection features, the first based on the correlation based feature selection and the second in selecting attributes based to the concept of entropy data. The results proof that the equalization method by contrast limited adaptive histogram equalization, in the pre-processing stage, shown the best results. From the application of classifiers, the best result was achieved by using the artificial neural network proposal and the false acceptance rate (FAR) and false rejection rate (FRR) found through the processing were estimated in 0.038 and 0.003 respectively. Tests were also performed to assess the minimum amount of images needed to identify people and as result five images per user were found as the ideal number. Finally, the assessment of the biometric system permanence was performed using acquired images after a year of the first analysis and the results shown that the system is robust, even that the pictures contain minor changes proportional to index variations of body mass of users.
|
306 |
Learning probabilistic relational models: a novel approach. / Aprendendo modelos probabilísticos relacionais: uma nova abordagem.Mormille, Luiz Henrique Barbosa 17 August 2018 (has links)
While most statistical learning methods are designed to work with data stored in a single table, many large datasets are stored in relational database systems. Probabilistic Relational Models (PRM) extend Bayesian networks by introducing relations and individuals, thus making it possible to represent information in a relational database. However, learning a PRM from relational data is a more complex task than learning a Bayesian Network from \"flat\" data. The main difficulties that arise while learning a PRM are establishing what are the legal dependency structures, searching for possible structures, and scoring them. This thesis focuses on the development of a novel approach to learn the structure of a PRM, describes a package in the R language to support the learning framework, and applies it to a real, large scale scenario of a city named Atibaia, in the state of São Paulo, Brazil. The research is based on a database combining three different tables, each representing one class in the domain of study. The first table contains 27 attributes from 110,816 citizens of Atibaia. The second table contains 9 attributes from 20,162 companies located in the city. And finally, the third table has 8 attributes from 327 census sectors (small territorial units that comprise the city of Atibaia). The proposed framework is applied to learn a PRM structure and parameters from the database. The model is used to verify if the Social Class of a person can be explained by the location where they live, their neighbors, and the companies nearby. Preliminary experiments have been conducted and a paper published in the 2017 Symposium on Knowledge Discovery, Mining and Learning (KDMiLe). The algorithm performance was further evaluated by extensive experimentation, and a broader study using Serasa Experian data was conducted. Finally, the package in the R language that supports our method was refined along with proper documentation and a tutorial. / Embora a maioria dos métodos de aprendizado estatístico tenha sido desenvolvida para se trabalhar com dados armazenados em uma única tabela, muitas bases de dados estão armazenadas em bancos de dados relacionais. Modelos Probabilísticos Relacionai (PRM) estendem Redes Bayesianas introduzindo relações e indivíduos, tornando possível a representação de informação em uma base de dados relacional. Entretanto, aprender um PRM através de dados relacionais é uma tarefa mais complexa que aprender uma Rede Bayesiana de uma única tabela. As maiores dificuldades que se impõe enquanto se aprende um PRM são estabelecer quais são as estruturas de dependência legais, procurar por possíveis estruturas, e avalia-las. Esta tese foca em desenvolver um novo método de aprendizado de estruturas de PRM, descrever um pacote na linguagem R que suporte este método e aplica-lo a um cenário real e de grande escala, a cidade de Atibaia, no estado de São Paulo, Brasil. Esta pesquisa está baseada em uma base de dados combinando três tabelas distintas, cada uma representando uma classe no domínio de estudo. A primeira tabela contém 27 atributos de 110.816 habitantes de Atibaia, e a segunda tabela contém 9 atributos de 20.162 empresas da cidade. Por fim, a terceira tabela possui 8 atributos para 327 setores censitários (pequenas unidades territoriais que formam a cidade de Atibaia). A proposta é aplicada para aprender-se a estrutura de um PRM e seus parâmetros através desta base de dados. O modelo foi utilizado para verificar se a classe social de uma pessoa pode ser explicada pelo local onde ela vive, seus vizinhos e as companhias próximas. Experimentos preliminares foram conduzidos e um artigo foi publicado no Symposium on Knowledge Discovery, Mining and Learning (KDMiLe). O desempenho do algoritmo foi reavaliada através de extensiva experimentação, e um estudo mais amplo foi conduzido com os dados da Serasa Experian. Por fim, o pacote em R que suporta o método proposto foi refinado, e documentação e tutorial apropriado foram descritos.
|
307 |
Identificação de florestas destinadas à produção de bioenergia no Estado do Tocantins utilizando imagens de satélite e mineração de dadosNonato, Carlos Tavares 26 August 2014 (has links)
As florestas plantadas tem atraído grande interesse pela possibilidade de utilização em
aplicações bioenergéticas frente à tendência mundial de priorizar fontes de energia que
proporcionem maior sustentabilidade ambiental, mais qualidade e segurança. No Brasil, os
deslocamentos na geografia da cadeia produtiva agroflorestal atual em direção às regiões
de fronteira agrícola (Centro-Oeste e Norte) vem criando desafios de adequação dos
conhecimentos técnico-científicos já consolidados em outras regiões. Nesse contexto, o
objetivo desta dissertação é avaliar a acurácia da classificação e identificação de áreas
cultivadas com florestas plantadas para fins energéticos, em imagens orbitais do sensor
Landsat 5 TM. Por meio de técnicas estatísticas de mineração de dados, o presente trabalho
também avaliou a utilização de um amplo conjunto de atributos para identificar melhorias
nos resultados da classificação. A pesquisa se concentrou em amostras de áreas plantadas
no estado do Tocantins, região norte do Brasil. As técnicas de mineração de dados
utilizadas se mostraram eficientes na identificação precisa de florestas plantadas em
imagens do satélite Landsat 5, tanto pelo desempenho da classificação, quanto pela
redução da quantidade de informação necessária para a resolução deste tipo de problema.
Assim, as técnicas empregadas neste estudo possibilitam o desenvolvimento de modelos de
classificação robustos no auxílio ao planejamento e à tomada de decisão sobre a plantação
de florestas no território brasileiro. / Planted forests have attracted a lot of attention because of possibility of use in bioenergy
applications and due to the global trend of prioritizing energy sources that provide greater
environmental sustainability, more quality and security. In Brazil, the shifts in the
geography of current agroforestry production chain towards the agricultural frontier areas
(Midwest and North) are creating challenges to the adequacy of technical and scientific
knowledge already established in other regions. So, the aim of this work is to assess the
accuracy of the identification and classification of areas cultivated with plantation forests
for energy, inside TM Landsat 5 images. Using statistical techniques for data mining, this
study also evaluated the use of a broad set of attributes to identify improvements in the
classification results. The research focused on samples of planted areas in the state of
Tocantins, Northern Brazil. The data mining techniques used were effective in identifying
of planted forests in Landsat 5 satellite images, both the classification performance, such as
by reducing the amount of information needed to solve this kind of problem. Thus, the
techniques employed in this study enable the development of robust classification models
to aid in the planning and decision making on forest plantations in Brazil.
|
308 |
OBRAS PÚBLICAS: UM ESTUDO DE CASO EM DUAS INSTITUIÇÕES FEDERAIS DE ENSINO DE GOIÁS E TOCANTINS.Silva, Raimunda Vieira Santos da 19 March 2014 (has links)
Made available in DSpace on 2016-08-10T10:40:22Z (GMT). No. of bitstreams: 1
RAIMUNDA VIEIRA SANTOS DA SILVA.pdf: 968808 bytes, checksum: 4085e6c6bcd3e4d7a87e0bc635163dde (MD5)
Previous issue date: 2014-03-19 / The public work execution has great importance for the country´s development, either
in economic or socio-political terms. However, according to the information provided
by the Brazilian Court of Audit (TCU), there are innumerous irregularities in this king
of execution in the country and among them, contract amendments. Contract
amendments, whether of value or time, cause losses both for society and for public
administration. In this work, we seek to analyze the events that contribute to changes in
the construction planning time of the Federal Institutes of Education of Goiás and
Tocantins, using statistical models and data mining techniques. The use of quantitative
methods in this analysis shows that there are relationships or associations between the
characteristics of the works and their amendments. / A execução de obras públicas possui grande importância para o desenvolvimento de um
país, seja em termos econômicos ou político-sociais. Entretanto, de acordo constatações
realizadas pelo Tribunal de Contas da União (TCU), são inúmeras as irregularidades
verificadas na execução das obras públicas no país e dentre elas, os aditivos contratuais.
Os aditivos contratuais, sejam de valor ou de tempo, ocasionam prejuízos tanto para a
sociedade quanto para a administração pública. Neste trabalho, procura-se analisar as
situações que contribuem para as alterações no cronograma das obras públicas dos
Institutos Federais de Ensino de Goiás e Tocantins, utilizando-se de modelos estatísticos
e de técnicas de mineração de dados. A utilização destes métodos quantitativos na
análise da execução das obras públicas mostra que existem relações ou associações
entre as características das obras e seus aditivos.
|
309 |
A IMPORTÂNCIA DOS FATORES DE RISCO NA OBSTRUÇÃO DAS ARTÉRIAS CORONÁRIAS UTILIZANDO TÉCNICAS DE MINERAÇÃO DE DADOSCavalcante, Patrícia Freire 14 April 2009 (has links)
Made available in DSpace on 2016-08-10T10:55:38Z (GMT). No. of bitstreams: 1
PATRICIA FREIRE CAVALCANTE.pdf: 539306 bytes, checksum: d3a2ff8227bc8b5e60818fce55a6be00 (MD5)
Previous issue date: 2009-04-14 / The cardiovascular diseases have a great relevance concerning the process of
world morbimortality and the coronary artery disease (CAD) is one of the main
important representative disease of this group, with significant epidemiological
data on the nosological process and deaths. The risk factors of this disease have
been studied for years and the Framingham Study is one of the responsible for
pointing out the major cardiovascular risk factors. Based upon these
cardiovascular risk factors of Framingham, this study had the objective of
identifying and analyzing the major cardiovascular risk factors and their
association presented in patients with coronary artery obstruction in the period of
August 2008 November 2008 at the Monte Sinai Hospital, utilizing statistical
techniques and data mining. The sample of this survey resulted from interviewing
85 patients with coronary artery disease using a closed form to collect sociodemographic
variables, lifestyle, clinical history, anthropometric data and
procedures. In order to achieve the goals a tool known as Weka® was used to
analyze and provide the data collect through the data mining association method.
It has been found that the prevalence regarding cardiovascular risk factors of
greater scope were: high-fat diet (83.5%), sedentarism (77.7%), tabagism
(74.1%), stress presence (77.7%), hypercholesterolemy (63.6%), hypertension
(85.9%), family hypercholesterolemy (70.6%), family hypertension (96.5%) and
family CAD (69,4%). In comparison with the work from the CARMENT initiatives
and the Center-West Project, it was possible to observe that the risk factors such
as hypertension, tabagism and hypercholesterolemy appear with much higher
values making it possible to identify a correlation between these risk factors and
the disease. It has been also found that some factors resemble close relationship
among each other in terms of association. As a result of this association it was
found that the hypercholesterolemy, hypertension and high-fat diet are variables
that appeared interconnected among themselves several times and risk factors
that had connection with other risk factors, confirming its relevance to the CAD. It
is perceived that is very important investigate further the cardiovascular risk
factors in several communities in order to determine the different profiles and the
real risk factors that contribute the of CAD. / As doenças cardiovasculares possuem uma grande relevância no processo de
morbimortalidade mundial e a doença da artéria coronariana (DAC) é uma das
principais representantes desse grupo, com significativos dados epidemiológicos
no processo nosológico e de óbitos. Os fatores de risco para essa doença vêm
sendo estudados há anos e o Estudo de Framingham é um dos responsáveis por
apontar os principais fatores de risco cardiovasculares. Baseado nesses fatores
de risco cardiovasculares de Framingham, esse estudo teve como objetivo
identificar e avaliar a prevalência dos fatores de risco cardiovasculares e a
associação entre eles, presentes em pacientes com obstrução das artérias
coronárias no período de Agosto de 2008 a novembro de 2008 no Hospital Monte
Sinai, utilizando técnicas estatísticas e de mineração de dados. A amostra dessa
pesquisa resultou da entrevista de 85 pacientes portadores de DAC, que por
meio de um formulário fechado permitiu-se a coleta de variáveis
sociodemográficas, estilo de vida, história clínica, dados antropométricos e
procedimentos. Para atingir os objetivos dessa pesquisa foi utilizada uma
ferramenta conhecida como Weka®, com a qual foram realizados procedimentos
para a execução do método de associação de mineração de dados. A
prevalência dos fatores de risco cardiovasculares de maior abrangência foram:
dieta rica de gordura (83.5%), sedentarismo (77.7%), tabagismo (74.1%),
presença de estresse (77.7%), hipercolesterolemia (63.6%), hipertensão (85.9%),
hipercolesterolemia familiar (70.6%), hipertensão familiar (96.5%) e DAC familiar
(69,4%). Na comparação realizada entre os resultados obtidos neste trabalho e
os estudos da iniciativa CARMENT e o Projeto Centro-Oeste, foi possível
observar que os valores de alguns fatores de risco tais como hipertensão,
tabagismo e hipercolesterolemia tiveram maior ocorrência nos pacientes com
DAC do que na população em geral, possibilitando assim identificar uma
correlação entre estes fatores de risco e a doença. Na associação foram
relacionados fortemente atributos entre si e selecionados as melhores
associações. Como resultado da associação obteve-se que a
hipercolesterolemia, a hipertensão e a dieta rica de gordura são variáveis que
apareceram interligadas entre si inúmeras vezes e ainda são fatores de risco que
tiveram ligação com outros fatores de risco, confirmando assim sua relevância
para análise da DAC. Percebe-se que é fundamental a realização de estudos
sobre fatores de risco cardiovasculares em diversas comunidades, para assim se
determinar os diferentes perfis e os reais fatores de risco que favorecem a DAC.
|
310 |
MELHORIA DOS CANAIS DE VENDAS DE SERVIÇOS DE TELECOMUNICAÇÕES USANDO TEORIA DAS RESTRIÇÕES E MINERAÇÃO DE DADOSRibeiro, Willard Silva 12 September 2016 (has links)
Submitted by admin tede (tede@pucgoias.edu.br) on 2016-11-10T11:48:54Z
No. of bitstreams: 1
Willard Silva Ribeiro.pdf: 2550243 bytes, checksum: 6a14ee1c5b586e0f46c616a14e6fe721 (MD5) / Made available in DSpace on 2016-11-10T11:48:54Z (GMT). No. of bitstreams: 1
Willard Silva Ribeiro.pdf: 2550243 bytes, checksum: 6a14ee1c5b586e0f46c616a14e6fe721 (MD5)
Previous issue date: 2016-09-12 / This work deals with the optimization of processes that result in improved financial and sales
of telecommunications services in the State of Goiás through the analysis of undesirable
effects (UDEs) systematized by the Theory of Constraints (TOC) combined with the use of
data mining in fixed-line and mobile channels. In mobile phone retail channels, mass, own
and franchise stores are analyzed. In the wireline phones segment we analyze authorized
agent and door to door. The Analysis of Unwanted effects (UE) is systematized in cause and
effect and uses the theory of constraints through the Current Reality Tree tool (CRT) to
understand the root problem, which would be the unwanted effect feeding and causing other
unwanted effects in the set of processes of each sales channel. The evaporation cloud diagram
(ECD), which was used to break the assumptions that kept the active restriction and enabled
the creation of the injection that would transform UDES in desired effects(DE). The negative
branch reservation (NBR) to reduce the risk of application Injection avoiding the creation of
new UDES. And the future reality tree (FRT) that shows the improved model of the future
system. For the classification of business segments is used data mining, the J48 algorithm
through the WEKA software. The results show that the data mining and the theory of the
constraints provides a better understanding of the processes, a better understanding of the
consumers behavior in each sales segment and improving sales. / Esta pesquisa diz respeito a melhoria de processos que resultam em aumento no volume de
vendas de serviços de telecomunicações em duas concessionárias de telecomunicações no
Estado de Goiás por meio da análise de efeitos indesejados (Undesirable Effects, UDEs)
sistematizados através de Teoria das Restrições (Theory of Constraints, TOC) aliado ao uso
de mineração de dados (Data Mining, DM) nos canais de vendas (Sales Channel, SC) de
telefonia fixa e telefonia móvel entre os anos de 2013 a 2015. Na telefonia móvel são
analisados os canais de varejo, canais de vendas em massa, lojas próprias e franquias. Na
telefonia fixa são analisados o canal agente autorizado e canal porta a porta. A análise dos
UDEs é sistematizada em causa e efeito e utiliza a TOC através da ferramenta Árvore de
Realidade Atual (Current Reality Tree, CRT) para compreensão do problema raiz que seria o
UDEs que alimenta e causa outros UDEs no conjunto de processos de cada SC. A causa raiz é
submetida ao Diagrama de Evaporação de Nuvem (Evaporiting Cloud Diagram, ECD), que
foi usado para quebra dos pressupostos que mantinham a restrição ativa e possibilitou a
criação da injeção que transformaria UDEs em Efeitos Desejados (Desirable Effects, DEs). A
injeção, que é uma sentença que representa uma ação desruptiva do que causava a restrição,
foi testada por meio da ferramenta Reserva de Ramo Negativo (Negative Branch Reservation,
NBR) para reduzir os riscos da aplicação da Injeção evitando a criação de novos UDES.
UDEs foram transformados em DES por meio da injeção validada e sistematizados em causa
e efeito com uso da Árvore de Realidade Futura (Future Reality Tree, FRT) que apresenta o
modelo melhorado futuro do sistema. Para a classificação dos segmentos comerciais é usado
DM com o algoritmo de classificação J48 por meio do software Waikato Environment for
Knowledge Analysis (WEKA). Os resultados mostram que a mineração de dados e a teoria das
restrições oferecem uma melhor compreensão dos processos de vendas, melhor compreensão
do comportamento de consumo em cada segmento comercial e por consequência a melhoria
das vendas.
|
Page generated in 0.0863 seconds