• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 199
  • 7
  • 2
  • Tagged with
  • 215
  • 143
  • 39
  • 37
  • 34
  • 24
  • 22
  • 22
  • 22
  • 20
  • 20
  • 20
  • 18
  • 17
  • 17
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Maturação de sementes de sabiá (Mimosa caesalpiniifolia Benth.) /

Alves, Edna Ursulino. January 2003 (has links)
Resumo: objetivo dessa pesquisa foi o de estudar o processo de maturação de sementes de sabiá (Mimosa caesalpiniifolia Benth.). Foram realizadas dezesseis colheitas semanais de frutos e sementes, no engenho Bujarí, no município de Areia-PB, no período de 9 de agosto a 22 de novembro de 2001. As colheitas se iniciaram aos 105 dias após a antese (d.a.a.) e se estenderam até os 210 d.a.a., sendo avaliadas a coloração, as dimensões, o teor de água e a massa fresca e seca de frutos e sementes, bem como as porcentagens de germinação, de sementes dormentes e o vigor (primeira contagem de germinação, comprimento e massa fresca e seca das plântulas). De acordo com os dados obtidos constatou-se que a maturidade fisiológica das sementes ocorreu aos 154 - 168 d.a.a., podendo a colheita ser realizada até 189 d.a.a, uma vez que a partir deste período ocorreram elevadas perdas de frutos e sementes devidas a dispersão natural. Para se reduzir a influência da dormência das sementes, a colheita deverá ser efetuada aos 154 d.a.a., com germinação de aproximadamente 80% e acúmulo máximo de massa seca nas sementes, isso porque no decorrer do processo de maturação, a dormência das sementes aumentou gradativamente, alcançando índices superiores a 95% aos 210 d.a.a. / Abstract: The objective of this research was to study the maturation process of the Mimosa caesalpiniifolia Benth. seeds. The seeds and fruits were collected from plants located at the Bujari sugar mill, Areia County ,State of Paraíba, Brazil. Were made sixteen weekly fruits and seeds harvests of starting from 105 days after anthesis (d.a.a.) in the period of August 9 up to November 22, 2001. Were evaluated the fruits and, seeds color; fruits and, seeds dimensions , the moisture content; the fruits and, seeds fresh and dry weight mass, the germination, the dormant seeds percentage; and the vigor expressed by the first germination count, length and the seedling fresh and dry weight mass. According to the obtained results, it was observed that the physiological maturity of Mimosa. caesalpiniifolia occurred from 154 d.a.a. extending up to 168 d.a.a. The harvesting cannot be delayed beyond 189 d.a.a. due to a great loss of fruits and seeds caused by natural dispersion. To avoid the influence of seed dormancy, the harvest must be done at 154 until 168 d.a.a. with germination of 80% and maximum accumulation of dry weight mass. / Orientador: Rubens Sader / Coorientadora: Riselane de Lucena Alcântara Bruno / Banca: Teresinha de Jesus Deléo Rodrigues / Banca: Maria Laene Moreira de Carvalho / Banca: José Marcos Barbosa / Banca: Rinaldo Cesar de Paula / Doutor
22

Substratos e níveis de irrigação na formação de porta-enxerto utilizando limão-cravo

Caetano, Mayra Cristina Teixeira [UNESP] 06 October 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:23:11Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-10-06Bitstream added on 2014-06-13T19:50:00Z : No. of bitstreams: 1 caetano_mct_me_jabo.pdf: 257399 bytes, checksum: 9345f2ab37f9803a090aa70b6aad44ad (MD5) / O desenvolvimento dos centros urbanos tem conduzido a um aumento desordenado na geração de resíduos e conseqüente poluição ambiental. Tendo em vista o potencial agronômico dos resíduos gerados pelas cidades, o presente trabalho teve por objetivo verificar a influência do composto de lixo (CL), composto de poda de árvore (CP) e substrato comercial (SC), associados a diferentes lâminas de irrigação no desenvolvimento de porta-enxerto (limão-cravo) de citros. O delineamento experimental adotado foi em blocos casualizados em um esquema fatorial 6x3, sendo seis diferentes combinações de substratos: S1 – 100% SC; S2 – 80% SC + 20% CP; S3 – 60% SC + 30% CP + 10% CL; S4 – 40% SC + 40% CP + 20% CL; S5 – 20% SC + 50% CP + 30% CL e S6 – 60% CP + 40% CL associados a três lâminas de irrigação: 50% (I1), 100% (I2) e 150% (I3) da evapotranspiração diária medida pelo atmômetro. Os parâmetros avaliados das plantas foram: altura, número de folhas, diâmetro do caule, matéria fresca aérea e matéria seca aérea. Os resultados permitiram concluir que a irrigação abaixo da evaporação medida pelo atmômetro causaram efeito negativo no desenvolvimento das plantas e que a reposição de água com 150% (I3) foi a que favoreceu o desenvolvimento. Os substratos S2, o qual se utilizou 80% de SC associado à 20% CP foi os que proporcionou melhor desenvolvimento dos porta-enxertos. Os substratos com porcentagem de composto de lixo superior a 30% mostraram-se inadequados para o desenvolvimento dos porta-enxertos / The development of urban centers has led to an inordinate increase in the generation of waste and consequent environmental pollution. Considering the agronomic potential of the waste generated by cities, the present work objective was to check the influence of garbage compound (GC), pruning of tree (PT) and commercial substrate (CS), associated to different irrigation blades in the rootstocks (Rangpur Lime) citros development. The experimental delineation adopted was in random blocks in a fatorial scheme 6x3, being six different substrates combinations: S1 – 100% CS; S2 – 80% CS + 20% PT; S3 – 60% CS + 30% PT + 10% GC; S4 – 40% CS + 40% PT + 20% GC; S5 – 20% CS + 50% PT + 30% GC e S6 – 60% PT + 40% GC associated to different irrigation blades: 50% (I1), 100% (I2) e 150% (I3) of the daily evapotranspiration measured by the atmometer. The evaluated plants parameters were: height, leaves number, stem diameter, fresh matter and dry matter of the air part. The results allowed to conclude that the irrigation below the evaporation measured by the atmometer caused negative effect in the plants development and the water replacement with 150 % (I3) was the one that favored the development. The substrates S2, which is used 80% of SC associated with 20% CP was that the enhanced growth of the rootstocks. The substrates with garbage compound percentage superior to 30 % appeared unsuitable for the rootstocks development
23

Fenologia e atributos reprodutivos de espécies ocorrentes em restinga no Maranhão

Karina Maciel Delgado Ribeiro, Éville 31 January 2011 (has links)
Made available in DSpace on 2014-06-12T15:04:39Z (GMT). No. of bitstreams: 2 arquivo5592_1.pdf: 1336072 bytes, checksum: aa2ee859ba5f223df40489595225179a (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O objetivo deste trabalho foi avaliar a fenologia das espécies ocorrentes em um ambiente de Restinga no Nordeste do Maranhão, Brasil, verificando como os padrões fenológicos variam entre hábitos e como as fenofases se correlacionam com os fatores climáticos. Foram estudados 1167 indivíduos, de 88 espécies vegetais, distribuídos em quatro hábitos (árvores, arbustos, ervas e trepadeiras), durante dois anos (2008-2010) em uma Reserva Legal próxima ao Parque Nacional dos Lençóis Maranhenses (2°43 22,5 S; 42°49 50 W). Todas as fenofases avaliadas, com exceção da frutificação, apresentaram sazonalidade. A floração de Ribeiro, E. K. M. D. Fenologia e Atributos Reprodutivos de espécies ocorrentes em restinga no Maranhão árvores e arbustos ocorreu na estação seca, enquanto a de ervas ocorreu na estação chuvosa. A frutificação das espécies arbóreas ocorreu, em sua maioria, na estação seca, bem como os maiores picos de frutificação de ervas e trepadeiras. Durante a estação chuvosa houve maior atividade de frutificação de arbustos. Queda e brotamento de folhas ocorreram na estação seca para todos os hábitos, exceto o herbáceo, no qual a queda de folhas ocorreu na estação chuvosa. As datas médias dos picos de atividade das fenofases floração, frutificação e brotamento mostraram diferenças para cada hábito, sugerindo que a presença destes diferentes hábitos proporciona melhor distribuição temporal de recursos vegetais (folhas, flores e frutos) na comunidade
24

Perseus:uma nova técnica para tratar árvores de sufixo persistentes / Perseus: a novel technique to handle persistent suffix trees

Caio Cesar Mori Carelo 31 August 2009 (has links)
O avanço tecnológico dos laboratórios de biologia molecular tem proporcionado um grande aumento no volume de seqüências de nucleotídeos armazenadas em bancos de dados biológicos, introduzindo o desafio de pesquisar eficientemente estes dados. Neste contexto, a árvore de sufixo é um método de acesso utilizado por muitas aplicações que envolvem pesquisa em dados biológicos. Entretanto, o custo de construção das árvores de sufixo é alto devido ao tamanho da estrutura de indexação gerado e à necessidade da árvore de sufixo caber em memória principal para ser construída com complexidade linear em relação ao tempo. Esta dissertação propõe o Perseus, uma nova técnica para tratar árvores de sufixo persistentes. A técnica Perseus apresenta os seguintes diferenciais. Ela introduz uma abordagem que realiza a construção de árvores de sufixo persistentes cujos tamanhos podem exceder a capacidade da memória principal. Além disso, ela provê um algoritmo que constrói árvores de sufixo por meio do particionamento destas árvores somente quando necessário. Esta construção também permite que o usuário escolha quais subseqüências de uma seqüência devem ser indexadas, de acordo com os requisitos particulares de suas aplicações. Por fim, a técnica proposta também introduz um algoritmo de casamento exato que permite a busca por uma seqüência de consulta em árvores de sufixo que podem estar particionadas. A validação do Perseus foi realizada por meio de testes de desempenho considerando genomas de vários organismos, os quais possuem diferentes ordens de magnitude de tamanho. Os resultados obtidos foram comparados com a técnica Trellis+, a qual representa o estado da arte nesta linha de pesquisa. Os testes indicaram que o Perseus construiu árvores de sufixo mais rapidamente do que o Trellis+, reduzindo o tempo total gasto na construção em até 24%. Perseus também criou árvores de sufixo mais compactas, atingindo uma redução média de 27% no espaço de memória secundária utilizado. Já com relação ao tempo total gasto no processamento de consultas, Perseus sempre produziu os melhores resultados, respondendo consultas em média 49% mais rápido do que o seu principal concorrente. Com relação à indexação de subseqüências escolhidas pelo usuário, comparando os resultados obtidos com o Trellis+, os testes mostraram que Perseus proveu uma redução no tempo de construção de árvores de sufixo de 97% na média e uma redução no tempo gasto no processamento de consultas de genes de 93% na média / Due to the technological advances in molecular biology laboratories, biological databases are extremely voluminous and tend to become more voluminous as data on new genome organisms are available. This introduces the challenge of searching nucleotide sequences efficiently. The suffix tree is an access method used for several applications that search for these data. However, the cost of building suffix trees is high, since they are extremely large data structures and they should fit in the main memory to be constructed in linear time. In this masters thesis, we propose the Perseus, a novel technique that handles persistent suffix trees. The Perseus introduces the following distinctive good properties. It is based on an approach that constructs persistent suffix trees whose sizes may exceed the main memory capacity. Furthermore, it provides an algorithm that allows for users to indicate which substrings of the input string should be indexed, according to the requirements of their applications. Moreover, it proposes an extended exact matching algorithm that searches for a query string into suffix trees that may be partitioned. The Perseus was validated through performance tests using genomes of several organisms of different sizes. The results were compared with the Trellis+ technique, which represents the state-of-the-art in this field. The tests showed that the Perseus reduced the time spent on constructing suffix trees by 24%. The Perseus also constructed compacter suffix trees, providing an average reduction in the secondary memory storage of 27%. Furthermore, the Perseus reduced the time spent on query processing of nucleotide sequences by up to 49%. As for the functionality of indexing substrings according to the users requirements, the Perseus greatly improved the query performance in comparison to the Trellis+. The results showed that the Perseus reduced the time spent on constructing suffix trees by 97% on average and the time spent on query processing of genes by 93% on average
25

Classificação da exatidão de coordenadas obtidas com a fase da portadora L1 do GPS / Accuracy's classification of GPS L1 carrier phase obtained coordinates

Mauro Menzori 20 December 2005 (has links)
A fixação das duplas diferenças de ambigüidades no processamento dos dados da fase da portadora do Sistema de Posicionamento Global (GPS), é um dos pontos cruciais no posicionamento relativo estático. Esta fixação também é utilizada como um indicador de qualidade e fornece maior segurança quanto ao resultado do posicionamento. No entanto, ela é uma informação puramente estatística baseada na precisão da medida e dissociada da exatidão das coordenadas geradas na solução. A informação sobre a exatidão das coordenadas de pontos medidos através de um vetor simples, é sempre inacessível, independente de a solução ser fixa ou “float”. Além disso, existe um risco maior em assumir um resultado de solução “float”, mesmo que ele tenha uma boa, porém, desconhecida exatidão. Por estes motivos a solução “float” não é aceita por muitos contratantes de serviços GPS, feitos com a fase da portadora, que exigem uma nova coleta de dados, com o conseqüente dispêndio de tempo e dinheiro. Essa tese foi desenvolvida no sentido de encontrar um procedimento que melhore esta situação. Para tanto, se investigou o comportamento da exatidão em medidas obtidas com a fase da portadora L1 do GPS, monitorando os fatores variáveis presentes neste tipo de medição, o que tornou possível a classificação da exatidão de resultados. Inicialmente, a partir de um conjunto de dados GPS, coletados ao longo dos anos de 2003, 2004 e 2005 em duas bases de monitoramento contínuo da USP, se fez uma análise sistemática do comportamento das variáveis contidas nos dados. A seguir se estruturou um banco de dados, que foi usado como referência na indução de uma árvore de decisão adotada como paradigma. Por último, a partir desta árvore se pôde inferir a exatidão de soluções de posicionamento obtidas com o uso da portadora L1. A validação do procedimento foi feita através da classificação da exatidão de resultados de várias linhas base, coletadas em diferentes condições e locais do estado de São Paulo e do Brasil / The most crucial step on the relative static positioning, when using the Global Positioning System (GPS) carrier phase data, is the fixing ambiguities integer values. The integer ambiguity solution is also used as a quality indicator, ensuring quality to the positioning results. In despite of its capability, the ambiguity fix solution is purely statistical information, based on the precision of measurements and completely apart from the coordinate's solution accuracy. In a single baseline processing, the positioning coordinates accuracy is always inaccessible, no matter if the final solution is float or fixed. In fact, there is some inner risk when using the float solution, although they have a good, nevertheless, unknown accuracy. Probably that is why several GPS job contractors reject the float solutions and require a new data observation, with the consequent time and money loss. This research was developed to improve that situation, investigation the inner accuracy in several GPS L1 carrier phase measurements. Checking the variable factors existing on this kind of measurement it was possible to classify the results accuracy behavior. The investigation was developed in tree steps: started with the systematic analysis of a group of L1 observation data, collected during the years: 2003, 2004 and 2005, followed by the construction of a structured data bank which generated a decision tree, performing the paradigm used to classify the accuracy of any measurement made with GPS L1 carrier phase; and ended with the research validation, through the accuracy classification that was made on several baselines, collected on different conditions and places around the state of São Paulo and Brazil
26

Estudo do envelhecimento em sistemas de borrifo da contenção de reatores nucleares através da técnica de árvore de falhas

BORGES, Diogo da Silva 04 1900 (has links)
Submitted by Almir Azevedo (barbio1313@gmail.com) on 2014-07-21T13:54:14Z No. of bitstreams: 0 / Made available in DSpace on 2014-07-21T13:54:14Z (GMT). No. of bitstreams: 0 Previous issue date: 2014 / Esta dissertação apresenta uma contribuição para o estudo do processo de envelhecimento de plantas com Reatores a Água Pressurizada (PWR). A análise é feita através da aplicação do Método de Árvore de Falhas, Método de Monte Carlo e Medidas de Importância. A abordagem do estudo de envelhecimento em usinas nucleares, além de dar atenção aos fatores econômicos envolvidos diretamente com a extensão de sua vida operacional, também fornece dados importantes sobre questões de segurança. O mais recente caso envolvendo o processo de extensão da vida de um PWR pode ser vista na Usina de Angra 1 através do investimento de vinte e sete milhões de dólares ($27 millions) para a instalação de uma nova tampa do reator. A ação corretiva geral uma estimativa de extensão de vida útil de Angra 1 em vinte anos, oferecendo grande economia em comparação com o custo de construção de uma nova planta e o descomissionamento da anterior, caso ela tivesse atingido o tempo limite de funcionamento de quarenta anos. A extensão de vida útil de uma planta de energia nuclear deve ser acompanhada por uma atenção especial aos componentes dos sistemas e seus processos de envelhecimento. Após a aplicação da metodologia (análise de envelhecimento do Sistema de Injeção de Borrifo da Contenção) proposta neste trabalho, é possível ver que o aumento na probabilidade de falha de componentes, devido ao processo de envelhecimento, gera o aumento da indisponibilidade geral do sistema que contém esses componentes básicos. os resultados finais obtidos foram como o esperado e pode contribuir para a política de manutenção, evitando processos de envelhecimento prematuros em sistemas de plantas nucleares / This dissertation presents a contribution to the study of aging process of commercial plants with Pressurized Water Reactors (PWRs). The analysis is made through application of the Fault Trees Method, Monte Carlo Method and Importance Measures. The approach of the study of aging in nuclear power plants, besides giving attention to the economic factors involved directly with the extent of their operational life, also provide significant data on security issues. The latest case involving process of life extension of a PWR could be seen in Angra 1 Nuclear Power Plant through investing of twenty and seven millions of dallars ($27 millions) for the installation of a new reactor lid. The corrective action has generated an estimated operating life extension of Angra 1 in twenty years, offering great economy compared with building cost of a new plant and anterior decommissioning, case it had reached the time operating limit of forty years. The extension of the operating life of a nuclear power plant must be accompanied by a special attention to the components of the systems and their aging process. After the application of the methodology (aging analysis of the Containment Spray Injection System) proposed this work, it can be seen that the increase in the rate of components failure, due the aging process, generates the increase in the general unavailability of the system that containing these basic components. The final results obtained were as expected and may contribute to the maintenance policy, preventing premature aging processes in nuclear plants systems
27

Sistema integrado para cubagem de árvores e inventário de povoamentos eqüiâneos / Integrated system for tree cubing and even- aged stand inventory

Alves, Joze Mauro 28 July 2005 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2017-01-16T16:23:33Z No. of bitstreams: 1 texto completo.pdf: 5081463 bytes, checksum: 129fd0b80aa7af86424aaea762332489 (MD5) / Made available in DSpace on 2017-01-16T16:23:33Z (GMT). No. of bitstreams: 1 texto completo.pdf: 5081463 bytes, checksum: 129fd0b80aa7af86424aaea762332489 (MD5) Previous issue date: 2005-07-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este estudo foi desenvolvido com o objetivo de construir um sistema para processamento de dados de cubagem de árvores e de inventário florestal de povoamentos eqüiâneos, utilizando linguagem orientada por objetos e banco de dados relacional. O sistema desenvolvido acessa o cadastro florestal armazenado em bancos de dados corporativos; produz equações volumétricas através de dados de cubagem e modelos de regressão linear; obtém equações hipsométricas através de dados de inventário florestal e modelos de regressão linear; gera relatórios analíticos, qualitativos e estatísticos, tendo como base dados de inventário florestal; e publica os resultados obtidos em bancos de dados corporativos. Para implementação das rotinas foi utilizada a ferramenta ® Borland® Delphi , acessando bases de dados armazenadas no formato ® ® Microsoft Access . O sistema foi instalado e avaliado por sete empresas do setor florestal brasileiro. Em todos os casos, o sistema foi capaz de conectar- se à base de dados corporativos, importar, consistir e processar dados de cubagem de árvores e de inventário florestal, gerar e publicar resultados, de forma auto-suficiente. / This study was carried out to develop a data processing system for tree cubing and even-aged stand inventory, using relational data bank and object – oriented language. The system developed accesses forest file stored in corporative databanks; generates volumetric equations through cubing data and linear regression models; obtains hypsometric equations through forest inventory data and linear regression models; generates analytical, qualitative, and statistical reports based on forest inventory data; and publishes the results obtained in corporative data banks. For routine implementation, the tool Borland Delphi® was used by accessing the data bases stored in the Microsoft Access format®. The system was installed and evaluated by seven Brazilian forest sector enterprises. In all the cases, the system could connect to the corporative database, import, consist of and process tree cubing and forest inventory data, as well as generate and publish results in a self-sufficient way. / Não foi localizado o cpf do autor.
28

Algoritmo para indução de árvores de classificação para dados desbalanceados / Algorithm for induction of classification trees for unbalanced data

Cláudio Frizzarini 21 November 2013 (has links)
As técnicas de mineração de dados, e mais especificamente de aprendizado de máquina, têm se popularizado enormemente nos últimos anos, passando a incorporar os Sistemas de Informação para Apoio à Decisão, Previsão de Eventos e Análise de Dados. Por exemplo, sistemas de apoio à decisão na área médica e ambientes de \\textit{Business Intelligence} fazem uso intensivo dessas técnicas. Algoritmos indutores de árvores de classificação, particularmente os algoritmos TDIDT (Top-Down Induction of Decision Trees), figuram entre as técnicas mais comuns de aprendizado supervisionado. Uma das vantagens desses algoritmos em relação a outros é que, uma vez construída e validada, a árvore tende a ser interpretada com relativa facilidade, sem a necessidade de conhecimento prévio sobre o algoritmo de construção. Todavia, são comuns problemas de classificação em que as frequências relativas das classes variam significativamente. Algoritmos baseados em minimização do erro global de classificação tendem a construir classificadores com baixas taxas de erro de classificação nas classes majoritárias e altas taxas de erro nas classes minoritárias. Esse fenômeno pode ser crítico quando as classes minoritárias representam eventos como a presença de uma doença grave (em um problema de diagnóstico médico) ou a inadimplência em um crédito concedido (em um problema de análise de crédito). Para tratar esse problema, diversos algoritmos TDIDT demandam a calibração de parâmetros {\\em ad-hoc} ou, na ausência de tais parâmetros, a adoção de métodos de balanceamento dos dados. As duas abordagens não apenas introduzem uma maior complexidade no uso das ferramentas de mineração de dados para usuários menos experientes, como também nem sempre estão disponíveis. Neste trabalho, propomos um novo algoritmo indutor de árvores de classificação para problemas com dados desbalanceados. Esse algoritmo, denominado atualmente DDBT (Dynamic Discriminant Bounds Tree), utiliza um critério de partição de nós que, ao invés de se basear em frequências absolutas de classes, compara as proporções das classes nos nós com as proporções do conjunto de treinamento original, buscando formar subconjuntos com maior discriminação de classes em relação ao conjunto de dados original. Para a rotulação de nós terminais, o algoritmo atribui a classe com maior prevalência relativa no nó em relação à prevalência no conjunto original. Essas características fornecem ao algoritmo a flexibilidade para o tratamento de conjuntos de dados com desbalanceamento de classes, resultando em um maior equilíbrio entre as taxas de erro em classificação de objetos entre as classes. / Data mining techniques and, particularly, machine learning methods, have become very popular in recent years. Many decision support information systems and business intelligence tools have incorporated and made intensive use of such techniques. Top-Down Induction of Decision Trees Algorithms (TDIDT) appear among the most popular tools for supervised learning. One of their advantages with respect to other methods is that a decision tree is frequently easy to be interpreted by the domain specialist, precluding the necessity of previous knowledge about the induction algorithms. On the other hand, several typical classification problems involve unbalanced data (heterogeneous class prevalence). In such cases, algorithms based on global error minimization tend to induce classifiers with low error rates over the high prevalence classes, but with high error rates on the low prevalence classes. This phenomenon may be critical when low prevalence classes represent rare or important events, like the presence of a severe disease or the default in a loan. In order to address this problem, several TDIDT algorithms require the calibration of {\\em ad-hoc} parameters, or even data balancing techniques. These approaches usually make data mining tools more complex for less expert users, if they are ever available. In this work, we propose a new TDIDT algorithm for problems involving unbalanced data. This algorithm, currently named DDBT (Dynamic Discriminant Bounds Tree), uses a node partition criterion which is not based on absolute class frequencies, but compares the prevalence of each class in the current node with those in the original training sample. For terminal nodes labeling, the algorithm assigns the class with maximum ration between the relative prevalence in the node and the original prevalence in the training sample. Such characteristics provide more flexibility for the treatment of unbalanced data-sets, yielding a higher equilibrium among the error rates in the classes.
29

Algoritmo para indução de árvores de classificação para dados desbalanceados / Algorithm for induction of classification trees for unbalanced data

Frizzarini, Cláudio 21 November 2013 (has links)
As técnicas de mineração de dados, e mais especificamente de aprendizado de máquina, têm se popularizado enormemente nos últimos anos, passando a incorporar os Sistemas de Informação para Apoio à Decisão, Previsão de Eventos e Análise de Dados. Por exemplo, sistemas de apoio à decisão na área médica e ambientes de \\textit{Business Intelligence} fazem uso intensivo dessas técnicas. Algoritmos indutores de árvores de classificação, particularmente os algoritmos TDIDT (Top-Down Induction of Decision Trees), figuram entre as técnicas mais comuns de aprendizado supervisionado. Uma das vantagens desses algoritmos em relação a outros é que, uma vez construída e validada, a árvore tende a ser interpretada com relativa facilidade, sem a necessidade de conhecimento prévio sobre o algoritmo de construção. Todavia, são comuns problemas de classificação em que as frequências relativas das classes variam significativamente. Algoritmos baseados em minimização do erro global de classificação tendem a construir classificadores com baixas taxas de erro de classificação nas classes majoritárias e altas taxas de erro nas classes minoritárias. Esse fenômeno pode ser crítico quando as classes minoritárias representam eventos como a presença de uma doença grave (em um problema de diagnóstico médico) ou a inadimplência em um crédito concedido (em um problema de análise de crédito). Para tratar esse problema, diversos algoritmos TDIDT demandam a calibração de parâmetros {\\em ad-hoc} ou, na ausência de tais parâmetros, a adoção de métodos de balanceamento dos dados. As duas abordagens não apenas introduzem uma maior complexidade no uso das ferramentas de mineração de dados para usuários menos experientes, como também nem sempre estão disponíveis. Neste trabalho, propomos um novo algoritmo indutor de árvores de classificação para problemas com dados desbalanceados. Esse algoritmo, denominado atualmente DDBT (Dynamic Discriminant Bounds Tree), utiliza um critério de partição de nós que, ao invés de se basear em frequências absolutas de classes, compara as proporções das classes nos nós com as proporções do conjunto de treinamento original, buscando formar subconjuntos com maior discriminação de classes em relação ao conjunto de dados original. Para a rotulação de nós terminais, o algoritmo atribui a classe com maior prevalência relativa no nó em relação à prevalência no conjunto original. Essas características fornecem ao algoritmo a flexibilidade para o tratamento de conjuntos de dados com desbalanceamento de classes, resultando em um maior equilíbrio entre as taxas de erro em classificação de objetos entre as classes. / Data mining techniques and, particularly, machine learning methods, have become very popular in recent years. Many decision support information systems and business intelligence tools have incorporated and made intensive use of such techniques. Top-Down Induction of Decision Trees Algorithms (TDIDT) appear among the most popular tools for supervised learning. One of their advantages with respect to other methods is that a decision tree is frequently easy to be interpreted by the domain specialist, precluding the necessity of previous knowledge about the induction algorithms. On the other hand, several typical classification problems involve unbalanced data (heterogeneous class prevalence). In such cases, algorithms based on global error minimization tend to induce classifiers with low error rates over the high prevalence classes, but with high error rates on the low prevalence classes. This phenomenon may be critical when low prevalence classes represent rare or important events, like the presence of a severe disease or the default in a loan. In order to address this problem, several TDIDT algorithms require the calibration of {\\em ad-hoc} parameters, or even data balancing techniques. These approaches usually make data mining tools more complex for less expert users, if they are ever available. In this work, we propose a new TDIDT algorithm for problems involving unbalanced data. This algorithm, currently named DDBT (Dynamic Discriminant Bounds Tree), uses a node partition criterion which is not based on absolute class frequencies, but compares the prevalence of each class in the current node with those in the original training sample. For terminal nodes labeling, the algorithm assigns the class with maximum ration between the relative prevalence in the node and the original prevalence in the training sample. Such characteristics provide more flexibility for the treatment of unbalanced data-sets, yielding a higher equilibrium among the error rates in the classes.
30

Potencial produtivo, manejo e experimentação em povoamentos de Tectona grandis L.f. no Estado de Mato Grosso / Productive potential, management and experimentation in stands of Tectona grandis L.f. in the State of Mato Grosso

Medeiros, Reginaldo Antonio 29 July 2016 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2017-01-05T17:40:22Z No. of bitstreams: 1 texto completo.pdf: 6835796 bytes, checksum: 0e0dc2ea0ac955e870d5d929d75f76d9 (MD5) / Made available in DSpace on 2017-01-05T17:40:22Z (GMT). No. of bitstreams: 1 texto completo.pdf: 6835796 bytes, checksum: 0e0dc2ea0ac955e870d5d929d75f76d9 (MD5) Previous issue date: 2016-07-29 / Fundação de Amparo à Pesquisa do Estado de Mato Grosso / Os objetivos deste trabalho foram conhecer o potencial produtivo de Tectona grandis L.f.(teca) no Estado de Mato Grosso, avaliar o crescimento e a produção, identificar a idade técnica de desbaste (ITD) em povoamentos de teca em diferentes espaçamentos e arranjos e, propor metodologias com diretrizes para planejamento, implantação, coleta e análise de dados de experimentos a campo envolvendo teste de procedências, espaçamentos, preparo do solo, fertilização, controle da matocompetição, desrama e desbaste. O potencial produtivo foi avaliado com base no zoneamento climático, edáfico, fisiográfico e edáfico+climático+fisiográfico, elaborado com o emprego de Processo Analítico Hierárquico (AHP), e na modelagem, utilizando Redes Neuronais Artificiais (RNA). O crescimento, a produção e a ITD foram avaliados utilizando dados provenientes de experimentos com teca envolvendo 12 espaçamentos e arranjos espaciais, no município de Água Boa-MT. Utilizou-se o modelo de Gompertz para modelagem do crescimento e produção, a função Weibull para modelagem da distribuição de diâmetros (MDD) e a ITD foi identificada pelo método dos ingressos percentuais (MIP), empregando o modelo expolinear. Fatores climáticos restringem menos o cultivo da teca no Estado de Mato Grosso, se comparado aos fisiográficos e, principalmente, edáficos, que limitam o potencial produtivo no Estado. O zoneamento com base na metodologia da AHP é adequado para definir classes de aptidão da teca. RNA foram eficientes para expressar o potencial produtivo apenas para locais onde há dados observados de produtividade. A altura total das árvores foi pouco influenciada pelos espaçamentos e arranjos, ao passo que o diâmetro médio, área basal e volumes individuais foram superiores nos maiores espaçamentos. A estagnação do crescimento ocorreu mais cedo nos espaçamentos mais adensados. A cultura da teca ainda carece de informações técnicas e científicas sobre a silvicultura da espécie envolvendo exigências climáticas, edáficas e fisiográficas, além de regimes de manejo apropriados. Estas informações são importantes, pois diminuem o empirismo na aplicação de práticas silviculturais e na escolha de locais para plantio, que têm sido apontados como responsáveis pelos baixos índices de produtividade da cultura no Estado de Mato Grosso. Ao realizar pesquisas envolvendo estes e outros objetivos, de modo a produzir resultados confiáveis e com nível científico desejado, é preciso que as informações das variáveis estudadas sejam provenientes de experimentos planejados, consistentes e analisadas por meio de métodos estatísticos adequados. / The objectives of this study were: to assess the productive potential of Tectona grandis L. f. (teak) in the State of Mato Grosso, Brazil; to evaluate the growth and yield, and to identify the technical age of thinning (TAT) in teak stands in different spacings and arrangements; and to propose methodologies with guidelines for the planning, installation, conduction and evaluation of teak field experiments involving provenance trials, spacings soil preparation, fertilization, weed control, pruning and thinning. The productive potential was evaluated based on climatic, edaphic, physiographic and combined climatic+edaphic+physiographic zonings, produced with Analytic Hierarchy Process (AHP), and based on modeling using Artificial Neural Networks (ANN). The growth of production and TAT was assessed using data from experiments involving 12 spacings and spatial arrangements in the municipality of Água Boa, Mato Grosso, Brazil. We used the Gompertz function to model growth and yield, the Weibull function was used for the diameter distribution modeling (DDM) and the TTA was determined through the Method of the Percent Entries (MPE), using the expolinear function. Climatic factors are less restrictive to the cultivation of teak compared to physiographic and, mainly, edaphic factors, which were shown to constrain the productive potential of this species in the state of Mato Grosso. The zoning based on AHP methodology was appropriate to set suitability classes for the cultivation of teak. RNA were efficient to express the productive potential only for areas where there is observed productivity data. The total tree height was little influenced by the spacing and arrangement, while the average diameter, basal area and individual volumes were greater in the widest spacings. The stagnation of growth occurred earlier in the narrowest spacings. The culture of teak still lacks technical and scientific information about silviculture, involving climatic, soil and physiographic requirements, and about appropriate management regimes. This information is important because it reduces the empiricism in applying silvicultural practices and the choice of sites for planting, which have been identified as responsible for the low productivity of this culture in the state of Mato Grosso. When conducting research involving these and other objectives, in order to produce reliable results and desired scientific level, it is necessary that the information of the variables come from consistent and planned experiments, analyzed using appropriate statistical methods.

Page generated in 0.0401 seconds