361 |
[en] TYPE-2 HIERARCHICAL NEURO-FUZZY BSP MODEL / [pt] MODELOS NEURO-FUZZY HIERÁRQUICOS BSP DO TIPO 2ROXANA JIMENEZ CONTRERAS 23 November 2007 (has links)
[pt] Este trabalho tem por objetivo criar um novo sistema de
inferência fuzzy
intervalar do tipo 2 para tratamento de incertezas com
aprendizado automático e
que proporcione um intervalo de confiança para as suas
saídas defuzzificadas
através do cálculo dos conjuntos tipo-reduzidos
correspondentes. Para viabilizar
este objetivo, este novo modelo combina os paradigmas de
modelagem dos
sistemas de inferência fuzzy do tipo 2 e redes neurais com
técnicas de
particionamento recursivo BSP. Este modelo possui
principalmente a capacidade
de modelar e manipular a maioria dos tipos de incertezas
existentes em situações
reais, minimizando os efeitos destas para produzir um
melhor desempenho. Além
disso, tem a capacidade autônoma de criar e expandir
automaticamente a sua
própria estrutura, de reduzir a limitação quanto ao número
de entradas e de extrair
regras de conhecimento a partir de um conjunto de dados.
Este novo modelo
fornece um intervalo de confiança, que se constitui em uma
informação
importante para aplicações reais. Neste contexto, este
modelo supera as limitações
dos sistemas de inferência fuzzy do tipo 2 - complexidade
computacional,
reduzido número de entradas permissíveis e forma limitada,
ou inexistente, de
criarem a sua própria estrutura e regras - e dos sistemas
de inferência fuzzy do
tipo 1 - adaptação incompleta a incertezas e não
fornecimento de um intervalo de
confiança para a saída. Os sistemas de inferência fuzzy do
tipo1 também
apresentam limitações quanto ao reduzido número de entradas
permissíveis, mas o
uso de particionamentos recursivos, já explorado com
excelentes resultados
[SOUZ99], reduz significativamente estas limitações. O
trabalho constitui-se
fundamentalmente em quatro partes: um estudo sobre os
diferentes sistemas de
inferência fuzzy do tipo 2 existentes, análise dos sistemas
neuro-fuzzy
hierárquicos que usam conjuntos fuzzy do tipo 1, modelagem
e implementação do
novo modelo neuro-fuzzy hierárquico BSP do tipo 2 e estudo
de casos. O novo
modelo, denominado modelo neuro-fuzzy hierárquico BSP do
tipo 2 (NFHB-T2), foi definido a partir do estudo das
características desejáveis e das limitações dos
sistemas de inferência fuzzy do tipo 2 e do tipo 1 e dos
sistemas neuro-fuzzy
hierárquicos que usam conjuntos fuzzy do tipo 1 existentes.
Desta forma, o
NFHB-T2 é modelado e implementado com os atributos de
interpretabilidade e
autonomia, a partir da concepção de sistemas de inferência
fuzzy do tipo 2, de
redes neurais e do particionamento recursivo BSP. O modelo
desenvolvido é
avaliado em diversas bases de dados benchmark e aplicações
reais de previsão e
aproximação de funções. São feitas comparações com outros
modelos. Os
resultados encontrados mostram que o modelo NFHB-T2
fornece, em previsão e
aproximação de funções, resultados próximos e em vários
casos superiores aos
melhores resultados proporcionados pelos modelos utilizados
para comparação.
Em termos de tempo computacional, o seu desempenho também é
muito bom.
Em previsão e aproximação de funções, os intervalos de
confiança obtidos para as
saídas defuzzificadas mostram-se sempre coerentes e
oferecem maior
credibilidade na maioria dos casos quando comparados a
intervalos de confiança
obtidos por métodos tradicionais usando as saídas previstas
pelos outros modelos
e pelo próprio NFHB-T2 . / [en] The objective of this thesis is to create a new type-2
fuzzy inference system
for the treatment of uncertainties with automatic learning
and that provides an
interval of confidence for its defuzzified output through
the calculation of
corresponding type-reduced sets. In order to attain this
objective, this new model
combines the paradigms of the modelling of the type-2 fuzzy
inference systems
and neural networks with techniques of recursive BSP
partitioning. This model
mainly has the capacity to model and to manipulate most of
the types of existing
uncertainties in real situations, diminishing the effects
of these to produce a better
performance. In addition, it has the independent capacity
to create and to expand
its own structure automatically, to reduce the limitation
referred to the number of
inputs and to extract rules of knowledge from a data set.
This new model provides
a confidence interval, that constitutes an important
information for real
applications. In this context, this model surpasses the
limitations of the type-2
fuzzy inference systems - complexity computational, small
number of inputs
allowed and limited form, or nonexistent, to create its own
structure and rules -
and of the type-1 fuzzy inference systems - incomplete
adaptation to uncertainties
and not to give an interval of confidence for the output.
The type-1 fuzzy
inference systems also present limitations with regard to
the small number of
inputs allowed, but the use of recursive partitioning,
already explored with
excellent results [SOUZ99], reduce significantly these
limitations. This work
constitutes fundamentally of four parts: a study on the
different existing type-2
fuzzy inference systems, analysis of the hierarchical neuro-
fuzzy systems that use
type-1 fuzzy sets, modelling and implementation of the new
type-2 hierarchical
neuro-fuzzy BSP model and study of cases. The new model,
denominated type-2
hierarchical neuro-fuzzy BSP model (T2-HNFB) was defined
from the study of
the desirable characteristics and the limitations of the
type-2 and type-1 fuzzy inference systems and the existing
hierarchical neuro-fuzzy systems that use type-
1 fuzzy sets. Of this form, the T2-HNFB model is modelling
and implemented
with the attributes of interpretability and autonomy, from
the conception of type-2
fuzzy inference systems, neural networks and recursive BSP
partitioning. The
developed model is evaluated in different benchmark
databases and real
applications of forecast and approximation of functions.
Comparisons with other
models are done. The results obtained show that T2-HNFB
model provides, in
forecast and approximation of functions, next results and
in several cases superior
to the best results provided by the models used for
comparison. In terms of
computational time, its performance also is very good. In
forecast and
approximation of functions, the intervals of confidence
obtained for the
defuzzified outputs are always coherent and offer greater
credibility in most of
cases when compared with intervals of confidence obtained
through traditional
methods using the forecast outputs by the other models and
the own T2-HNFB
model.
|
362 |
[en] METHODS FOR THE IMIDACLOPRID QUANTIFICATION IN AQUEOUS SOLUTIONS: METROLOGICAL VALIDATION AND COMPARISON BETWEEN UV-VIS SPECTROPHOTOMETRY AND HIGH-PERFORMANCE LIQUID CHROMATOGRAPHY / [pt] MÉTODOS DE QUANTIFICAÇÃO DE IMIDACLOPRID EM SOLUÇÕES AQUOSAS: VALIDAÇÃO METROLÓGICA E COMPARAÇÃO ENTRE ABSORCIOMETRIA MOLECULAR E CROMATOGRAFIA LÍQUIDA DE ALTA EFICIÊNCIAKELLY NEOOB DE CARVALHO CASTRO 21 May 2007 (has links)
[pt] Um procedimento analítico é considerado apropriado para
uma aplicação
específica quando é capaz de gerar resultados confiáveis,
que possibilitem a
tomada de decisão com grau de confiança adequado, sendo
sua adequação
consolidada mediante a realização de ensaios de validação.
Este trabalho
propõe a utilização de um procedimento analítico
alternativo, mais simples e
econômico, baseado na técnica espectrofotométrica de
absorção molecular,
para quantificação de imidacloprid, um inseticida
sistêmico, em amostras de
solução aquosa. Foi demonstrado que o procedimento
proposto é adequado ao
uso pretendido descrevendo-se, detalhadamente, cada etapa
da validação,
considerando-se os limites estabelecidos para cada
parâmetro de validação e
aplicando-se técnicas estatísticas apropriadas na
avaliação dos mesmos: análise
de variância, análise de regressão, testes de
significância, gráficos de controle e
a estimativa da incerteza de medição. As incertezas de
medição dos
procedimentos de rotina e alternativo foram estimadas e
comparadas às
tolerâncias estipuladas, estabelecendo o procedimento
alternativo como
adequado. Uma comparação experimental deste procedimento
com o de rotina
(baseado em HPLC) foi realizada como parte do protocolo de
validação. Além
da avaliação do procedimento para quantificação de
imidacloprid em nível de
traços, foi investigada também a possibilidade de sua
utilização, para a
quantificação do mesmo ingrediente ativo em produtos
formulados. Neste caso,
foi demonstrado, através da comparação das incertezas
estimadas às tolerâncias
estabelecidas, que o procedimento alternativo não é
adequado, por apresentar
incertezas na ordem de aproximadamente 50% do valor destas
tolerâncias, não
possuindo assim o rigor metrológico requerido para esta
aplicação. / [en] Fit for purpose analytical procedures must be sufficiently
reliable to support
any decision taken based on the generated results. In
order to achieve that,
consolidated adequacy evaluation of the analytical
procedure must be obtained
by performing validation experiments. In this work, an
alternative and simpler
spectrophotometric method for the quantification of
imidacloprid in aqueous
samples was compared to the HPLC-UV based reference method
used in
routine. The overall validation procedure started with a
detailed description of
each validation stage, followed by the settling of the
limits for each of the
validation parameters and then, applying the following
statistical techniques to
evaluate each of the parameters: ANOVA, regression
analysis, significance
tests, control charts and uncertainty estimation. The
measurement of
uncertainties estimation, based on ISO-GUM
recommendations, was done for
both analytical procedures (the alternative one and the
reference one). After
comparing these uncertainties with the tolerance values,
the adequacy of the
alternative proposed procedure was confirmed. Finally, by
consolidating the
validation, the experimental comparison of quantification
methods was
conducted. Besides evaluating the analytical procedure for
trace-level
imidacloprid quantification in water samples, the proposed
method was also
evaluated as the analytical procedure for imidacloprid
based formulated
products. In this case, it was demonstrated that the
spectrophotometric method
did not present the requested metrological requirements
for such application,
since the estimated uncertainties of the alternative
procedure were about 50 %
of the tolerance values.
|
363 |
[en] AN APPLICATION OF REAL OPTIONS THEORY TO THE VALUATION OF A HYDROELECTRIC POWER PLANT / [pt] APLICAÇÃO DA TEORIA DAS OPÇÕES REAIS NA AVALIAÇÃO DE UMA USINA HIDRELÉTRICAANDRE LUIZ DE SOUZA PORTUGAL 04 March 2008 (has links)
[pt] O significativo potencial hídrico do Brasil tem gerado
interesse para
investimentos no setor de geração de energia hidrelétrica.
No entanto, os métodos de
avaliação financeira tradicionalmente utilizados como o
Fluxo de Caixa Descontado
(FCD) não incorporam as opções que os investidores possuem
para gerenciar suas
decisões de investimento de capital, e, em consequência, o
valor do ativo é por vezes
subavaliado. Nessa dissertação, avaliamos, por meio da
utilização da Metodologia das
Opções Reais, a viabilidade financeira de um projeto de
uma usina hidrelétrica cuja
capacidade de geração pode ser expandida ao longo do prazo
da concessão. Para
tanto, foram consideradas as incertezas relacionadas ao
preço da energia, à vazão de
águas na região do projeto, ao fator de perda na geração,
aos indicadores
macroeconômicos TJLP e IGP-M, além da possibilidade do
investimento ser adiado
para uma data futura. Assumindo que o preço spot de
energia segue um processo de
reversão à sua média histórica de longo prazo, o valor das
flexibilidades analisadas
não é significativo. No entanto, a análise de
sensibilidade envolvendo as variáveis
volatilidade e investimento para expansão revelou que o
valor do projeto
aumenta de R$ 1,449 milhões para aproximadamente R$ 1,650
milhões. Dado o alto
grau de incerteza associado à oferta futura de energia
elétrica no Brasil, concluímos
que a Metodologia das Opções Reais oferece uma melhor
estimativa do real valor de
um projeto de investimento flexível, devido à existência
desta incerteza nos
parâmetros utilizados no modelo. / [en] The significant hydric potential available in Brazil has
been attracting
investments in this business area. On the other hand,
traditional valuation methods
such as Discount Cash Flow (DCF) do not incorporate the
value of the options
investors possess when managing their capital investment
decisions and as a result,
the value of these assets may be undervaluated. In this
dissertation, we use the Real
Options Approach to analyze the financial feasibility of a
hydroelectric power plant
project that can expand its generation capacity throughout
its concession life. We
consider uncertainties such as the spot price of energy,
the water flow in the
construction region of the project, the energy generation
loss factor, macroeconomic
parameters such as the TJLP interest rate and the IGP-M
inflation rate, and also the
possibility that the capital investment decision be
postponed. Considering that the
spot price of energy follows a long-term mean reversion
process, the value of the
flexibilities analyzed is not significant. Nevertheless, a
sensitivity analysis of the
volatility and investment required for an expansion
parameters shows that the
value of this project increases from R$ 1.449 millions to
approximately R$ 1.650
millions. Given the high level of uncertainty regarding
the future supply of energy in
Brazil, we concluded that the Real Options Approach offers
a better valuation of a
flexible investment project given the uncertainty
concerning the parameters used in
the model.
|
364 |
[en] CONTRACTING STRATEGIES IN ENERGY AUCTIONS FOR DISTRIBUTION COMPANIES UNDER DEMAND UNCERTAINTY / [pt] ESTRATÉGIA DE CONTRATAÇÃO DAS DISTRIBUIDORAS EM LEILÕES DE ENERGIA SOB INCERTEZA NA DEMANDAANDRE RESENDE GUIMARAES 16 October 2006 (has links)
[pt] O objetivo desta dissertação de mestrado é analisar o novo
marco regulatório do
setor elétrico brasileiro e seus impactos para as empresas
distribuidoras de energia.
Para isto, foi desenvolvida uma ferramenta computacional
para elaborar estratégias de
atuação das distribuidoras nos leilões de compra de
energia instituídos pela nova
regulamentação. Desta forma, é possível simular o processo
de contratação das
distribuidoras no âmbito do ACR e, com os resultados,
realizar análises do impacto
das novas regras na alocação dos riscos as distribuidoras.
O problema consiste, em um
ambiente de incerteza da demanda e dado um conjunto de
instrumentos de risco,
determinar a estratégia de contratação das distribuidoras,
fornecendo o montante de
energia a ser comprado em cada leilão anteriormente
descrito e resultado da melhor
compra dados os contratos candidatos. A metodologia de
solução é otimização
estocástica multi-estágio, levando em consideração,
principalmente, os diversos
horizontes de contratação e preços da energia, visando
minimizar uma ponderação
entre tarifa para consumidor e custos para distribuidora. / [en] The objective of this work is to analyze the new
regulatory framework of the
Brazilian electric sector. In this sense, it was developed
a computational tool in order
to elaborate strategies for the distribution companies
(DISCOs) in the energy auctions
instituted by the new regulation. The computational tool
was used to simulate the
contracts acquisition process by the DISCOs and the
results were analyzed to measure
impact of new rules and risks allocation for the
distribution companies. The problem
consists, considering the demand uncertainty and the
available risk management
instruments, in determining the contracting strategy of
the DISCOs, i.e., the amount
of energy to be bought in each auction that results from
the best purchase given the
candidate contracts. The solution methodology is based on
a multi-stage stochastic
optimization algorithm, minimizing the tariff for consumer
and costs for DISCO,
taking into account different prices and horizons of the
energy contracts.
|
365 |
Técnicas de projeção para identificação de grupos e comparação de dados multidimensionais usando diferentes medidas de similaridade / Projection techniques for group identification and multidimensional data comparison by using different similarity measuresJoia Filho, Paulo 14 October 2015 (has links)
Técnicas de projeção desempenham papel importante na análise e exploração de dados multidimensionais, já que permitem visualizar informações muitas vezes ocultas na alta dimensão. Esta tese explora o potencial destas técnicas para resolver problemas relacionados à: 1) identificação de agrupamentos e 2) busca por similaridade em dados multidimensionais. Para identificação de agrupamentos foi desenvolvida uma técnica de projeção local e interativa que, além de projetar dados com ótima preservação de distâncias, permite que o usuário modifique o layout da projeção, agrupando um número reduzido de amostras representativas no espaço visual, de acordo com suas características. Os mapeamentos produzidos tendem a seguir o layout das amostras organizadas pelo usuário, facilitando a organização dos dados e identificação de agrupamentos. Contudo, nem sempre é possível selecionar ou agrupar amostras com base em suas características visuais de forma confiável, principalmente quando os dados não são rotulados. Para estas situações, um novo método para identificação de agrupamentos baseado em projeção foi proposto, o qual opera no espaço visual, garantindo que os grupos obtidos não fiquem fragmentados durante a visualização. Além disso, é orientado por um mecanismo de amostragem determinístico, apto a identificar instâncias que representam bem o conjunto de dados como um todo e capaz de operar mesmo em conjuntos de dados desbalanceados. Para o segundo problema: busca por similaridade em dados multidimensionais, uma família de métricas baseada em classes foi construída para projetar os dados, com o objetivo de minimizar a dissimilaridade entre pares de objetos pertencentes à mesma classe e, ao mesmo tempo, maximizá-la para objetos pertencentes a classes distintas. As métricas classes-específicas são avaliadas no contexto de recuperação de imagens com base em conteúdo. Com o intuito de aumentar a precisão da família de métricas classes-específicas, outra técnica foi desenvolvida, a qual emprega a teoria dos conjuntos fuzzy para estimar um valor de incerteza que é transferido para a métrica, aumentando sua precisão. Os resultados confirmam a efetividade das técnicas desenvolvidas, as quais representam significativa contribuição na tarefa de identificação de grupos e busca por similaridade em dados multidimensionais. / Projection techniques play an important role in multidimensional data analysis and exploration, since they allow to visualize information frequently hidden in high-dimensional spaces. This thesis explores the potential of those techniques to solve problems related to: 1) clustering and 2) similarity search in multidimensional data. For clustering data, a local and interactive projection technique capable of projecting data with effective preservation of distances was developed. This one allows the user to manipulate a reduced number of representative samples in the visual space so as to better organize them. The final mappings tend to follow the layout of the samples organized by the user, therefore, the user can interactively steer the projection. This makes it easy to organize and group large data sets. However, it is not always possible to select or group samples visually, in a reliable manner, mainly when handling unlabeled data. For these cases, a new clustering method based on multidimensional projection was proposed, which operates in the visual space, ensuring that clusters are not fragmented during the visualization. Moreover, it is driven by a deterministic sampling mechanism, able to identify instances that are good representatives for the whole data set. The proposed method is versatile and robust when dealing with unbalanced data sets. For the second problem: similarity search in multidimensional data, we build a family of class-specific metrics to project data. Such metrics were tailored to minimize the dissimilarity measure among objects from the same class and, simultaneously to maximize the dissimilarity among objects in distinct classes. The class-specific metrics are assessed in the context of content-based image retrieval. With the aim of increasing the precision of the class-specific metrics, another technique was developed. This one, uses the fuzzy set theory to estimate a degree of uncertainty, which is embedded in the metric, increasing its precision. The results confirm the effectiveness of the developed techniques, which represent significant contributions for clustering and similarity search in multidimensional data.
|
366 |
Lógicas probabilísticas com relações de independência: representação de conhecimento e aprendizado de máquina. / Probabilistic logics with independence relationships: knowledge representation and machine learning.Ochoa Luna, José Eduardo 17 May 2011 (has links)
A combinação de lógica e probabilidade (lógicas probabilísticas) tem sido um tópico bastante estudado nas últimas décadas. A maioria de propostas para estes formalismos pressupõem que tanto as sentenças lógicas como as probabilidades sejam especificadas por especialistas. Entretanto, a crescente disponibilidade de dados relacionais sugere o uso de técnicas de aprendizado de máquina para produzir sentenças lógicas e estimar probabilidades. Este trabalho apresenta contribuições em termos de representação de conhecimento e aprendizado. Primeiro, uma linguagem lógica probabilística de primeira ordem é proposta. Em seguida, três algoritmos de aprendizado de lógica de descrição probabilística crALC são apresentados: um algoritmo probabilístico com ênfase na indução de sentenças baseada em classificadores Noisy-OR; um algoritmo que foca na indução de inclusões probabilísticas (componente probabilístico de crALC); um algoritmo de natureza probabilística que induz sentenças lógicas ou inclusões probabilísticas. As propostas de aprendizado são avaliadas em termos de acurácia em duas tarefas: no aprendizado de lógicas de descrição e no aprendizado de terminologias probabilísticas em crALC. Adicionalmente, são discutidas aplicações destes algoritmos em processos de recuperação de informação: duas abordagens para extensão semântica de consultas na Web usando ontologias probabilísticas são discutidas. / The combination of logic and probabilities (probabilistic logics) is a topic that has been extensively explored in past decades. The majority of work in probabilistic logics assumes that both logical sentences and probabilities are specified by experts. As relational data is increasingly available, machine learning algorithms have been used to induce both logical sentences and probabilities. This work contributes in knowledge representation and learning. First, a rst-order probabilistic logic is proposed. Then, three algorithms for learning probabilistic description logic crALC are given: a probabilistic algorithm focused on learning logical sentences and based on Noisy-OR classiers; an algorithm that aims at learning probabilistic inclusions (probabilistic component of crALC) and; an algorithm that using a probabilistic setting, induces either logical sentences or probabilistic inclusions. Evaluation of these proposals has been performed in two situations: by measuring learning accuracy of both description logics and probabilistic terminologies. In addition, these learning algorithms have been applied to information retrieval processes: two approaches for semantic query extension through probabilistic ontologies are discussed.
|
367 |
Quantificação da incerteza volumétrica na modelagem geológica / Quantifying geological modelling uncertaintySilva, Thyago de Oliveira da 17 October 2016 (has links)
Gerenciar riscos é fundamental para que investimentos estejam protegidos de quaisquer fatores que possam modificar um cenário idealizado. Imprevistos não podem ser controlados, mas seus impactos podem ser minimizados se forem tomadas medidas de planejamento considerando diversos cenários da realidade. A indústria mineral se encaixa neste paradigma, pois diversas de suas áreas são estocásticas, desde flutuações econômicas e políticas até fenômenos relativos ao clima e à geologia. Uma destas características de difícil previsão é o volume das mineralizações em um depósito. Um cenário ideal é aquele em que é conhecido o valor esperado da variável de interesse, bem como sua dispersão, com mínimo e máximo definidos. Isto pode ser obtido a partir da combinação dos resultados de estimativa, que resultam em um valor esperado, aliados ao resultado das simulações, em que pode ser obtida a variância entre todos os cenários equiprováveis. Este trabalho propõe uma técnica para quantificar a incerteza dos volumes na modelagem geológica de domínios mineralizados em dois modelos geológicos, interpolado e interpretado, através da transferência da variância obtida nos resultados da simulação, e desta forma criar uma ferramenta de gerenciamento de risco e planejamento a partir dos resultados de incerteza. Para isto foram utilizados os dados de descrição geológica de 168 testemunhos de sondagem de um depósito de cobre, localizado no norte da Bahia. Os resultados mostraram a possibilidade em se utilizar os dados de variância da simulação para quantificar a incerteza em cada domínio do depósito. A partir do volume esperado em determinado modelo, e com os valores da variância da simulação, foi possível identificar uma gama de possibilidades volumétricas. Adicionalmente, a probabilidade de que cada bloco faça parte de um domínio foi calculada, e os volumes dos domínios foram parametrizados para auxiliar na avaliação da incerteza. / Managing risks is essential for investments being safe from any factors that may modify an idealized scenario. Unpredictabilities cannot be controlled, but their impacts can be minimized if planning measures are taken considering various scenarios of reality. The mining industry fits this paradigm, since several of its fields are stochastic, from economic and political fluctuations to phenomena related to climate and geology. One of these characteristics, which are difficult to predict, is the volume of mineralization at the deposit. An ideal scenario is the one in which both the expected value and its dispersion are known, with defined minimum and maximum. This can be achieved with the combination of results from estimates and simulations, the first providing the expected value and the last providing the variance of the variable. This research proposes a technique to quantify the volumetric uncertainty in geological modeling of mineralized domains on two geological models, interpreted and interpolated, by transferring the variance obtained in the simulation results, thus creating a risk and planning management tool from the uncertainty results. For that, we used a geological logging from a database set with 168 drillholes of a copper deposit located north of Bahia state, Brazil. The results showed that it is possible to use the variance from simulation to quantify the uncertainty in each deposit domain. Using the expected volume value in a specific model with the variance values of the simulations, it were able to identify a range of possibilities for the volumetric content of each domain. In addition, the probability of each block being a domain was calculated, resulting in a volume parametrization by probability that can assist in the uncertainty analysis.
|
368 |
Aprendizado semi-supervisionado para o tratamento de incerteza na rotulação de dados de química medicinal / Semi supervised learning for uncertainty on medicinal chemistry labellingSouza, João Carlos Silva de 09 March 2017 (has links)
Nos últimos 30 anos, a área de aprendizagem de máquina desenvolveu-se de forma comparável com a Física no início do século XX. Esse avanço tornou possível a resolução de problemas do mundo real que anteriormente não poderiam ser solucionados por máquinas, devido à dificuldade de modelos puramente estatísticos ajustarem-se de forma satisfatória aos dados de treinamento. Dentre tais avanços, pode-se citar a utilização de técnicas de aprendizagem de máquina na área de Química Medicinal, envolvendo métodos de análise, representação e predição de informação molecular por meio de recursos computacionais. Os dados utilizados no contexto biológico possuem algumas características particulares que podem influenciar no resultado de sua análise. Dentre estas, pode-se citar a complexidade das informações moleculares, o desbalanceamento das classes envolvidas e a existência de dados incompletos ou rotulados de forma incerta. Tais adversidades podem prejudicar o processo de identificação de compostos candidatos a novos fármacos, se não forem tratadas de forma adequada. Neste trabalho, foi abordada uma técnica de aprendizagem de máquina semi-supervisionada capaz de reduzir o impacto causado pelo problema da incerteza na rotulação dos dados, aplicando um método para estimar rótulos mais confiáveis para os compostos químicos existentes no conjunto de treinamento. Na tentativa de evitar os efeitos causados pelo desbalanceamento dos dados, foi incorporada ao processo de estimação de rótulos uma abordagem sensível ao custo, com o objetivo de evitar o viés em benefício da classe majoritária. Após o tratamento do problema da incerteza na rotulação, classificadores baseados em Máquinas de Aprendizado Extremo foram construídos, almejando boa capacidade de aproximação em um tempo de processamento reduzido em relação a outras abordagens de classificação comumente aplicadas. Por fim, o desempenho dos classificadores construídos foi avaliado por meio de análises dos resultados obtidos, confrontando o cenário com os dados originais e outros com as novas rotulações obtidas durante o processo de estimação semi-supervisionado / In the last 30 years, the area of machine learning has developed in a way comparable to Physics in the early twentieth century. This breakthrough has made it possible to solve real-world problems that previously could not be solved by machines because of the difficulty of purely statistical models to fit satisfactorily with training data. Among these advances, one can cite the use of machine learning techniques in the area of Medicinal Chemistry, involving methods for analysing, representing and predicting molecular information through computational resources. The data used in the biological context have some particular characteristics that can influence the result of its analysis. These include the complexity of molecular information, the imbalance of the classes involved, and the existence of incomplete or uncertainly labeled data. If they are not properly treated, such adversities may affect the process of identifying candidate compounds for new drugs. In this work, a semi-supervised machine learning technique was considered to reduce the impact caused by the problem of uncertainty in the data labeling, by applying a method to estimate more reliable labels for the chemical compounds in the training set. In an attempt to reduce the effects caused by data imbalance, a cost-sensitive approach was incorporated to the label estimation process, in order to avoid bias in favor of the majority class. After addressing the uncertainty problem in labeling, classifiers based on Extreme Learning Machines were constructed, aiming for good approximation ability in a reduced processing time in relation to other commonly applied classification approaches. Finally, the performance of the classifiers constructed was evaluated by analyzing the results obtained, comparing the scenario with the original data and others with the new labeling obtained by the semi-supervised estimation process
|
369 |
Métodos espectrofotométrico, RP-UPLC e microbiológico para determinação de linezolida em formas farmacêuticas / Spectrophotometric, RP-UPLC and microbiological methods for determination of linezolida in pharmaceutical preparationsSaviano, Alessandro Morais 23 October 2015 (has links)
A linezolida é um antibiótico oxazolidinona efetivo contra bactérias patogênicas gram-positivas, incluindo Staphylococcus aureus resistente a meticilina (MRSA), Staphylococcus aureus resistente a glicopeptídeos (GISA) e enterococci resistente a vancomicina (VRE). As oxazolidinonas inibem a translação bacteriana na fase de iniciação da síntese de proteínas, enquanto que a síntese de RNA e DNA não são afetadas. Diversos métodos por cromatografia líquida de alta-eficiência (HPLC) têm sido relatados para a determinação da concentração de linezolida em plasma humano, soro e urina. Entretanto, um número pequeno de métodos estão disponíveis para a determinação de linezolida em formulações farmacêuticas. O objetivo deste trabalho foi desenvolver e validar métodos espectrofotométrico, de cromatografia líquida de ultraeficiência em fase reversa (RP-UPLC), doseamento microbiológico em placas e doseamento microbiológico rápido em microplacas com leitura cinética para a determinação de linezolida em soluções injetáveis e comprimidos. Adicionalmente, foram identificadas e quantificadas as principais fontes de incerteza relacionadas aos métodos. O desenvolvimento dos métodos utilizou uma abordagem racional, empregando-se planejamento de experimentos (análise fatorial e metodologia de superfície resposta) para otimização das condições analíticas. As fontes de incertezas foram identificadas empregando-se diagrama de Ishikawa e quantificadas conforme procedimento da Eurachem/Citac. Os métodos desenvolvidos apresentaram especificidade/seletividade, linearidade, precisão, exatidão e robustez adequadas, conforme os critérios estabelecidos pelo ICH e ANVISA. A análise estatística demonstrou equivalência entre os resultados providos por cada um dos métodos, sendo intercambiáveis entre si. Portanto, os métodos podem ser empregados no controle de qualidade de rotina na indústria farmacêutica. / Linezolid is an oxazolidinone antibiotic effective against gram-positive pathogenic bacteria, including methicillin-resistant Staphylococcus aureus (MRSA), glycopeptide-intermediate Staphylococcus aureus (GISA) and vancomycin-resistant enterococci (VRE). Oxazolidinones inhibit bacterial translation at the initiation phase of protein synthesis, while RNA and DNA synthesis are not affected. Several high performance liquid chromatographic (HPLC) methods have been reported to determine the concentration of linezolid in human plasma, serum and urine. However, a few number of methods are available to determine the concentration of linezolid in pharmaceutical dosage forms. The aim of the present work was to develop and validate a spectrophotometric method, a reverse-phase ultra-high performance liquid chromatographic method, microbiological assay and microbiological rapid assay in microplates using kinetic reading for the determination of linezolid in injections and tablets dosage forms. In addition, the most important sources of uncertainty were identified and quantified for each method. A rational approach was used in the development of these methods, using design of experiments (factorial design and response surface methodology) for optimization of analytical conditions. The sources of uncertainties were identified using Ishikawa diagram and quantified as described in Eurachem/Citac procedure. The developed methods were specific/selective, linear, precise, accurate and robust, as required by ICH and ANVISA guidelines. Statistical analysis showed equivalence among the results provided by each method, being interchangeable. Thus, the methods may be employed in routine quality control analysis by pharmaceutical industry.
|
370 |
Aplicação de variáveis indicadoras na avaliação da incerteza volumétrica em um depósito de Zn-Pb / Application of indicator variables for evaluating the volumetric uncertainty of a Zn-Pb modelLeonel, Letícia Gameiro 22 October 2015 (has links)
Santa Maria é um projeto de exploração mineral conduzido pela empresa Votorantim Metais Ltda, com foco nas comodities zinco e chumbo. Localizado no estado do Rio Grande do Sul, próximo das antigas minas de Camaquã e Uruguay, o projeto se encontra em uma região geologicamente fértil para exploração mineral. O depósito de Santa Maria possui informações suficientes para permitir a avaliação dos recursos minerais e também estudos de viabilidade econômica de projeto, entretanto, sua mineralização ocorre de forma heterogênea e condicionada a feições geológicas estruturais complexas, inserindo dúvidas à respeito da forma e volume dos corpos mineralizados. O objetivo desta pesquisa é a avaliação da incerteza associada à modelagem dos corpos mineralizados. Essa avaliação foi realizada através da comparação entre o modelo tridimensional confeccionado por interpretação de seções e outros dois modelos probabilísticos: um gerado por krigagem de indicadoras e outro gerado por simulação sequencial de indicadoras, que permitiu a interpretação da incerteza associada. Com os resultados obtidos foi possível quantificar os valores de volume máximo, mínimo e médio esperado no depósito, além de avaliar regiões de maior e menor confiança. A utilização conjunta dos métodos de krigagem de indicadoras e simulação sequencial de indicadoras se mostrou uma excelente opção para avaliação do modelo interpretado. Através do tratamento dos resultados foi possível obter informações à respeito da variabilidade local e global do depósito e sobre o comportamento espacial da mineralização. Os resultados e interpretações obtidos podem ser aplicados em trabalhos futuros no depósito, como na classificação do recurso mineral, no refinamento do modelo geológico e no planejamento de futuras malhas de sondagem infill. / Santa Maria is a mineral exploration project conducted by Votorantim Metais Ltda, with focus on zinc and lead extraction. The project is located in the state of Rio Grande do Sul, in the vicinities of the old mines of Camaquã and Uruguay, a favorable area for mineral exploration. There is enough information about Santa Maria\'s deposit to allow the estimation of mineral resources and the project\'s economical viability study, however, its mineralization occurs in heterogeneous ways and is conditioned to complex geological structural features, casting doubts about the shape and volume of the ore bodies. The main goal of this research is evaluating the uncertainty associated with the modeling of the orebodies. This evaluation was performed by comparing a three-dimensional model created by section interpretation and other two probabilistic models: one generated by indicator kriging, and the other generated by sequential indicator simulation, which allowed the interpretation of the associated uncertainty. Based on the obtained results, it was possible to quantify the maximum, minimum and average expected volume of the deposit, and also to evaluate the regions of most and least reliability. The joint use of indicator kriging and sequential indicator simulation methods proved to be an excelent tool for evaluating the interpreted model. By processing the results it was possible to obtain information about deposit\'s local and global variability and spatial behavior of mineralization. The obtained results and interpretations can be applied in deposit\'s further sutdies, for instance, to classify the mineral resource, to refine the geological model or to plan future infill drilholes.
|
Page generated in 0.0609 seconds