41 |
[en] STOCK MARKET BEHAVIOR PREDICTION USING FINANCIAL NEWS IN PORTUGUESE / [pt] PREDIÇÃO DO COMPORTAMENTO DO MERCADO FINANCEIRO UTILIZANDO NOTÍCIAS EM PORTUGUÊSHERALDO PIMENTA BORGES FILHO 27 August 2015 (has links)
[pt] Um conjunto de teorias financeiras, tais como a hipótese do mercado
eficiente e a teoria do passeio aleatório, afirma ser impossível prever o
futuro do mercado de ações baseado na informação atualmente disponível.
Entretanto, pesquisas recentes têm provado o contrário ao constatar uma
relação entre o conteúdo de uma notícia corrente e o comportamento de um
ativo. Nosso objetivo é projetar e implementar um algoritmo de predição
que utiliza notícias jornalísticas sobre empresas de capital aberto para
prever o comportamento de ações na bolsa de valores. Utilizamos uma
abordagem baseada em aprendizado de máquina para a tarefa de predição
do comportamento de um ativo nas posições de alta, baixa ou neutra,
utilizando informações quantitativas e qualitativas, como notícias sobre o
mercado financeiro. Avaliamos o nosso sistema em um dataset com seis mil
notícias e nossos experimentos apresentam uma acurácia de 68.57 porcento para a
tarefa. / [en] A set of financial theories, such as the eficient market hypothesis and
the theory of random walk, says it is impossible to predict the future of
the stock market based on currently available information. However, recent
research has proven otherwise by finding a relationship between the content
of a news and current behavior of an stock. Our goal is to develop and
implement a prediction algorithm that uses financial news about joint-stock
company to predict the stock s behavior on the stock exchange. We use an
approach based on machine learning for the task of predicting the behavior
of an stock in positions of up, down or neutral, using quantitative and
qualitative information, such as financial. We evaluate our system on a
dataset with six thousand news and our experiments indicate an accuracy
of 68.57 percent for the task.
|
42 |
[en] PREDICTIVE MODELS FOR STUDENT ATTRITION IN PRIVATE GRADUATION: AN APPLICATION OF MACHINE LEARNING TO RELATIONSHIP MARKETING MANAGEMENT / [pt] MODELOS PREDITIVOS PARA EVASÃO DE ALUNOS NO ENSINO SUPERIOR PRIVADO: UMA APLICAÇÃO DE MACHINE LEARNING PARA GESTÃO DE MARKETING DE RELACIONAMENTOFRANCISCO COIMBRA CARNEIRO PEREIRA 04 January 2018 (has links)
[pt] Perdendo em média mais de 20 por cento da base de alunos todo semestre, a evasão de alunos no ensino superior privado representa um desafio para a gestão dessas instituições. Diferentes abordagens são utilizadas para combater este problema. Para a gestão de marketing de retenção, a identificação dos alunos é o primeiro passo necessário para aplicar uma estratégia de interação personalizada. Nesse sentido, este trabalho apresenta uma metodologia quantitativa para classificação de risco de evasão de alunos ativos. Baseado em dados históricos de alunos que evadiram ou se formaram, modelos gerados por algoritmos de machine learning foram calculados e comparados e, na sequência, utilizados para classificar alunos ativos. Por fim, estimou-se o lifetime value desses alunos para auxiliar na definição de estratégias de retenção. / [en] Losing more than 20 percent of its students each semester, the student attrition in private graduation courses challenges its institutions management. Different approaches to address this problem have been used. To retention marketing management the identification of students is the first necessary step to apply a personalized interaction strategy. In this sense, this work uses a quantitative methodology to classify its students by risk of attrition. Based in historic data of former students of an institution, models were generated by machine learning algorithms and its results compared. Then they were used to classify active students in the educational institution. Afterwards, their lifetime value were estimated in order to help in the definition of retention strategies.
|
43 |
[en] APPLYING RISK CLASSIFICATION METHOD IN CAR INSURANCE MARKET / [pt] MÉTODO DE CLASSIFICAÇÃO DE RISCO APLICADO AO MERCADO DE SEGUROS DE AUTOMÓVEISWILSON LINS MORGADO 14 February 2005 (has links)
[pt] A estimação do risco em seguros de automóveis representa um
difícil
problema de regressão. As dificuldades vão desde a
utilização de um grande
número de variáveis discretas como explicativas, até a
distribuição particular dos
ruídos e uma quantidade expressiva de categorias com
valores nulos e valores
discrepantes.
Supondo que os problemas de estimação estejam relacionados
com a
classificação do risco adotada pelo mercado, este trabalho
propõe um método de
classificação alternativo. O método desenvolvido foi
baseado na técnica de análise
fatorial, e no algoritmo de agrupamento de dados denominado
fuzzy clustering
system.
Para avaliar a eficiência do método em solucionar os
problemas de
estimação, optou-se por utilizar o erro resultante da
aplicação de modelos lineares
generalizados. Ao final, o erro de estimação obtido diante
da classificação
proposta, foi comparado ao obtido diante da classificação
usual de mercado. / [en] The estimation of car insurance risk rate represents a
difficult regression
problem. One of the difficulties of this problem is the use
of a number of discrete
independent variables and a specific error distribution
that presents an expressive
number of null and outlier values.
Assuming that these estimation problems are related to the
risk
classification adopted by the insurance companies, this
work proposes an
alternative classification method. This method is based on
factorial analysis
techniques and on the algorithm known as Fuzzy Clustering
System.
To evaluate the efficiency of this method in solving the
problems identified,
the risk was estimated using generalized linear models. The
errors from each
model were obtained and compared between classifications.
|
44 |
[en] KNOWLEDGE-BASED INTERPRETATION OF HIGH RESOLUTION REMOTE SENSING IMAGES / [pt] INTERPRETAÇÃO BASEADA EM CONHECIMENTO DE IMAGENS DE SENSORES REMOTOS DE ALTA RESOLUÇÃOTHIAGO BROERMAN CAZES 21 March 2006 (has links)
[pt] A cada dia mais e mais satélites de alta resolução têm se
tornado disponíveis,
criando grande demanda por novos métodos de interpretação
baseados em
conhecimento. Estes métodos emulam parcialmente o trabalho
do especialista em
análise visual de imagens. Nesse contexto, o presente
trabalho apresenta um modelo de
classificação baseado no conhecimento do especialista
aplicado a imagens de alta
resolução. O modelo de interpretação consiste de três
fases. A primeira inclui o
conhecimento espectral e a informação de textura. Na
segunda fase dados de SIG
(sistema de informação geográfico) são combinados com o
resultado da análise
espectral através de regras nebulosas. Na terceira e
última fase é introduzido o
conhecimento multitemporal através de uma estimativa das
possibilidades de transição
entre classes de uma mesma área em um dado intervalo de
tempo. Para validação desse
modelo experimentos foram realizados em imagens IKONOS e
fotos aéreas de 1999,
2001 e de 2002 da área do Parque Estadual da Pedra Branca,
que é um importante
fragmento da Floresta Atlântica situado no estado do Rio
de Janeiro, Brasil. / [en] New high resolution satellites for commercial purposes
became available in the
few years. This increases the need of new automatic
knowledge based image
interpretation methods. Such methods partially emulate the
reasoning of an image
analyst during the visual image interpretation. The
present work falls into this context
and proposes an automatic classification model for high
resolution remotely sensed
images. The model consists of three stages. In the first
stage only spectral and textural
information are used for classification. In the second
stage GIS (geographic information
system) data are combined with the result of the spectral
analysis by means of fuzzy
rules. In the third stage the multitemporal knowledge is
introduced by estimating class
transition possibilities within a given time span. To
validate the proposed model
experiments were performed based on IKONOS images from
2001 and 2002 as well as
aerial photos from 1999 of the Pedra Branca Park, which is
an important Atlantic Forest
fragment in the State Rio de Janeiro in Southeast Brazil.
|
45 |
[en] ON THE APPLICATION OF SIGNAL ANALYSIS TECHNIQUES TO REAL TIME COMMUNICATION AND CLASSIFICATION / [pt] TÉCNICAS APLICADAS À COMUNICAÇÃO EM TEMPO REAL E À SUA CLASSIFICAÇÃOBRUNO COSENZA DE CARVALHO 12 March 2003 (has links)
[pt] A técnica de análise de sinais corrompidos por ruído
baseada no comportamento de subespaços vetoriais foi tema
de alguns trabalhos publicados desde o início da década de
80. Esta nova técnica passou a ter grande importância
no processamento de sinais digitais devido a fatores como
robustez e precisão.Porém, o maior problema associado a
este novo método é o seu elevado custo computacional. Esta
característica limitou o emprego da técnica em sistemas -
offline - . A preocupação então passou a ser rastrear a
variação do comportamento dos subespaços vetoriais de modo
eficiente. O objetivo deste rastreamento seria o emprego da
técnica em alguns sistemas que operam em tempo real. Este
trabalho de tese propõe um novo algoritmo de rastreamento
de subespaços vetoriais. O objetivo é apresentar um
algoritmo que demonstre um bom desempenho, com
relação aos demais já existentes, permitindo eventual
aplicação em sistemas que atuem em tempo real. Como
contribuição adicional, são apresentadas uma nova análise e
caracterização de sistemas que se assemelham aos
circulantes, sendo para isto reinterpretada a decomposição
de matrizes circulantes. O conjunto de contribuições é
aplicado a um novo sistema automático de classificação de
sinais comunicação, quanto ao tipo de modulação. / [en] The signal subspace analysis technique, usually applied to
signals corrupted by noise, is theme of some papers since
the beginning of the 80s decade. This new technique has
presented important features, as robustness and precision,
and became widely employed in digital signal processing.
However, the main problem associated to this new method is
the high computational cost. This characteristic
has restricted the use of signal subspace analysis to some
off-line systems. A possible way to overcome this burden
was to track the signal and noise subspace behavior in the
time-domain. The main objective of these methods is to
allow the signal subspace analysis technique application to
real time systems, sometimes at the expense of limiting
analysis precision or scope. This work proposes a new
subspace tracking procedure. The goal is to describe a new
algorithm with good performance (precision-speed), allowing
some real time systems applications. A new analysis and
characterization of almost circulant systems is introduced
by reinterpreting the circulating matrix decomposition
scheme. The set of contributions is applied to a new
analogue modulation communication signals automatic
recognition structure.
|
46 |
[en] DATA SELECTION FOR LVQ / [pt] SELEÇÃO DE DADOS EM LVQRODRIGO TOSTA PERES 20 September 2004 (has links)
[pt] Nesta dissertação, propomos uma metodologia para seleção de
dados em
modelos de Aprendizado por Quantização Vetorial,
referenciado amplamente na
literatura pela sigla em inglês LVQ. Treinar um modelo
(ajuste dentro-daamostra)
com um subconjunto selecionado a partir do conjunto de dados
disponíveis para o aprendizado pode trazer grandes
benefícios no resultado de
generalização (fora-da-amostra). Neste sentido, é muito
importante realizar uma
busca para selecionar dados que, além de serem
representativos de suas
distribuições originais, não sejam ruído (no sentido
definido ao longo desta
dissertação). O método proposto procura encontrar os pontos
relevantes do
conjunto de entrada, tendo como base a correlação do erro
de cada ponto com o
erro do restante da distribuição. Procura-se, em geral,
eliminar considerável parte
do ruído mantendo os pontos que são relevantes para o
ajuste do modelo
(aprendizado). Assim, especificamente em LVQ, a atualização
dos protótipos
durante o aprendizado é realizada com um subconjunto do
conjunto de
treinamento originalmente disponível. Experimentos
numéricos foram realizados
com dados simulados e reais, e os resultados obtidos foram
muito interessantes,
mostrando claramente a potencialidade do método proposto. / [en] In this dissertation, we consider a methodology for
selection of data in
models of Learning Vector Quantization (LVQ). The
generalization can be
improved by using a subgroup selected from the available
data set. We search the
original distribution to select relevant data that aren't
noise. The search aims at
relevant points in the training set based on the
correlation between the error of
each point and the average of error of the remaining data.
In general, it is desired
to eliminate a considerable part of the noise, keeping the
points that are relevant
for the learning model. Thus, specifically in LVQ, the
method updates the
prototypes with a subgroup of the originally available
training set. Numerical
experiments have been done with simulated and real data.
The results were very
interesting and clearly indicated the potential of the
method.
|
47 |
[en] CONTROL OF A ROBOTIC HAND USING SURFACE ELECTROMYOGRAPHIC SIGNALS / [pt] CONTROLE DE UMA MÃO ROBÓTICA ACIONADA POR SINAIS ELETROMIOGRÁFICOS DE SUPERFÍCIECARLOS GERARDO PAUCAR MALQUI 07 March 2017 (has links)
[pt] Esta dissertação propõe um sistema de controle de uma mão robótica
utilizando sinais eletromiográficos de superfície (sEMG). Os sinais sEMG
são coletados de três diferentes grupos musculares do antebraço superior:
músculo palmar longo, músculo extensor dos dedos, e músculo extensor
radial longo do carpo. O objetivo dessa pesquisa é o desenvolvimento
de um protótipo de uma prótese robótica para pessoas que apresentam
amputação da mão, controlado por uma interface eletromiográfica baseada
em inteligência computacional. Este trabalho abrange os seguintes tópicos:
posicionamento dos eletrodos para capturar os sinais sEMG, projeto de
um sistema de eletromiografia como interface muscular, método de pré processamento
de sinais, uso de técnicas de inteligência computacional
para a interpretação dos sinais sEMG, projeto da mão robótica, e método
de controle utilizado para controlar as posições dos dedos e o controle
da força da mão. Nesta dissertação é utilizada a transformada wavelet
como método de extração de características nos sinais eletromiográficos,
e uma rede neural multicamada como método de classificação de padrões.
O modelo proposto apresentou resultados satisfatórios, conseguindo 90,5 por cento
de classificação correta dos padrões para o reconhecimento de 6 posturas
diferentes da mão, 94,3 por cento para 5 posturas, e 96,25 por cento para 4 posturas. / [en] This thesis proposes the control of a robotic hand system using surface
electromyographic signals (sEMG). The sEMG signals are collected
from three different muscle groups of the upper forearm: palmaris longus
muscle, extensor digitorum communis muscle, and extensor carpi radialis
longus muscle. The objective of this research is to develop a prototype
of a robotic prosthesis for people with hand amputation, controlled by
an electromyographic interface based on computational intelligence. This
thesis covers the following topics: positioning of electrodes to capture the
sEMG signals, design of an electromyography muscle interface, preprocessing
method, use of techniques of computational intelligence for the interpretation
of the sEMG signals, design of the robotic hand, and method
used to control the positions of the fingers and of the hand grip force.
Here, the wavelet transform is used as a feature extraction method in electromyographic
signals, and a multi-layer neural network as a pattern classification
method. The proposed model obtained satisfactory results, recognizing
90.5 per cent of the positions for 6 different hand patterns, 94.3 per cent for 5, and
96.25 per cent for 4 positions.
|
48 |
[en] CLASSIFICATION OF OBJECTS IN REAL CONTEXT BY CONVOLUTIONAL NEURAL NETWORKS / [pt] CLASSIFICAÇÃO DE OBJETOS EM CONTEXTO REAL POR REDES NEURAIS CONVOLUTIVASLUIS MARCELO VITAL ABREU FONSECA 08 June 2017 (has links)
[pt] A classificação de imagens em contexto real é o ápice tecnológico do reconhecimento de objetos. Esse tipo de classificação é complexo, contendo diversos problemas de visão computacional em abundância. Este projeto
propõe solucionar esse tipo de classificação através do uso do conhecimento no aprendizado de máquina aplicado ao dataset do MS COCO. O algoritmo implementado neste projeto consiste de um modelo de Rede Neural Convolutiva que consegue aprender características dos objetos e realizar predições sobre suas classes. São elaborados alguns experimentos que comparam diferentes resultados de predições a partir de diferentes técnicas de aprendizado. É também realizada uma comparação dos resultados da implementação com o estado da arte na segmentação de objetos em contexto. / [en] The classification of objects in real contexts is the technological apex of object recognition. This type of classification is complex, containing diverse computer vision problems in abundance. This project proposes
to solve that type of classification through the use of machine learning knowledge applied to the MS COCO dataset. The implemented algorithm in this project consists of a Convolutional Neural Network model that
is able to learn characteristics of the objects and predict their classes. Some experiments are made that compare different results of predictions using different techniques of learning. There is also a comparison of the results from the implementation with state of art in contextual objects segmentation.
|
49 |
[pt] CLASSIFICAÇÃO DE FALHAS DE EQUIPAMENTOS DE UNIDADE DE INTERVENÇÃO EM CONSTRUÇÃO DE POÇOS MARÍTIMOS POR MEIO DE MINERAÇÃO TEXTUAL / [en] TEXT CLASSIFICATION OF OFFSHORE RIG EQUIPMENT FAILURE07 April 2020 (has links)
[pt] A construção de poços marítimos tem se mostrado uma atividade complexa
e de alto risco. Para efetuar esta atividade as empresas se valem principalmente
das unidades de intervenção de poços, também conhecidas como sondas. Estas
possuem altos valores de taxas diárias de uso devido à manutenção preventiva da
unidade em si, mas também por falhas as quais seus equipamentos estão sujeitos.
No cenário específico da Petrobras, em junho de 2011, foi implantado no banco de
dados da empresa um maior detalhamento na classificação das falhas de
equipamentos de sonda. Com isso gerou-se uma descontinuidade nos registros da
empresa e a demanda para adequar estes casos menos detalhados à classificação
atual, mais completa. Os registros são compostos basicamente de informação
textual. Para um passivo de 3384 registros, seria inviável alocar uma pessoa para
classificá-los. Com isso vislumbrou-se uma ferramenta que pudesse efetuar esta
classificação da forma mais automatizada possível, utilizando os registros feitos
após junho de 2011 como base. O objetivo principal deste trabalho é de sanar esta
descontinuidade nos registros de falha de equipamentos de sonda. Os dados foram
tratados e transformados por meio de ferramentas de mineração textual bem como
processados pelo algoritmo de aprendizado supervisionado SVM (Support Vector
Machines). Ao final, após obter a melhor configuração do modelo, este foi
aplicado às informações textuais do passivo de anormalidades, atribuindo suas
classes de acordo com o novo sistema de classificação. / [en] Off-shore well construction has shown to be a complex and risky activity. In
order to build off-shore wells, operators rely mainly on off-shore rigs. These rigs
have an expensive day rate, related to their rental and maintenance, but also due to
their equipment failure. At off-shore Petrobras scenario, on June of 2011, was
implemented at the company database a better detailing on the classification of rig
equipment failure. That brought a discontinuity to the database records and
created a demand for adequacy of the former classification to the new
classification structure. Basically, rig equipment failure records are based on
textual information. For a liability of 3384 records, it was unable for one person to
manage the task. Therefore, an urge came for a tool that could classify these
records automatically, using database records already classified under the new
labels. The main purpose of this work is to overcome this database discontinuity.
Data was treated and transformed through text mining tools and then processed by
supervised learning algorithm SVM (Support Vector Machines). After obtaining
the best model configuration, the old records were submitted under this model and
were classified according to the new classification structure.
|
50 |
[en] IDENTIFICATION AND EPIDEMIOLOGICAL SURVEILLANCE OF BACTERIA: WEB SYSTEM DEVELOPMENT AND EVALUATION OF INTELLIGENT METHODS / [pt] IDENTIFICAÇÃO E RASTREAMENTO EPIDEMIOLÓGICO DE BACTÉRIAS: DESENVOLVIMENTO DE SISTEMA WEB E AVALIAÇÃO DE MÉTODOS INTELIGENTES05 November 2021 (has links)
[pt] A maioria dos laboratórios não conta com um sistema informatizado para gestão dos procedimentos pertinentes a cada caso. A administração e controle das amostras é feito manualmente, através de diversas fichas que são preenchidas desde o colhimento do material biológico, no hospital, até a identificação final da bactéria no laboratório. Dessa forma, a organização das informações fica limitada, uma vez que, estando as informações escritas à mão e guardadas em livros, é quase impossível a extração de conhecimento útil que possa servir não só no apoio à decisão, como também, na formulação de simples estatísticas. Esta dissertação teve dois objetivos principais. O desenvolvimento de um sistema Web, intitulado BCIWeb (Bacterial Classification and Identification for Web), que fosse capaz de auxiliar na identificação bacteriológica e prover a tecnologia necessária para a administração e controle de amostras clínicas oriundas de hospitais. E a descoberta de conhecimento na base de dados do sistema, através da mineração de dados utilizando os métodos de Mapas Auto-Organizáveis (SOM: Self-Organizing Maps) e Redes Multilayer Perceptrons (MLP) para classificação e identificação de bactérias. A partir do desenvolvimento desta ferramenta amigável, no estudo de caso, os dados históricos do LDCIC (Laboratório de Difteria e Corinebactérias de Importância Clínica) do Departamento de Biologia da UERJ foram inseridos no sistema. Os métodos inteligentes propostos para classificação e identificação de bactérias foram analisados e apresentaram resultados promissores na área. / [en] Most laboratories do not have a computerized system for management procedures. The administration and control of the samples are made manualy through many forms of data sheets which are filled from the beginning, when the samples of biological materials are gathered at the hospital, up to the final identification at the laboratory. In this context, the organization of the information become very limited, while the information writting by hands and stored in books, its almost impossible to extract useful knowledge, which could help not only supporting decisions but also in the formulations of simples statistics. This thesis had two objectives. The development of a web system called BCIWeb (Bacterial Classifiation and Identification for Web) that could assist in bacterial identification and provide the technology necessary for the administration and control of clinical specimen coming from the hospitals and the discovery of knowledge in database system, through data mining methods using SOM (Self Organizing Maps) and Multilayer Perceptron Neural Networks (MLP) for classification and identificatin of bactéria. From the development of this friendly tool, in the case study, the historical data from LDCIC (Laboratório de Difteria e Corinebactérias de Importância Clínica) of UERJ Biology Department were entered into the system. The proposed intelligent methods for classification and identification of bacteria were analysed and showed promising results.
|
Page generated in 0.0467 seconds