1 |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA / [pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOSBERNARDO PEREIRA NUNES 14 October 2009 (has links)
[pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui. / [en] The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.
|
2 |
[en] COMPARING AUTOMATIC IMAGE CLASSIFICATION TECHNIQUES OF REMOTE SENSING IMAGES / [pt] ANÁLISE COMPARATIVA DE TÉCNICAS DE CLASSIFICAÇÃO AUTOMÁTICA DE IMAGENS DE SENSORIAMENTO REMOTOLEONARDO VIDAL BATISTA 22 August 2006 (has links)
[pt] Neste trabalho, diversas técnicas de classificação
automática de imagens de sensoriamento remoto são
investigadas. Na análise, incluem-se um método não-
paramétrico, denominado K-Médias. Adaptativos Hierárquico
(KMAH), e seis paramétricos: o Classificador de Máxima
Verossimilhança (MV), o de Máxima Probabilidade a
Posteriori (MAP), o MAP Adaptativo (MAPA), por Subimagens
(MAPSI), o Contextual Tilton-Swain (CXTS) e o Contextual
por Subimagens (CXSI). O treinamento necessário à
implementação das técnicas paramétricas foi realizado de
forma não-supervisionada, usando-se para tanto a
classificação efetuada pelo KMAH. Considerações a respeito
das vantagens e desvantagens dos classificadores, de
acordo com a observação das taxas de erros e dos tempos de
processamento, apontaram as técnicas MAPA e MAPSI com as
mais convenientes / [en] In this thesis, several techniques of automatic
classfication of remote sensing impeages are investigated.
Included in the analysis are ane non-parametric method,
known as Adaptative hierarchical K-means (KMAH), and six
parametric ones: the Maximum Likelihood (MV), the Maximum
a Posteriori Probability (MAP), the Adaptative MAP (MAPA),
the Subimages MAP (MAPSI), the tilton-Swain Contextual,
(CXTS) and the Subimages Contextual (CXSI) classifiers.
The necessary training for the parametric case was done in
a non-supervised form, by using the KMAH classification.
Considerations about the advantages and disadvantages of
the classifiers were made and, based on the observation of
the error rates and processing time, the MAPA and MAPSI
have shown the best performances.
|
3 |
[en] PRODUCT OFFERING CLASSIFICATION / [pt] CLASSIFICAÇÃO DE OFERTAS DE PRODUTOSFELIPE REIS GOMES 26 February 2014 (has links)
[pt] Este trabalho apresenta o EasyLearn, um framework para apoiar o desenvolvimento de aplicações voltadas ao aprendizado supervisionado. O EasyLearn define uma camada intermediaria, de simples configuração e entendimento, entre a aplicação e o WEKA, um framework de aprendizado de máquina criado pela Universidade de Waikato. Todos os classificadores e filtros implementados pelo WEKA podem ser facilmente encapsulados para serem utilizados pelo EasyLearn. O EasyLearn recebe como entrada um conjunto de arquivos de configuração no formato XML contendo a definição do fluxo de processamento a ser executado, além da fonte de dados a ser processada, independente do formato. Sua saída é adaptável e pode ser configurada para produzir, por exemplo, relatórios de acurácia da classificação, a própria da fonte de dados classificada, ou o modelo de classificação já treinado. A arquitetura do EasyLearn foi definida após a análise detalhada dos processos de classificação, permitindo identificar inúmeras atividades em comum entre os três processos estudados aprendizado, avaliação e classificação). Através desta percepção e tomando as linguagens orientadas a objetos como inspiração, foi criado um framework capaz de comportar os processos de classificação e suas possíveis variações, além de permitir o reaproveitamento das configurações, através da implementação de herança e polimorfismo para os seus arquivos de configuração. A dissertação ilustra o uso do framework criado através de um estudo de caso completo sobre classificação de produtos do comércio eletrônico, incluindo a criação do corpus, engenharia de atributos e análise dos resultados obtidos. / [en] This dissertation presents EasyLearn, a framework to support the development of supervised learning applications. EasyLearn dfines an intermediate layer, which is easy to configure and understand, between the application and WEKA, a machine learning framework created by the University of Waikato. All classifiers and filters implemented by WEKA can be easily encapsulated to be used by EasyLearn. EasyLearn receives as input a set of configuration files in XML format containing the definition of the processing flow to be executed, in addition to the data source to be classified, regardless of format. Its output is customizable and can be configured to produce classification accuracy reports, the classified data source, or the trained classification model. The architecture of EasyLearn was defined after a detailed analysis of the classification process, which identified a set of common activities among the three analyzed processes (learning, evaluation and classification). Through this insight and taking the object-oriented languages as inspiration, a framework was created which is able to support the classification processes and its variations, and which also allows reusing settings by implementing inheritance and polymorphism in their configuration files. This dissertation also illustrates the use of the created framework presenting a full case study about e-commerce product classification, including corpus creation, attribute engineering and result analysis.
|
4 |
[en] AN APPROACH TO OPERATIONALIZE REGULATIVE NORMS IN MULTIAGENT SYSTEMS / [pt] UMA ABORDAGEM PARA OPERACIONALIZAR NORMAS REGULATIVAS EM SISTEMAS MULTIAGENTESCAROLINA HOWARD FELICISSIMO 27 January 2009 (has links)
[pt] Um grande desafio na pesquisa de sistemas multiagentes (SMA)
é a concepção
e implementação de SMA abertos em que normas podem ser
eficazmente
aplicadas aos seus agentes e facilmente gerenciadas. Estas
tarefas são
árduas porque normas são usualmente escritas para propósitos
gerais, dificultando
uma regulação mais precisa. A motivação para esta pesquisa
surgiu diante
da necessidade de resolver este desafio, proporcionando uma
abordagem aplicável
em sistemas abertos. Nesses sistemas, heterogeneidade e
autonomia
excluem qualquer hipótese relativa à forma com que entidades
de terceiros são
implementadas e como se comportam. Assim, uma solução viável
para regulação
em SMA abertos não deve ser rigidamente codificada dentro
das implementações
originais de agentes e deve permitir, a um certo grau de
precisão e
flexibilidade, atualizar dados (e.g., normas) durante a
execução do sistema. Nesta
tese, nossa abordagem DynaCROM para lidar com normas em SMA
abertos é
apresentada. Da perspectiva individual de agentes, DynaCROM
é um mecanismo
informativo que torna agentes da aplicação cientes das
normas as quais eles
estão vinculados em um determinado momento. Da perspectiva
de desenvolvedores
do sistema, DynaCROM é uma metodologia para aplicação e
gerenciamento
de normas em SMA abertos de tal modo que desenvolvedores
sejam capazes
de incorporar em normas abstratas valores de domínio.
Portanto, normas
são contextualizadas no domínio de aplicação onde elas são
válidas, facilitando
regulação. Considerando que um SMA regulado deve ter suas
normas respeitadas,
apresentamos também a integração de DynaCROM com dois mecanismos
distintos de cumprimento de normas. Em resumo, o resultado
dessa tese é nossa
abordagem DynaCROM que operacionaliza normas regulativas em SMA. / [en] A major challenge in the research of multiagent systems
(MAS) is the design
and implementation of open MAS in which norms can be
effectively applied
to their agents and easily managed. These tasks are arduous
because norms are
usually written for general purposes, hindering a more
precise regulation. The
motivation for this research came forth from the need to
resolve this challenge,
providing an approach applicable in open systems. In such
systems, heterogeneity
and autonomy rule out any assumption concerning the way
third-party entities
are implemented and behaved. A viable solution for
regulation in open MAS
should not be hard coded inside agents` original
implementations and must allow,
for some degree of precision and flexibility, to update data
(e.g., norms) during
the system execution. In this thesis, our DynaCROM approach
for dealing with
norms in open MAS is presented. From the individual agents
perspective, Dyna-
CROM is an information mechanism that makes application
agents aware of the
norms they are bound to at a given moment. From the system
developers perspective,
DynaCROM is a methodology for the application and management of
norms in open MAS so developers are able to embody abstract
norms with domain
values. Therefore, norms are contextualized in the
application domain
wherein they hold, facilitating regulation. Considering that
a regulated MAS
should have its norms enforced, the integration of DynaCROM
with two distinct
enforcement mechanisms is also presented. In summary, the
result of this thesis
is our DynaCROM approach, which operationalizes regulative
norms in MAS.
|
5 |
[en] RANKING OF WEB PAGES BY LEARNING MULTIPLE LATENT CATEGORIES / [pt] CLASSIFICAÇÃO DE PÁGINAS WEB POR APRENDIZAGEM DE MÚLTIPLAS CATEGORIAS LATENTESFRANCISCO BENJAMIM FILHO 17 May 2012 (has links)
[pt] O crescimento explosivo e a acessibilidade generalizada da World Wide
Web (WWW) levaram ao aumento da atividade de pesquisa na área da
recuperação de informação para páginas Web. A WWW é um rico e imenso
ambiente em que as páginas se assemelham a uma comunidade grande de
elementos conectada através de hiperlinks em razão da semelhança entre
o conteúdo das páginas, a popularidade da página, a autoridade sobre o
assunto e assim por diante, sabendo-se que, em verdade, quando um autor
de uma página a vincula à outra, está concebendo-a como importante
para si. Por isso, a estrutura de hiperlink da WWW é conhecida por
melhorar significativamente o desempenho das pesquisas para além do uso
de estatísticas de distribuição simples de texto. Nesse sentido, a abordagem
Hyperlink Induced Topic Search (HITS) introduz duas categorias básicas
de páginas Web, hubs e autoridades, que revelam algumas informações
semânticas ocultas a partir da estrutura de hiperlink. Em 2005, fizemos uma
primeira extensão do HITS, denominada de Extended Hyperlink Induced
Topic Search (XHITS), que inseriu duas novas categorias de páginas Web,
quais sejam, novidades e portais. Na presente tese, revisamos o XHITS,
transformando-o em uma generalização do HITS, ampliando o modelo
de duas categorias para várias e apresentando um algoritmo eficiente de
aprendizagem de máquina para calibrar o modelo proposto valendo-se de
múltiplas categorias latentes. As descobertas aqui expostas indicam que a
nova abordagem de aprendizagem fornece um modelo XHITS mais preciso.
É importante registrar, por fim, que os experimentos realizados com a coleção ClueWeb09 25TB de páginas da WWW, baixadas em 2009, mostram que o XHITS pode melhorar significativamente a eficácia da pesquisa Web e produzir resultados comparáveis aos do TREC 2009/2010 Web Track,
colocando-o na sexta posição, conforme os resultados publicados. / [en] The rapid growth and generalized accessibility of the World Wide Web
(WWW) have led to an increase in research in the field of the information
retrieval for Web pages. The WWW is an immense and prodigious environment
in which Web pages resemble a huge community of elements. These
elements are connected via hyperlinks on the basis of similarity between the
content of the pages, the popularity of a given page, the extent to which the
information provided is authoritative in relation to a given field etc. In fact,
when the author of a Web page links it to another, s/he is acknowledging
the importance of the linked page to his/her information. As such the hyperlink
structure of the WWW significantly improves research performance
beyond the use of simple text distribution statistics. To this effect, the HITS
approach introduces two basic categories of Web pages, hubs and authorities
which uncover certain hidden semantic information using the hyperlink
structure. In 2005, we made a first extension of HITS, called Extended Hyperlink
Induced Topic Search (XHITS), which inserted two new categories
of Web pages, which are novelties and portals. In this thesis, we revised the
XHITS, transforming it into a generalization of HITS, broadening the model
from two categories to various and presenting an efficient machine learning
algorithm to calibrate the proposed model using multiple latent categories.
The findings we set out here indicate that the new learning approach
provides a more precise XHITS model. It is important to note, in closing,
that experiments with the ClueWeb09 25TB collection of Web pages,
downloaded in 2009, demonstrated that the XHITS is capable of significantly
improving Web research efficiency and producing results comparable
to those of the TREC 2009/2010 Web Track.
|
6 |
[pt] NOME DE PRODUTO, MARCA DE PESSOA: CONSUMO, PUBLICIDADE E CLASSIFICAÇÃO / [en] PRODUCT S NAME, PERSON S BRAND: CONSUMPTION, ADVERTISING AND CLASSIFICATIONJULIANA LOURENCO DA SILVA LOPES 01 February 2006 (has links)
[pt] Um levantamento apoiado nos dados do Social Security
Administration
chamou a atenção para um curioso fenômeno: crianças
cujos
nomes são marcas de
produtos conhecidos no mercado. Os resultados mostram
que,
na sociedade
americana, já adquire certa relevância estatística o
fato
de seres humanos
receberem nomes pessoais tais como: Armani, Porsche,
L`Oreal ou Pepsi. Uma
pesquisa similar realizada para esta dissertação baseou-
se
na lista telefônica e em
cartórios do registro civil de todo o país e permitiu
constatar a ocorrência deste
fenômeno também no Brasil. O objetivo do trabalho é
investigar esse
acontecimento, que pode ser considerado um caso limite
da
inserção de elementos
do consumo como forma de classificação. Através de
entrevistas, realizadas com
pessoas nomeadas por produtos, foi possível obter
relatos
que permitiram
aprofundar determinados aspectos dessa nova lógica
social,
na qual marcas podem
se tornar nomes de seres humanos. Procurou-se, portanto,
examinar esta forma de
identificação radical entre produtos e pessoas, o
sistema
classificatório que daí
deriva e o papel que a publicidade desempenha nesse
processo. / [en] A survey based on the Social Security Administration data
called the
attention for a curious phenomenon: children whose names
are product s brands
well-known in the market. The result shows that, in the
American society, it
already has certain statistic relevance the fact that
babies are being named after
brands such as: Armani, Porsche, L Oreal or Pepsi. A
similar research, conducted
for this dissertation, was based on the yellow pages and
civil register offices from
all over the country, which allowed us to establish the
occurrence of this
phenomenon also in Brazil. The purpose of this work is to
investigate the event,
which can be considered a limit case of the insertion of
consumption elements as a
form of classification. Through interviews with people
whose inspiration for
nomination were products, it was possible to collect
stories that allowed us to
deepen determined aspects of this new social logic, in
which brands can become
names of human beings. It was sought to examine this
radical form of
identification between products and people, the
classificatory system that
derivates from it and the role that the advertising plays
in this process.
|
7 |
[pt] CLASSIFICAÇÃO DE SENTIMENTO PARA NOTÍCIAS SOBRE A PETROBRAS NO MERCADO FINANCEIRO / [en] SENTIMENT ANALYSIS FOR FINANCIAL NEWS ABOUT PETROBRAS COMPANYPAULA DE CASTRO SONNENFELD VILELA 21 December 2011 (has links)
[pt] Hoje em dia, encontramos uma grande quantidade de informações na internet,
em particular, notícias sobre o mercado financeiro. Diversas pesquisas
mostram que notícias sobre o mercado financeiro possuem uma grande relação com variáveis de mercado como volume de transações, volatilidade e preço
das ações. Nesse trabalho, investigamos o problema de Análise de Sentimentos
de notícias jornalísticas do mercado financeiro. Nosso objetivo é classificar
notícias como favoráveis ou não a Petrobras. Utilizamos técnicas de Processamento
de Linguagem Natural para melhorar a acurácia do modelo clássico de
saco-de-palavras. Filtramos frases sobre a Petrobras e inserimos novos atributos
linguísticos, tanto sintáticos como estilísticos. Para a classifição do sentimento
é utilizado o algoritmo de aprendizado Support Vector Machine, sendo
aplicados ainda quatro seletores de atributos e um comitê dos melhores modelos.
Apresentamos aqui o Petronews, um corpus com notícias em português
sobre a Petrobras, anotado manualmente com a informação de sentimento.
Esse corpus é composto de mil e cinquenta notícias online de 02/06/2006 a
29/01/2010. Nossos experimentos mostram uma melhora de 5.29 por cento
com relação ao modelo saco-de-palavras, atingindo uma acurácia de 87.14 por cento. / [en] A huge amount of information is available online, in particular regarding
financial news. Current research indicate that stock news have a strong
correlation to market variables such as trade volumes, volatility, stock prices
and firm earnings. Here, we investigate a Sentiment Analysis problem for
financial news. Our goal is to classify financial news as favorable or unfavorable
to Petrobras, an oil and gas company with stocks in the Stock Exchange
market. We explore Natural Language Processing techniques in a way to
improve the sentiment classification accuracy of a classical bag of words
approach. We filter on topic phrases for each Petrobras related news and build
syntactic and stylistic input features. For sentiment classification, Support
Vector Machines algorithm is used. Moreover we apply four feature selection
methods and build a committee of SVM models. Additionally, we introduce
Petronews, a Portuguese financial news annotated corpus about Petrobras.
It is composed by a collection of one thousand and fifty online financial news
from 06/02/2006 to 01/29/2010. Our experiments indicate that our method
is 5.29 per cent better than a standard bag-of-words approach, reaching 87.14 per cent
accuracy rate for this domain.
|
8 |
[en] SMOOTH TRANSITION LOGISTIC REGRESSION MODEL TREE / [pt] MODELO DE REGRESSÃO LOGÍSTICA COM TRANSIÇÃO SUAVE ESTRUTURADO POR ÁRVORE (STLR-TREE)RODRIGO PINTO MOREIRA 11 May 2009 (has links)
[pt] Este trabalho tem como objetivo principal adaptar o modelo STR-Tree, o qual é a combinação de um modelo Smooth Transition Regression com Classification and Regression Tree (CART), a fim de utilizá-lo em Classificação. Para isto algumas alterações foram realizadas em sua forma estrutural e na estimação. Devido ao fato de estarmos fazendo classificação de variáveis dependentes binárias, se faz necessária a utilização das técnicas empregadas em Regressão Logística, dessa forma a estimação dos parâmetros da parte linear passa a ser feita por Máxima Verossimilhança. Assim o modelo, que é paramétrico não-linear e estruturado por árvore de decisão, onde cada nó terminal representa um regime os quais têm seus parâmetros estimados da mesma forma que em uma Regressão Logística, é denominado Smooth Transition Logistic Regression-Tree (STLR-Tree). A inclusão dos regimes, determinada pela divisão dos nós da árvore, é feita baseada em testes do tipo Multiplicadores de Lagrange, que em sua forma para o caso Gaussiano utiliza a Soma dos Quadrados dos Resíduos em suas estatísticas de teste, aqui são substituídas pela Função Desvio (Deviance), que é equivalente para o caso dos modelos não Gaussianos, cuja distribuição da variável dependente pertença à família exponencial. Na aplicação a dados reais selecionou-se dois conjuntos das variáveis explicativas de cada uma das duas bases utilizadas, que resultaram nas melhores taxas de acerto, verificadas através de Tabelas de Classificação (Matrizes de Confusão). Esses conjuntos de variáveis foram usados com outros métodos de classificação existentes, são eles: Generalized Additive Models (GAM), Regressão Logística, Redes Neurais, Análise Discriminante, k-Nearest Neighbor (K-NN) e Classification and Regression Trees (CART). / [en] The main goal of this work is to adapt the STR-Tree model, which is the combination of a Smooth Transition with Regression model with Classi cation and Regression Tree (CART), in order to use it in Classification. Some changes were made in its structural form and in the estimation. Due to the fact we are doing binary dependent variables classification, is necessary to use the techniques employed in Logistic Regression, so the estimation of the linear part will be made by Maximum Likelihood. Thus the model, which is nonlinear parametric and structured by a decision tree, where each terminal node represents a regime that have their parameters estimated in the same way as in a Logistic Regression, is called Smooth Transition Logistic Regression Tree (STLR-Tree). The inclusion of the regimes, determined by the splitting of the tree's nodes, is based on Lagrange Multipliers tests, which for the Gaussian cases uses the Residual Sum-of-squares in their test statistic, here are replaced by the Deviance function, which is equivalent to the case of non-Gaussian models, that has the distribution of the dependent variable in the exponential family. After applying the model in two datasets chosen from the bibliography comparing with other methods of classi cation such as: Generalized Additive Models (GAM), Logistic Regression, Neural Networks, Discriminant Analyses, k-Nearest Neighbor (k-NN) and Classification and Regression Trees (CART). It can be seen, verifying in the Classification Tables (Confusion Matrices) that STLR-Tree showed the second best result for the overall rate of correct classification in three of the four applications shown, being in all of them, behind only from GAM.
|
9 |
[en] NEURAL NETWORKS FOR PREDICTIVE MAINTENANCE ON OFF-HIGWAY TRUCKS / [pt] REDES NEURAIS NA MANUTENÇÃO PREDITIVA DE CAMINHÕES FORA DE ESTRADAFELIPE MIANA DE FARIA FURTADO 27 May 2010 (has links)
[pt] Com o aumento da demanda por minério no mundo, a complexidade, o tamanho e
o preço dos equipamentos de extração mineral aumentaram consideravelmente. Como
estas máquinas possuem uma tecnologia de monitoramento embarcada no equipamento, a
utilização desses dados para o aumento da confiabilidade e da disponibilidade do
equipamento tornou-se fundamental, de modo a reduzir os custos de manutenção. O
objetivo desta dissertação foi desenvolver um modelo de apoio à decisão de parada de
equipamento, baseado na classificação por Redes Neurais Artificiais de padrões pré-falha
de caminhões fora de estrada. O modelo proposto tem como objetivo identificar o estado
de falha, ou padrão pré-falha de um equipamento, utilizando os dados armazenados nos
equipamentos e seus respectivos registros de falha, para que seja possível avaliar o risco
de falha deste equipamento e decidir se o mesmo deve ser parado ou aguardar uma nova
parada programada. Essa dissertação foi desenvolvida em quatro partes: estudo dos
principais modelos de manutenção atualmente utilizados; definição e desenvolvimento do
modelo para abordar o problema, baseado em redes neurais artificiais; avaliação de
desempenho do modelo proposto; e simulação do downtime da máquina utilizando o
modelo de decisão proposto. No estudo dos principais modelos foi realizada uma
pesquisa bibliográfica sobre a evolução da manutenção, passando por modelos de
manutenção corretiva, manutenção preventiva e, por fim, chegando ao modelo de
manutenção baseada no monitoramento de condições. Para os dois últimos tipos de
manutenção, foram apresentados os principais modelos utilizados na abordagem do
problema, seus benefícios e deficiências. O desenvolvimento do modelo foi segmentado
em três etapas principais: tratamento das bases de dados, tanto de dados obtidos
diretamente do equipamento quanto das bases de registro de falha dos equipamentos;
seleção de variáveis, baseada no cálculo da influência de cada sensor do equipamento na
determinação de seu estado de falha, assim como na definição do intervalo ideal para se
agrupar os dados; e definição da topologia das redes. Na etapa de avaliação do
desempenho do modelo proposto foram utilizados dados de falhas corretivas mais
recorrentes para os dois componentes específicos de caminhões fora de estrada: motor e
transmissão, sendo que o monitoramento eletrônico do motor é mais extenso do que o de
transmissão, no que diz respeito ao número de sensores empregados no monitoramento.
Para a comparação de desempenho entre os diferentes modelos avaliados, dois fatores
tiveram maior relevância: melhor desempenho na classificação e maior intervalo entre a
identificação do padrão pré-falha e a ocorrência da falha. Os resultados de classificação
dos padrões pré-falha foram bastante satisfatórios para a maioria dos casos de estudos,
com as taxas de acerto variando entre 85% e 95%. A partir do modelo de classificação
determinado na etapa anterior, passou-se à simulação de diferentes cenários de falhas,
calculando-se os tempos de máquina parada (downtimes) que teriam sido evitados se as
intervenções definidas pelo modelo tivessem sido executadas, analisando-se, assim, o
aumento de disponibilidade proporcionado pelo uso do modelo proposto. / [en] With the increasing demand for ore in the world, the complexity, size and price of
mining equipment have increased considerably. As these machines have embedded
monitoring technology, the use of such data to increase the reliability and availability of
the equipment has become essential in order to reduce maintenance costs. The objective
of this work is developing a model that supports the decision of stopping an equipment,
based on its actual state, using pattern recognition by neural networks. The proposed
model aims to identify the state of equipment failure or pre-failure based on the data
stored in the equipment and on the records of failure, so as to assess the risk of failure of
equipment and to decide whether it should be stopped or wait for a new programmed
shutdown. This dissertation was developed in four parts: study of the main models
currently used for maintenance; design and implementation of the model to address this
problem, based on artificial neural networks; performance evaluation of the proposed
model; and simulation of equipment downtime using the proposed model. In the study of
the main models a research was made about the evolution of maintenance techniques,
through models of corrective maintenance, preventive maintenance and, finally, reaching
the maintenance model based on condition monitoring. For the last two types of
maintenance, it is presented the main models used in addressing the problem, its benefits
and shortcomings. The development of the model was segmented into three main stages:
processing of databases, from the data obtained directly from the equipment to the base of
record of equipment failure; variable selection, based on the calculation of the influence
of each equipment sensor to determine its failure state, as well as the definition of the
ideal range of group data, and definition of the topology of networks. In the stage of
assessing the performance of the proposed model we used data from corrective failures
more often of two specific components of off-highway trucks: engine and
transmission. To compare the performance between the different models evaluated, two
factors were more important: classification performance and the longest interval between
the identification of a pre-failure pattern and the occurrence of the failure. The results of
classification of pre-failure patterns were quite satisfactory for most case studies, with hit
rates ranging between 85% and 96%. From the classification model given in the previous
step, we moved on to simulate different failure scenarios, calculating the equipment
downtime that would have been avoided if the interventions defined by the model had
been implemented, thus analyzing the increased availability provided by the use of the
proposed model.
|
10 |
[en] FAMILY BUSINESS CLASSIFICATION BY FAMILINESS / [pt] CLASSIFICAÇÃO DE EMPRESAS FAMILIARES DE ACORDO COM A FAMILIARIDADEANDRE DE LIMA FALCAO 05 July 2010 (has links)
[pt] O presente estudo propõe uma taxonomia para empresas familiares e
pretende contribuir para estimular o desenvolvimento das pesquisas nacionais
nesse campo. Para isso, as empresas são agrupadas de acordo com o grau de
interação e influência exercida pela família, ou familiness, através das dimensões
Poder, Experiência e Cultura. Para realizar a pesquisa, utilizou-se uma adaptação
da escala de influência familiar F-PEC (Familiness-Power, Experience, and
Culture), introduzida por Astrachan, Klein e Smyrnios (2002), de onde foram
extraídos os três constructos teóricos utilizados como as dimensões determinantes
das classes desenvolvidas. Nesse sentido, as subescalas Poder, Experiência e
Cultura formaram 27 possíveis classes, posteriormente buscadas na amostra, tendo
em vista que elas medem a influência familiar no que diz respeito à propriedade,
gestão, sucessão, dedicação e sinergia de valores empresa/família. Para isso,
foram coletados dados a partir de um questionário respondido pelos principais
membros diretores de empresas brasileiras consideradas familiares por seus
respondentes. Em uma segunda etapa, a partir das variáveis da pesquisa, foi
realizada uma análise estatística de fatores que confirma as dimensões teóricas e
fortalece a ideia de que a escala F-PEC pode ser empregada na indústria brasileira.
Em seguida, uma análise hierárquica de clusters apontou cinco grupos diferentes
de empresas encontrados na amostra, confirmados na análise de K-means clusters.
Diante dos dados, os resultados finais sugerem ser possível existir uma associação
entre a quantidade de funcionários da empresa e o grupo ao qual pertence. / [en] This study proposes a family business taxonomy and is intended to
contribute stimulating the development of Brazilian researches in this field of
knowledge. On that account, the firms are grouped by the degree of influence and
interaction casted by the family, or familiness, through Power, Experience and
Culture dimensions. To accomplish the research, has been used an adaptation of
the F-PEC (Familiness-Power, Experience, and Culture) family influence scale,
introduced by Astrachan, Klein e Smyrnios (2002), from where the three
constructs has been extracted and used as dimensions of developed taxa. In this
way, the Power, Experience and Culture subscales formed 27 possible taxa,
searched in the sample afterward, since it measures the family influence by
ownership, management, succession, dedication and synergy of firm/family
values. On that account, data has been collected by a questionnaire answered by
CEOs of Brazilian firms taken as family firms by then. In a second stage, a factor
analysis has been executed from the research variables that assures the theoretical
dimensions and strengthen the idea of the use of the F-PEC scale on Brazilian
industry. Next, a hierarchical cluster analysis showed five different groups of
firms found in the sample and confirmed by the K-Means cluster analysis. The
final results suggests to be possible the existence of an association between the
number of employees of the firm and the cluster it belongs.
|
Page generated in 0.0569 seconds