121 |
Extração e mineração de informação independente de domínios da web na língua portuguesa / Extraction and mining domain independent information from web in portuguesePires, Julio Cesar Batista 08 May 2015 (has links)
Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2015-10-21T14:08:06Z
No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-22T13:08:50Z (GMT) No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-10-22T13:08:50Z (GMT). No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2015-05-08 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Many people are constantly connected on the Web. They are looking for all kinds of
things. The Web is a huge source of information. So, they can find almost everything
they want. However, Web information is disorganized and have no formal structure. This
hampers machine processing and consequently makes information access more difficult.
Bringing structure to the Web can be one of the key points for facilitating user searching
and navigation. A recent technique, Open Information Extraction, has been successfully
applied to extract structured information from the Web. This technique has been mostly
applied in pages written in English. This work is specifically focused on information
extraction for Portuguese. Techniques used here can be also used to other languages too. / Muitas pessoas estão constantemente conectadas na Web. Elas estão procurando por todo
tipo de coisa. A Web é uma enorme fonte de informação. Assim, as pessoas podem
encontrar praticamente tudo que elas precisam. Entretanto, as informações da Web são
desorganizadas e não possuem uma estrutura formal. Isso dificulta o processamento das
máquinas e consequentemente torna o acesso à informaçã mais difícil. Trazer estrutura
para a Web pode ser um dos pontos chave para facilitar a busca e navegaçã dos usuários.
Uma técnica recente, Extração de Informação Aberta, foi aplicada com sucesso para
extrair informação da Web. Essa técnica foi aplicada principalmente em páginas em
Inglês. Este trabalho é focado especificamente na extração de informação em Português.
As técnicas usadas aqui também podem ser utilizadas para outras linguagens.
|
122 |
[en] A GRAPH-MINING BASED METHOD FOR SEGMENTATION AND COUNTING OF LOCAL MAXIMUM CLUSTERS IN DIGITAL IMAGES / [pt] UM MÉTODO BASEADO EM MINERAÇÃO DE GRAFOS PARA SEGMENTAÇÃO E CONTAGEM DE CLUSTERS DE MÁXIMOS LOCAIS EM IMAGENS DIGITAISGEISA MARTINS FAUSTINO 19 August 2011 (has links)
[pt] Uma imagem monocromática pode ser interpretada como uma superfície topológica e desta forma objetos de interesse podem aparecer como picos (sharp mountains), domos (smooth hills) ou vales (V- or U-shaped). Um domo geralmente contém vários pontos de máximo locais em seu topo. Logo, fica bem caracterizado por um cluster de máximos locais. Segmentar individualmente objetos em imagens onde estes aparecem parcialmente sobrepostos ou fortemente agrupados é um problema que métodos clássicos de segmentação podem não solucionar adequadamente. Outro problema é contar objetos idênticos em imagens perviamente segmentada. Esta tarefa, quando executada manualmente, devido ao cansaço visual exige um grande esforço humano. É tediosa, demorada, além de gerar resultados subjetivos. O presente trabalho propõe um novo método para segmentação e contagem de clusters de máximos locais em uma imagem digital através uma abordagem baseada em grafos. Utilizando a informação de luminância, a imagem é representada por um grafo de adjacências e um algoritmo de mineração é utilizado para segmentar os clusters. Por fim, de acordo com características da imagem, um algoritmo de clusterização pode ser incorporado ao processo para melhorar o resultado final. A contagem dos objetos é um resultado direto do algoritmo de mineração e de clusterização, quando este último é aplicado. O método proposto é tolerante a variações no tamanho e forma dos objetos e é facilmente parametrizado para lidar com diferentes grupos de imagens provenientes de objetos distintos. Testes executados em uma base de dados com 262 imagens, composta de imagens de objetos reais (grupo 1) e de células tronco embrionárias em imagens de microscopia fluorescente (grupo 2), atestam a eficiência e qualidade do método desenvolvido no que diz respeito a segmentação e a contagem. Os resultados gerados para as imagens do grupo 1 foram validados pela autora e os do grupo 2 pelos biólogos do Instituto de Ciências Biomédicas da Universidade Federal do Rio de Janeiro. Para estas imagens foram obtidas uma F-measuare média de 85,33% e 90,88%, respectivamente. Por fim, um estudo comparativo com o algoritmo clássico de watershed foi realizado. Este alcançou uma F-measuare média de 74.02% e 78,28% para os grupos 1 e 2, respectivamente, contra 85,33% e 91,60% obtido pelo método proposto. / [en] A grayscale image can be viewed as a topological surface and this way, objects
of interests may appear as peaks (sharp mountains), domes (smooth hills) or
valleys (V- or U-shaped). Generally, the dome top presents more than one local
maximum. Thus, it can be characterized by a local maximum cluster. Segmenting
objects individually in images where they appear partially or totally fused is
a problem which frequently may not be solved by a watershed segmentation
or a basic morphological processing of images. Other issue is counting similar
objects in images segmented beforehand. Counting them manually is a tedious
and time-consuming task, and its subjective nature can lead to a wide variation
in the results. This work presents a new method for segmenting and counting
of local maximum clusters in digital images through a graph-based approach.
Using the luminance information, the image is represented by a region adjacency
graph and a graph-mining algorithm is applied to segment the clusters. Finally,
according to image characteristics, a graph-clustering algorithm can be added
to the process to improve the final result. The object counting step is a direct
result from the mining algorithm and the clustering algorithm, when the latter
is applied. The proposed method is tolerant to variations in object size and
shape and can easily be parameterized to handle different image groups resulting
from distinct objects. Tests made on a database with 262 images, composed of
photographs of objects (group 1) and embryonic stem cells under fluorescence
microscopy images (group 2), attest the effectiveness and quality of the proposed
method as for segmentation and counting purpose. The images form group 1
processed by our method were checked by the author and those ones from group
2 by the specialists from the Institute of Biomedical Sciences at UFRJ. For these
images we obtained an average F-measure of 85.33% and 90.88%, respectively.
Finally, a comparative study with the widely used watershed algorithm was done.
The watershed achieved an average F-measure of 74.02% e 78.28% for groups 1
and 2, respectively, against 85.33% e 91.60% obtained by our method.
|
123 |
[en] HIBRID NEURO-FUZZY-GENETIC SYSTEM FOR AUTOMATIC DATA MINING / [pt] SISTEMA HÍBRIDO NEURO-FUZZY-GENÉTICO PARA MINERAÇÃO AUTOMÁTICA DE DADOSMANOEL ROBERTO AGUIRRE DE ALMEIDA 20 August 2004 (has links)
[pt] Esta dissertação apresenta a proposta e o desenvolvimento
de um sistema
de mineração de dados inteiramente automático. O objetivo
principal é criar um
sistema que seja capaz de realizar a extração de
informações obscuras a partir
de bases de dados complexas, sem exigir a presença de um
especialista técnico
para configurá-lo. O sistema híbrido neuro-fuzzy
hierárquico com
particionamento binário (NFHB) vem apresentando excelentes
resultados em
tarefas de classificação de padrões e previsão, além de
possuir importantes
características não encontradas em outros sistemas
similares, entre elas:
aprendizado automático de sua estrutura; capacidade de
receber um número
maior de entradas abrangendo um maior número de aplicações;
e geração de
regras lingüísticas como produto de seu treinamento.
Entretanto, este modelo
ainda necessita de uma complexa parametrização inicial
antes de seu
treinamento, impedindo que o processo seja automático em
sua totalidade. O
novo modelo proposto busca otimizar a parametrização do
sistema NFHB
utilizando a técnica de coevolução genética, criando assim
um novo sistema de
mineração de dados completamente automático. O trabalho foi
realizado em
quatro partes principais: avaliação de sistemas existentes
utilizados na
mineração de dados; estudo do sistema NFHB e a determinação
de seus
principais parâmetros; desenvolvimento do sistema híbrido
neuro-fuzzy-genético
automático para mineração de dados; e o estudo de casos.
No estudo dos sistemas existentes para mineração de dados
buscou-se
encontrar algum modelo que apresentasse bons resultados e
ainda fosse
passível de automatização. Várias técnicas foram estudadas,
entre elas:
Métodos Estatísticos, Árvores de Decisão, Associação de
Regras, Algoritmos
Genéticos, Redes Neurais Artificiais, Sistemas Fuzzy e
Sistemas Neuro-Fuzzy.
O sistema NFHB foi escolhido como sistema de inferência e
extração de regras
para a realização da mineração de dados. Deste modo, este
modelo foi estudado
e seus parâmetros mais importantes foram determinados. Além
disso, técnicas
de seleção de variáveis de entradas foram investigadas para
servirem como
opções para o modelo. Ao final, foi obtido um conjunto de
parâmetros que deve
ser automaticamente determinado para a completa
configuração deste sistema. Um modelo coevolutivo genético
hierárquico foi criado para realizar com
excelência a tarefa de otimização do sistema NFHB. Desta
forma, foi modelada
uma arquitetura hierárquica de Algoritmos Genéticos (AG s),
onde os mesmos
realizam tarefas de otimização complementares. Nesta etapa,
também foram
determinados os melhores operadores genéticos, a
parametrização dos AG s, a
melhor representação dos cromossomas e as funções de
avaliação. O melhor
conjunto de parâmetros encontrado é utilizado na
configuração do NFHB,
tornando o processo inteiramente automático.
No estudo de casos, vários testes foram realizados em bases
de dados
reais e do tipo benchmark. Para problemas de previsão,
foram utilizadas séries
de carga de energia elétrica de seis empresas: Cerj, Copel,
Eletropaulo, Cemig,
Furnas e Light. Na área de classificação de padrões, foram
utilizadas bases
conhecidas de vários artigos da área como Glass Data, Wine
Data, Bupa Liver
Disorders e Pima Indian Diabetes. Após a realização dos
testes, foi feita uma
comparação com os resultados obtidos por vários algoritmos
e pelo NFHB
original, porém com parâmetros determinados por um
especialista.
Os testes mostraram que o modelo criado obteve resultados
bastante
satisfatórios, pois foi possível, com um processo
completamente automático,
obter taxas de erro semelhantes às obtidas por um
especialista, e em alguns
casos taxas menores. Desta forma, um usuário do sistema,
sem qualquer
conhecimento técnico sobre os modelos utilizados, pode
utilizá-lo para realizar mineração de banco de dados, extraindo informações e até mesmo conhecimento que podem auxiliá-lo em processos de tomada de decisão, o qual é o objetivo final de um processo de Knowledge Data Discovery. / [en] This dissertation presents the proposal and the development
of a totally
automatic data mining system. The main objective is to
create a system that is
capable of extracting obscure information from complex
databases, without
demanding the presence of a technical specialist to
configure it. The Hierarchical
Neuro-Fuzzy Binary Space Partitioning model (NFHB) has
produced excellent
results in pattern classification and time series
forecasting tasks. Additionally, it
provides important features that are not present in other
similar systems, such
as: automatic learning of its structure; ability to deal
with a larger number of input
variables, thus increasing the range of possible
applications; and generation of
linguistic rules as a result of its training process.
However, this model depends on
a complex configuration process before the training is
performed, hindering to
achieve a totally automatic system. The model proposed in
this Dissertation tries
to optimize the NFHB system parameters by using the genetic
coevolution
technique, thus creating a new automatic data mining
system. This work
consisted of four main parts: evaluation of existing
systems used in data mining;
study of the NFHB system and definition of its main
parameters; development of
the automatic hybrid neuro-fuzzy-genetic system for data
mining; and case
studies.
In the study of existing data mining systems, the aim was
to find a suitable
model that could yield good results and still be automated.
Several techniques
have been studied, among them: Statistical methods,
Decision Trees, Rules
Association, Genetic Algorithms, Artificial Neural
Networks, Fuzzy and Neuro-
Fuzzy Systems. The NFHB System was chosen for inference and
rule extraction
in the data mining process. In this way, this model was
carefully studied and its
most important parameters were determined. Moreover, input
variable selection
techniques were investigated, to be used with the proposed
model. Finally, a set
of parameters was defined, which must be determined
automatically for the
complete system configuration.
A hierarchical coevolutive genetic model was created to
execute the
system optimization task with efficiency. Therefore, a
hierarchical architecture of genetic algorithms (GAs) was
created, where the GAs execute complementary
optimization tasks. In this stage, the best genetic
operators, the GAs
configuration, the chromossomes representation, and
evaluation functions were
also determined. The best set of parameters found was used
in the NFHB
configuration, making the process entirely automatic.
In the case studies, various tests were performed with
benchmark
databases. For forecasting problems, six electric load
series were used: Cerj,
Copel, Eletropaulo, Cemig, Furnas and Light. In the pattern
classification area,
some well known databases were used, namely Glass Data,
Wine Data, Bupa
Liver Disorders and Pima Indian Diabetes. After the tests
were carried out, a
comparison was made with known models and with the original
NFHB System,
configured by a specialist.
The tests have demonstrated that the proposed model
generates
satisfactory results, producing, with an automatic process,
similar errors to the
ones obtained with a specialist configuration, and, in some
cases, even better
results can be obtained. Therefore, a user without any
technical knowledge of the
system, can use it to perform data mining, extracting
information and knowledge
that can help him/her in decision taking processes, which
is the final objective of
a Knowledge Data Discovery process.
|
124 |
[en] TEXT MINING VISUALIZATION FOR REQUIREMENTS EXTRACTION / [pt] VISUALIZAÇÃO DE TEXTO MINERADO PARA EXTRAÇÃO DE REQUISITOSADILARAIMA MARTINEZ BARRIO 19 August 2020 (has links)
[pt] Com os avanços de novas tecnologias de desenvolvimento de software, a mineração de texto tem ganho protagonismo na área de Engenharia de Requisitos (ER), já que a rede (Web) possibilita o acesso a grandes quantidades de informação. A utilização de técnicas de visualização ganha importância nesse sentido, porque permite agilizar a descoberta de conhecimento com visualizações adequadas. Neste trabalho disponibiliza-se uma estratégia para que o engenheiro de requisitos consiga acessar às visualizações desenvolvidas por pesquisas no uso de mineração para elicitação de requisitos. Uma revisão da literatura possibilitou a proposta de classificação de tarefas de mineração e visualizações associadas, especialmente na ER. Esta classificação constitui a base de conhecimento de um software (Biblioteca Digital) que organiza e filtra informações de acordo com a inter-relação entre tarefas e categorias, mostrando as pesquisas que sustentam cada relação. Para a avaliação da estratégia, com foco no software, foi executado uma avaliação que mostra o potencial da abordagem para agilizar a obtenção de conhecimentos por parte do engenheiro de requisitos. / [en] With advances in new technologies available for software development, text mining has grown in importance in the area of Requirements Engineering (ER) due to the availability of large amounts of information on the Web. The use of visualization techniques gains importance in this regard, since it allows the speedup of knowledge discovery with appropriate visualizations. This work provides a strategy for the requirements engineer to gain access, in an organized manner, to results of research in text mining with visualization in ER. For implementation, the classification of mining tasks and the visualizations categories in ER were summarized from the literature. This classification forms the knowledge base of a software (Digital Library) that organizes and filters information according to the interrelation between tasks and categories, showing the research that supports each relationship. For the evaluation of the strategy, with a focus on software, an evaluation was carried out that shows the potential of the approach to expedite the knowledge engineer s requirements.
|
125 |
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS / [pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕESGEORGES MIRANDA SPYRIDES 06 February 2024 (has links)
[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada. / [en] Novel methods for matrix factorization introduce constraints to the
decomposed matrices, allowing for unique kinds of analysis. One significant
modification is the binary matrix factorization for binary matrices. This
technique can reveal common subsets and mixing of subsets, making it useful
in a variety of applications, such as market basket analysis, topic modeling,
and recommendation systems. Despite the advantages, current approaches face
a trade-off between accuracy, scalability, and explainability. While gradient
descent-based methods are scalable, they yield high reconstruction errors
when thresholded for binary matrices. Conversely, heuristic methods are not
scalable. To overcome this, this thesis propose a post-processing procedure
for discretizing matrices obtained by gradient descent. This novel approach
recovers the reconstruction error post-thresholding and successfully processes
larger matrices within a reasonable timeframe. We apply this technique to
many applications including a novel pipeline for discovering and visualizing
patterns in petrochemical batch processes.
|
126 |
[en] ANALYSIS OF INVESTIMENTO IN BITCOIN MINING UNDER UNCERTAIN / [pt] ANÁLISE DE INVESTIMENTO DE MINERAÇÃO DE BITCOIN SOB CONDIÇÕES DE INCERTEZAHUGO DE CARLO ROCHA FILHO 12 February 2020 (has links)
[pt] O presente trabalho se propôs a efetuar uma investigação resumida do mercado de mineração de criptomoedas no Brasil e analisar a viabilidade econômica da implantação de uma fazenda de mineração de Bitcoins em território brasileiro. O estudo foi realizado em três etapas, onde foram abordadas análises
determinísticas baseadas em possíveis cenários, observação da sensibilidade do investimento em relação as principais variáveis do problema e por último a utilização de métodos estocásticos visando estimar o risco do investimento, em razão do ambiente de incerteza. Os resultados demonstram que este é um
investimento de altíssimo risco e que não existe viabilidade econômica em minerar Bitcoin no Brasil, com cotação do abaixo de US$ 10.065. O estudo aponta o custo da energia elétrica como o mais expressivo, seguido do investimento nos equipamentos de mineração e sugere que a operação seja estabelecida em países com menor custo de eletricidade, clima mais baixo e menores taxas de importação e de imposto de renda. / [en] This work carries out a brief investigation of cryptocurrencies mining market in Brazil and to analyze the economic viability of the investment in a Bitcoin mining farm in Brazil. The study was carried out in three stages, where deterministic analyzes were based on possible scenarios, observation of the sensitivity of the investment relative to the main variables of the problem and finally the use of stochastic methods to estimate the investment risk under uncertainty. The study points to the cost of electricity as the most significant,
followed by investment in mining equipment and suggests that the operation be established in countries with lower electricity costs, lower climate and lower import and income tax rates.
|
127 |
[en] RELATIONSHIP MARKETING: CROSS-SELLING ON MOBILE TELECOM / [pt] MARKETING DE RELACIONAMENTO: CROSS-SELLING NA TELEFONIA MÓVELMANOELA BRANDAO DE OLIVEIRA 20 April 2015 (has links)
[pt] Com rápido crescimento nos últimos anos, o mercado de telecomunicações está ficando cada vez mais saturado. Como a comunicação tradicional por meio de serviços de voz já é amplamente utilizada, as operadoras têm enfrentado dificuldades em atrair novos usuários. Neste cenário, as operadoras têm direcionado cada vez mais esforços nas ações de cross-selling para rentabilizar sua base de clientes, oferecendo e estimulando o uso de novos serviços. Nesta pesquisa, serão utilizados dados existentes no banco de dados de uma operadora de telefonia móvel do mercado brasileiro para testar um modelo que facilita a identificação dos clientes mais propensos à contratação de novos serviços. Os dados foram tratados por meio de técnicas de mineração de dados e árvore de decisão. Os resultados sugerem que, com base na modelagem proposta, ações de cross-selling podem ser otimizadas com o aumento da taxa de retorno e, conseqüentemente, redução no custo das abordagens e menos desgaste da base de clientes com contatos irrelevantes. / [en] Due to its fast growth in recent years, the wireless market is becoming increasingly saturated. Since traditional communication through voice services is already widely used by most individuals, wireless carriers are facing difficulties in finding and attracting new users for such services. Given this scenario, enterprises are turning their attention to cross-selling campaigns to monetize their client base, offering and stimulating the use of new services. In this research, an existent data set from a Brazilian mobile telecom carrier was used to test a model that could facilitate the identification of current customers more likely to be interested in acquiring new services. The data were analyzed and modeled via data mining and decision tree. The results suggest that, if the proposed model is used, cross-selling campaigns could be optimized, achieving an increased rate of return, reduction in the cost of contacts and less wear of the client base with irrelevant offers.
|
128 |
Aplicando a relevância da opinião de usuários em sistema de recomendação para pesquisadores / Applying user’s opinion relevance in a Recommender System to ResearchersCazella, Silvio Cesar January 2006 (has links)
As pessoas têm acesso a uma vasta gama de informações devido a grande oferta e aos recursos da Internet, porém despendem muito tempo na busca do que realmente é interessante ou útil para elas. A dificuldade de encontrar a informação correta é aumentada quando a informação disputa a atenção de uma pessoa com uma série de outras informações não tão relevantes. Procurando minimizar esta dificuldade e auxiliar no acesso a informação interessante, são aplicados desde sistemas de recuperação de informação até sistemas de filtragem de informação. Os sistemas de recuperação são amplamente difundidos na Internet através dos motores de busca (por exemplo, google.com, av.com, citeseer.ist.psu.edu), porém um problema neste tipo de aplicação constitui-se na necessidade do usuário apresentar os termos (palavras-chave) que são relevantes para a consulta. filtragem de informação, tendo como representante os Sistemas de Recomendação, surge como uma nova abordagem que procura liberar o usuário da exigência de criar consultas com palavras-chave, ou seja, a filtragem baseada em conteúdo procura casar o perfil do usuário e o conteúdo dos itens a serem recomendados, e então, oferecer alguns destes itens aos usuários. Por fim, surgiram sistemas que não se baseavam na análise do conteúdo dos itens, mas sim na reputação de um item junto aos outros usuários, ou seja, o usuário recebe a recomendação de um item que pode ser do seu interesse frente à colaboração de outros usuários que avaliaram o item. A questão maior nesta abordagem está no quanto a opinião de um usuário que avaliou um item é relevante para servir como colaboração na elaboração da recomendação para outro usuário. Esta tese constitui-se em uma proposta para modelar e incluir a relevância da opinião do usuário no processo de recomendação colaborativa, ou seja, apresenta uma abordagem de Sistemas de Recomendação para recomendar itens baseando-se em informação adicional − definida como relevância da opinião do usuário − além das típicas informações utilizadas na grande maioria dos Sistemas de Recomendação. Esta inclusão da relevância da opinião constitui-se em uma alternativa para que o usuário alvo da recomendação consiga identificar qual a importância de um determinado item recomendado frente à relevância de opinião dos recomendadores. A idéia apresentada é a de que pessoas com maior relevância de opinião poderiam melhor avaliar e recomendar itens. / Nowadays, people have access to a huge amount of information due to the Internet's resources. However they spend too much time searching for interesting, adequate or useful information. The difficulty to find worthwhile information increases when interesting things dispute the user's attention. Information retrieval and information filtering systems are applicable in order to minimize search difficulties, aiming to aid the user in the search for worthwhile information. Information retrieval systems are widely spread in the Internet through search engines (e.g., google.com, av.com, citeseer.ist.psu.edu). However there is a problem in this kind of application, which consists in compelling the user to know the terms (keywords) that are relevant for the search. Recommender Systems are an information filtering solution. They present a different approach that frees the user from creating queries with keywords. It means that the system tries to match the user's profile (historical interests) with the content of items to be recommended, and then offers these items to the user (recommendee). In parallel, an alternative approach to item recommendation was proposed, this one based on the offering of items based on other users’ opinion, i.e. the user receives an item recommendation based on the evaluation of other users (collaborative filtering or social filtering). However, a different question is raised here − how much the opinion of a user who evaluated an item is relevant to be employed in the recommendation process applying a collaborative method? This thesis presents a new approach to model and include in the collaborative recommendation process additional information named Recommender's Rank, which represents the relevance of the user's opinion and complements the typical information used in the large majority of Recommender Systems. This approach is an alternative to aid the user to identify the importance of a recommended item based on other users' opinions, as people with higher relevance of opinion are more likely to better evaluate and recommend items.
|
129 |
[en] A MULTI-CRITERIA PROCESS MINING OPTIMIZATION TOOL AND ITS APPLICATION IN A SEPSIS CLINICAL PATHWAY / [pt] FERRAMENTA DE MINERAÇÃO DE PROCESSOS MULTI-CRITÉRIOS PARA OTIMIZAÇÃO E A SUA APLICAÇÃO EM UM PROTOCOLO CLÍNICO DE SEPSERICARDO ALFREDO QUINTANO NEIRA 02 January 2019 (has links)
[pt] Sepse é considerada uma carga na saúde e na economia global. No Brasil, a sepse é a principal causa de morte em Unidades de Terapia Intensiva, bem como uma das principais causas de mortalidade hospitalar
tardia. Nesta tese, inicialmente apresenta-se um relatório epidemiológico brasileiro de sepse contemplando 10 anos utilizando dados do Sistema Único de Saúde (SUS). Em seguida, mostra-se um estudo que apoia os estabelecimentos de saúde na avaliação e otimização de seus protocolos clínicos de sepse usando técnicas de mineração de processos. Um protocolo clínico consiste em um plano de cuidados bem definido, que inclui uma ordem clara e tempo para a execução de intervenções com resultados esperados. Durante a execução deste estudo, identificou-se a falta de técnicas de mineração de processos para a otimização de protocolos clínicos. Assim, neste trabalho foi proposta, implementada e testada uma nova técnica de mineração de processos que auxilia usuários na otimização de seus processos. Esta técnica foi aplicada para a melhoria de protocolos clínicos. A técnica desenvolvida (Multi-CAT) identifica e destaca um conjunto de atividades e subsequências que promovem resultados positivos ou negativos, considerando múltiplos critérios simultâneos. A técnica foi aplicada com sucesso em um protocolo clínico de sepse, na qual foram adquiridas mais recomendações de otimização do que foi previamente obtido em análise manual. Conclui-se que a técnica desenvolvida apresenta grande potencial para auxiliar na otimização de processos com bom desempenho. No cenário de testes mais complexo, com 58 atividades, 50.000 casos e 14.451 variantes, Multi-CAT utilizou 2,04 minutos para executar a análise. Para finalizar, a ferramenta foi validada em dois processos distintos, indicando potencial para ser aplicada em outras áreas de negócio. / [en] Sepsis is considered a worldwide health and economic burden. In Brazil, sepsis is the major cause of death in Intensive Care Units, as well as, one of the main causes of late hospital mortality. In this thesis, we first
provide a 10 years population-level epidemiology report of sepsis in Brazil, using data from the Brazilian Unified Health System. Secondly, we present a research study that supports health care facilities in the evaluation and optimization of their sepsis clinical pathways (CP) using process mining techniques. A CP consists of a well-defined care plan, which includes a clear order and time for the execution of interventions with expected outcomes. During the execution of this study, it became clear for us the lack of existing process mining techniques for the optimization of CPs. Thus, we proposed, implemented and tested a novel process mining technique that supports users to improve their processes and we applied it for CP improvement. Our developed technique (Multi-CAT) identifies and highlights a set of activities and sub-sequences that provide positive or negative outcomes considering multiple simultaneous criteria. We successfully applied our technique in a real sepsis CP, and we acquired more optimization insights that we got in our previous manual analysis. We conclude that Multi-CAT has high potential to help in the optimization of processes with a good performance. In the most complex test scenario, with 58 activities, 50,000 cases and 14,451 variants, Multi-CAT took 2.04 minutes to execute the analysis. Finally, the tool was validated in two different processes, indicating potential capability to be applicable to other business areas.
|
130 |
[en] STRATEGIC IMPLICATIONS OF INTERNATIONAL ALLIANCES AND OTHER LINKAGES IN THE IRON ORE INDUSTRY: THE CASE OF VALE / [pt] IMPLICAÇÕES ESTRATÉGICAS DAS ALIANÇAS E OUTRAS LIGAÇÕES INTERNACIONAIS NA INDÚSTRIA DE MINÉRIO DE FERRO: O CASO DA VALEMARCOS HEITOR FANAIA PEREIRA 21 September 2010 (has links)
[pt] Existem diferentes teorias com relação à origem do processo de
globalização, porém temos que este fenômeno vem modificando as relações
comerciais e o ambiente de negócios nas últimas décadas em diversas indústrias.
No caso da indústria mundial de mineração, a globalização alterou o ambiente
competitivo, fazendo com que os seus (players), buscassem novas formas de
obter vantagem competitiva. Nesse cenário, a Vale, que até então não desenvolvia
atividades industriais fora do Brasil, limitando suas iniciativas de
internacionalização às exportações da sua produção de minério de ferro e pelotas,
passou a ampliar a sua atuação no mercado externo, seja através de pesquisas
minerais ou do estabelecimento de plantas industriais em diversos países do
mundo. Ao atuar de forma globalizada, a Vale passa a enfrentar novas ameaças e
ter acesso a novas oportunidades para maximizar os seus resultados. Nesse
sentido, esta pesquisa tem como objetivo avaliar se as alianças e outras ligações
internacionais estratégicas (ex: fusões e aquisições) estabelecidas pela Vale estão
contribuindo para que a empresa reduza as ameaças e aproveite as oportunidades
que surgiram com a globalização de suas atividades, utilizando-se de uma
perspectiva pertinente à teoria de redes (network Theory). Com base na
metodologia de estudo de caso com triangulação de métodos, os dados da
pesquisa foram coletados por meio de investigação documental/telematizada,
levantamentos de percepções com auxílio de questionário predominantemente
estruturado e de entrevistas complementares. A interpretação e análise dos dados
basearam-se no referencial teórico, fundamentado em revisão de literatura
pertinente à área de estudo, com auxílio do modelo SNA de Macedo-Soares
(2002), tanto na ótica (tradicional) quanto (relacional). Os resultados da pesquisa
evidenciaram implicações positivas das alianças internacionais estratégicas da
Vale, no nível da indústria, ou seja, indicaram que estas contribuíram para que a
empresa potencializasse oportunidades e minimizasse ameaças do seu ambiente
competitivo. Essa pesquisa confirmou a importância da análise (relacional) ao
avaliar as implicações estratégicas, sugerindo a realização de novas pesquisas na
área. / [en] There are different theories about the origin of the globalization process, but
this phenomenon has been changing trade relations and business environment in
recent decades in various industries. In the case of the global mining industry,
globalization has changed the competitive environment, making their (players)
seek new ways to gain competitive advantage. In this scenario, Vale, which had
not developed industrial activities outside Brazil, limiting their
internationalization efforts to export its production of iron ore and pellets, now
expand its business in foreign markets, either through research or minerals
establishing manufacturing plants in several countries. By acting like a globalized
firm, Vale is facing new threats and have access to new opportunities to maximize
their results.Thus, this study aims to assess whether the strategic international
alliances and other linkages (e.g. Murder and Aquisictions) established by Vale
are contributing to the company to reduce threats and seize opportunities that
emerged with the globalization of its activities, using a perspective relevant to the
network theory. Based on the methodology of case study and supported by
triangulation of methods strategy, the research data were collected through
documental / telematic investigations, surveys of perceptions with the aid of
highly-structured questionnaire and additional interviews. The interpretation and
analysis of data were based on theoretical, supported by a review of relevant
literature in the study area, with the aid of SNA model of Macedo Soares (2002),
both from the (traditional) and (relational) perspective.The results of this study
showed the positive implications of Vale’s international strategic alliances, on the
industry level, indicating that it have been contributing for Vale to optimize
opportunities and to minimize threats of its competitive environment. This study
confirmed the importance of the (relational) analysis in the strategic implications
assessment, suggesting further research in the area.
|
Page generated in 0.052 seconds