11 |
[en] A SOFTWARE INFRASTRUCTURE FOR CATALOG MATCHING / [pt] UMA INFRA-ESTRUTURA DE SOFTWARE PARA ALINHAMENTO DE CATÁLOGOS HETEROGÊNEOSALEXANDRE GAZOLA 29 May 2008 (has links)
[pt] A maior parte dos bancos de dados existentes é projetada de
maneira independente e, portanto, é geralmente implementada
utilizando diferentes esquemas conceituais, criando um
contexto de heterogeneidade em níveis sintático, estrutural
e semântico. Não obstante, quando um conjunto de bancos
de dados se refere a um mesmo domínio, eventualmente, surge
a necessidade de integrá-los em um mesmo banco, ou de
intermediar o acesso ao conjunto de bancos de forma
transparente. Para tratar o problema da heterogeneidade,
torna-se necessário o alinhamento dos esquemas de cada um
dos bancos de dados envolvidos. Esse processo geralmente é
feito por especialistas de domínio, mas tende a ser um
trabalho muito tedioso e propenso a erros. Esta dissertação
apresenta o CatalogMatcher, uma infra-estrutura de software
para alinhamento de catálogos heterogêneos. Um catálogo
armazena dados sobre um conjunto de objetos de um
determinado domínio, tipicamente classificados por algum
tipo de taxonomia ou tesauro. O CatalogMatcher contém
componentes que implementam estratégias de alinhamento de
catálogos heterogêneos utilizando abordagens baseadas em
instâncias. / [en] Most databases are independently designed and, therefore,
are usually implemented using different conceptual schemas,
which creates a context of syntactic, structural and
semantic-level heterogeneity. Nevertheless, when a set
of databases refers to a common domain, it may become
necessary to integrate them into a single database, or to
intermediate access to the databases in a transparent way.
To deal with the heterogeneity problem, it becomes necessary
to align the conceptual schemas. This process is usually
carried out by domain specialists, and tends to be tedious
and error-prone. This dissertation presents the
CatalogMatcher, a software infrastructure for catalog
matching. A catalog stores data about a set of objects from
a specific domain, typically classified by some sort of
taxonomy or thesaurus. The CatalogMatcher contains
components that implement instance-based alignment
strategies.
|
12 |
[en] BUSINESS MODELS: AN ANALYSIS OF IMPLEMENTATION AT PETROBRAS INTERNATIONAL BUSINESSES DEPARTMENT / [pt] MODELO DE NEGÓCIOS: UMA ANÁLISE DE SUA IMPLANTAÇÃO NA ÁREA DE NEGÓCIOS INTERNACIONAIS DA PETROBRASFABIO DE MATOS DOMINGUES 22 November 2012 (has links)
[pt] Em 2009, frente a mudanças no cenário internacional e aos impactos
gerados pela descoberta do pré-sal brasileiro no ano anterior, um novo
posicionamento estratégico foi desenhado para a Área de Negócio Internacional
da PETROBRAS. Esse novo posicionamento está fundamentado nos conceitos
de rentabilidade, integração e complementaridade com as atividades nacionais da
Companhia. Nesse sentido, para garantir um maior alinhamento estratégico e
uma maior integração e complementaridade em suas atividades, a Área de
Negócio Internacional passou a desenvolver Modelos de Negócios para cada um
de seus eixos de atuação. Os Modelos de Negócios são uma ferramenta que tem
como objetivo auxiliar no planejamento da Empresa, descrevendo a sua forma de
atuação pela definição/identificação de seus clientes, do valor que lhes é
entregue, da forma como esse valor é entregue e da quantificação dos custos e
benefícios esperados. O objetivo da presente dissertação é apresentar como esses
Modelos de Negócio estão sendo implementados e verificar se essa ferramenta
permite a análise das estratégias da Companhia. Para tanto, está sendo utilizada
como metodologia a pesquisa-ação, em que o autor é parte do projeto, envolvido
na sua realização e buscando gerar conhecimento sobre esse processo. / [en] In 2009, facing the changes in the international scenario and the impacts
generated by the discovery of the Brazilian pre-salt in the previous year, a new
strategic positioning was designed for the PETROBRAS International Business
Area. This new positioning is grounded in the concepts of profitability,
integration and complementarity with the company national activities. In this
sense, to ensure a greater strategic alignment, integration and complementarity
within its activities, the International Area started the development of Business
Models for each of its axis of action. The Business Models are a tool that aims to
assist in the planning of the company and describes the way the company
operates through the definition / identification of its customers, the statement of
the value that is delivered to them, the definition of the form in which this value
is delivered and the quantification of the costs and benefits expected. The goal of
this dissertation is to show how these Business Models are being implemented
and to verify whether they are appropriate to analyze the strategies of the
company. The methodology adopted was action research, in which the author is
part of the project, and is involved both in its execution while develops
knowledge.
|
13 |
[en] STDTRIP: AN A PRIORI DESIGN PROCESS FOR PUBLISHING LINKED DATA / [pt] STDTRIP: UM PROCESSO DE PROJETO A PRIORI PARA PUBLICAÇÃO DE LINKED DATAPERCY ENRIQUE RIVERA SALAS 30 January 2017 (has links)
[pt] A abordagem de Dados Abertos tem como objetivo promover a interoperabilidade de dados na Web. Consiste na publicação de informações em formatos que permitam seu compartilhamento, descoberta, manipulação e acesso por parte de usuários e outros aplicativos de software. Essa abordagem requer a triplificação de conjuntos de dados, ou seja, a conversão do esquema de bases de dados relacionais, bem como suas instâncias, em triplas RDF. Uma questão fundamental neste processo é decidir a forma de representar conceitos de esquema de banco de dados em termos de classes e propriedades RDF. Isto é realizado através do mapeamento das entidades e relacionamentos para um ou mais vocabulários RDF, usados como base para a geração das triplas. A construção destes vocabulários é extremamente importante, porque quanto mais padrões são utilizados, melhor o grau de interoperabilidade com outros conjuntos de dados. No entanto, as ferramentas disponíveis atualmente não oferecem suporte adequado ao reuso de vocabulários RDF padrão no processo de triplificação. Neste trabalho, apresentamos o processo StdTrip, que guia usuários no processo de triplificação, promovendo o reuso de vocabulários de forma a assegurar interoperabilidade dentro do espaço da Linked Open Data (LOD). / [en] Open Data is a new approach to promote interoperability of data in the Web. It consists in the publication of information produced, archived and distributed by organizations in formats that allow it to be shared, discovered, accessed and easily manipulated by third party consumers. This approach requires the triplification of datasets, i.e., the conversion of database schemata and their instances to a set of RDF triples. A key issue in this process is deciding how to represent database schema concepts in terms of RDF classes and properties. This is done by mapping database concepts to an RDF vocabulary, used as the base for generating the triples. The construction of this vocabulary is extremely important, because the more standards are reused, the easier it will be to interlink the result to other existing datasets. However, tools available today do not support reuse of standard vocabularies in the triplification process, but rather create new vocabularies. In this thesis, we present the StdTrip process that guides users in the triplification process, while promoting the reuse of standard, RDF vocabularies.
|
14 |
[en] STRATEGIC ALIGNMENT OF BUDGET PLANNING ON ORGANIZATIONS: THE CBTU CASE / [pt] ALINHAMENTO ESTRATÉGICO DO PLANEJAMENTO ORÇAMENTÁRIO NAS ORGANIZAÇÕES: O CASO DA CBTUBIANCA KWIATKOWSKI RIBEIRO 22 December 2004 (has links)
[pt] Atualmente, o setor de transporte, no Brasil, está sofrendo
um processo de descentralização por meio da estadualização
com vistas à privatização. Para acompanhar tais mudanças, a
Companhia Brasileira de Trens Urbanos - CBTU está
reestruturando suas atividades e seu planejamento
estratégico. Nesse contexto, o grande problema da empresa é
ser deficitária em um país onde a maior parte da população
é de baixa renda e os sistemas de transporte público não são
auto-sustentáveis. O propósito desta pesquisa é investigar
como assegurar o alinhamento estratégico do planejamento
orçamentário em uma empresa pública, precisamente a CBTU,
cujo objetivo principal é satisfazer as necessidades da
sociedade. A investigação foi desenvolvida, usando a
metodologia de estudo de caso, sendo a CBTU a empresa foco.
Os dados da pesquisa foram coletados por meio de
investigação documental e telematizada, questionários,
predominantemente, estruturados e entrevistas, e tratados
com métodos quantitativos e qualitativos. A interpretação e
a análise dos dados foram realizadas com base no
referencial teórico, fundamentado em revisão de literatura
pertinente à área de estudo, com auxílio do modelo genérico
integrativo de Macedo-Soares (2001b). Os resultados
evidenciaram inconsistência entre o planejamento
orçamentário e a estratégia da empresa. Também foi possível
identificar os fatores organizacionais que contribuem e os
que não contribuem para esse alinhamento. Ao final do
trabalho, compartilham-se as lições a respeito do estudo de
caso na CBTU. / [en] Currently, the transportation sector in Brazil is passing
through a decentralization process in order to be
privatized. To follow these changes the Companhia
Brasileira de Trens Urbanos - CBTU is reorganizing its
activities and its strategical planning. In this context,
the biggest problem of the company is to be in debt in a
country where the great part of the population is poor.
Bisides that, the public transportation system is not self
sustainable. The purpose of this research is to investigate
how to line up strategically the budget planning in a
public company, necessarily CBTU, and how to meet the
society necessities is its main objective. The
investigation was developed using the case study
methdology, being the CBTU the company focus. The data of
the research were collected by documental/telematic
investigations, interviews and questionnaires, treated with
quantitative and qualitative methods. The data
interpretation and analysis were conducted based on the
theoretical references from the literature review, with the
support of the systemic and integrative model developed by
Macedo-Soares (2001b). The results evidenced inconsistency
between the budget planning and the firm`s strategy
objectives. Also, it was possible to identify the
organizational factors that contribute and the ones that do
not contribute for this alignment. Finally, this study
shares lessons of the case study in the CBTU.
|
15 |
[en] QUEER THEORY AND STIGMA: IN THE CONSTRUCTION OF HOMOAFFECTION PERFORMANCES IN LIFE STORIES NARRATIVES / [pt] TEORIA QUEER E ESTIGMA: A CONSTRUÇÃO DE PERFORMANCES HOMOAFETIVAS EM NARRATIVAS DE HISTÓRIAS DE VIDATAIS LEAL DE OLIVEIRA 02 October 2006 (has links)
[pt] A tese Teoria Queer e estigma: a construção de performances
homoafetivas em narrativas de histórias de vida investiga
a construção de
performances homoafetivas a partir de histórias de vida
narradas por quatro
indivíduos, nas faixas etárias de 20-30 anos e 40-50 anos,
de nível superior,
pertencentes às camadas média e média alta, moradores da
zona sul da cidade do
Rio de Janeiro. As narrativas são analisadas através da
articulação da Teoria
Queer e dos Estudos Feministas, da Análise da Narrativa,
dos conceitos de
posicionamento e alinhamento, e de estigma. A perspectiva
do trabalho é
interdisciplinar, incluindo conceitos oriundos da
Psicologia Social, da Sociologia,
da Antropologia e da História. A pesquisa procura
demonstrar que os indivíduos
constroem performances homoafetivas através do
deslocamento e da manutenção
da matriz cultural de inteligibilidade, que estabelece uma
relação mimética entre
sexo-gênero-prática sexual. Tais deslocamentos e
manutenções são revelados
pelos posicionamentos e alinhamentos assumidos no ato de
narrar histórias de
vida. Buscou-se observar, ainda, como o estigma afeta o
cotidiano dos sujeitos
entrevistados, sobretudo no que se refere a questões
afetivas, principalmente
aquelas relativas à família. O estudo realizado traz
contribuições relevantes no que
tange os estudos de gênero, sobretudo aqueles que se
propõem a investigar
indivíduos cujas práticas sexuais sejam estigmatizadas
socialmente. / [en] The dissertation Queer Theory and Stigma in the
Construction of
Homoaffection Performances in Life Stories Narratives
investigates the
construction of homoaffection performances through life
stories narrated by four
subjects, 20-30 years old and 40-50 years old, with
university degree, belonging
to middle and high middle class, living in the south zone
of Rio de Janeiro. The
narratives are analysed through the articulation of Queer
Theory and Feminist
Studies, Narrative Analysis, positioning and alignment
concepts, and stigma. The
perspective of this work is interdisciplinary, including
concepts given by Social
Psychology, Sociology, Anthropology, and History. The
research aims at
demonstrate that the subjects construe gay performances by
displacing, and
preserving the cultural matrix of inteligibility, which
establishes a mimetic
relation among sex-gender-sexual practice. Such
displacements and preservations
are revealed through positionings and alignments assumed
in the act of telling life
stories. I also tried to show how stigma affects the
interviewer´s daily routine,
particularly in terms of emotions, mainly those related to
affection in the family.
The study brings relevant contributions to gender studies,
above all the ones
which purpose is the investigation of subjects whose
sexual practices are socially
stigmatized.
|
16 |
[en] STRATEGICAL ALIGNMENT OF THE TECHNOLOGY OF INFORMATION: A STUDY OF CASE IN THE UNITS OF BUSINESS OF THE SEGMENT OF REFINING OF THE PETROBRAS / [pt] ALINHAMENTO ESTRATÉGICO DA TECNOLOGIA DA INFORMAÇÃO: UM ESTUDO DE CASO DAS UNIDADES DE NEGÓCIO DO SEGMENTO DE REFINO DA PETROBRASMARCUS VINICIUS DE MORAES FONSECA 11 March 2004 (has links)
[pt] Embora sejam encontradas evidências na literatura que a
Tecnologia da Informação (TI) tem o poder de transformar
indústrias e mercados, muitas organizações ainda
defrontam-se com dificuldades na utilização deste potencial
para obter vantagens competitivas. A promoção do
alinhamento estratégico durante todas as etapas do
processo de planejamento pode auxiliar os executivos das
organizações na promoção de ações que potencializem a
utilização estratégica da TI. A presente pesquisa envolveu
um estudo de casos múltiplos nas Unidades de Negócio
do Refino da Petrobras, com o objetivo de construir um
modelo para auxiliar a gestão da Tecnologia da Informação
no sentido de garantir o alinhamento de suas ações com
as estratégias do negócio, de modo a potencializar a
contribuição da TI para um melhor desempenho dessas
Unidades. Assegurar este alinhamento tornou-se
particularmente necessário com o acirramento da competição
no setor de petróleo, em decorrência da abertura do seu
mercado, no B rasil, a partir de janeiro de 2002. À luz do
referencial teórico, este estudo conclui que, nas Unidades
em questão, existe um grau de alinhamento parcial da TI aos
objetivos estratégicos da organização, sendo esta visão
compartilhada pelos gerentes das diversas áreas de
negócio da organização. O estudo aponta mecanismos para
mitigar as ações dos fatores que inibem a promoção de um
maior alinhamento estratégico da TI. Como contribuição
adicional, este estudo propõe que a promoção do alinhamento
estratégico da TI seja construída no contexto do ciclo
evolutivo do Balanced Scorecard (BSC) que está sendo
implementado na Companhia. / [en] Although evidences in the literature are found that the
Information Technology (IT) has the power to transform
industries and markets, many organizations are still
confronted with difficulties in the use of this potential
to get competitive advantages. The promotion of the
strategical alignment during all the stages of the planning
process can assist the executives of the organizations in
the implementation of actions that optimize the strategical
use of IT. The present survey involved a study of multiple
cases in the Business Units of the Refining of the
Petrobras, with the objective to construct a model to
assist the management of the Information Technology in view
of guaranteeing the alignment of its actions with the
strategies of the business, in order to increase the
contribution of IT for a better performance of these Units.
Assuring this alignment, has become particularly necessary
with the strong competition in the oil sector, as a result
of the opening of its market, in Brazil, since January 2002.
In the light of the theoretical reference, this study
concludes that, in the Units in question, there is merely a
partial alignment of IT with the organization´s strategic
objectives. The study proposes some mechanisms to mitigate
the factors that inhibit the promotion of a higher degree
of IT´s strategic alignment. As an additional contribution,
this study suggests that the promotion of the strategical
alignment of IT be carried out in the context of the life
cycle of the Balanced Scorecard (BSC), that is being
implemented in the firm.
|
17 |
[en] INTERACTIONAL COMPLEXITY IN THE RESERVATION CENTER OF AN AIRLINE COMPANY: FRAMES, FOOTINGS, AND CONVERSATIONAL SEQUENCES IN AN INSTITUTIONAL CONTEXT / [pt] A COMPLEXIDADE INTERACIONAL NA CENTRAL DE RESERVAS DE UMA COMPANHIA AÉREA: ENQUADRES, ALINHAMENTOS E SEQÜÊNCIAS CONVERSACIONAIS EM UM CONTEXTO INSTITUCIONALADRIANA GRAY DA SILVA REIS 22 September 2004 (has links)
[pt] Neste estudo, são analisados encontros de serviço
desempenhados na central de reservas por telefone de uma
companhia aérea brasileira. A análise realiza-se com base
no arcabouço teórico da Sociolingüística Interacional em
relação de interface com a Análise da Conversa. As
interações foram coletadas no âmbito de uma metodologia de
pesquisa etnográfica. Focaliza-se a manifestação de
diferentes dinâmicas de enquadres e alinhamentos bem como a
variação nos padrões de organização e construção de turnos
de fala. Procura-se mostrar que esses aspectos (i) estão
relacionados a diferentes tipos de atendimento e (ii)
refletem uma realidade interacional complexa na central de
reservas estudada. Tais fatos, conseqüentemente, dificultam
a elaboração prévia de comportamento lingüístico na central
de reservas, bem como o gerenciamento e controle desse
comportamento através da prescrição de scripts de
atendimento a clientes. / [en] This study analyzes service encounters held through the
telephone in the reservation center of a Brazilian airline
company. The analysis was conducted based on the
Interactional Sociolinguistics framework interfaced with
Conversational Analysis and the data collection was
ethnographically oriented. Different dynamics of frames and
footings are looked at, as well as the variation in
organizational patterns and construction of discourse
turns. This study aims to show that these aspects (i) are
related to different kinds of attendance, (ii) reflect a
complex interactional reality within the reservation
center. Thus, these aspects make difficult the management
process and as well as the previous control of sequences of
linguistic behavior suggested by attendance scripts to
clients.
|
18 |
[pt] CLUSTERIZAÇÃO DE POÇOS DE PETRÓLEO UTILIZANDO ALINHAMENTO DE SEQUÊNCIAS BASEADAS EM LITOLOGIA / [en] OIL WELL CLUSTERING USING LITHOLOGY-BASED SEQUENCE ALIGNMENTWALDIR JOSE PEREIRA JUNIOR 25 November 2021 (has links)
[pt] A construção de um poço de petróleo requer um planejamento extenso e antecipado. Dentre os vários objetivos deste planejamento, está a verificação da necessidade de aquisição de materiais e equipamentos para a realização das etapas da construção do poço. Tais aquisições muitas vezes envolvem contratações longas e, posteriormente, requerem um grande tempo para entrega, podendo chegar a anos. Como este planejamento é realizado em um cenário de muitas incertezas, várias técnicas, utilizando diversos tipos de dado, já foram propostas para correlacionar poços, de modo a obter antecipadamente as necessidades de materiais e equipamentos para construir um novo poço. Um desses tipos de dado é o perfil litológico, que contém os seguimentos de rochas presentes pela extensão do poço, coletados através de sensores e outros meios presentes durante a perfuração. Este perfil litológico pode ser gerado artificialmente para poços ainda não perfurados, através de dados sísmicos. Este trabalho propõe uma nova metodologia para agrupar poços de petróleo. A medida de distância será calculada com base no grau de similaridade entre poços, obtido através da aplicação de algoritmo de alinhamento de sequências, que, por sua vez, são geradas exclusivamente a partir dos perfis litológicos de tais poços. Desta forma, é possível obter poços correlatos a um determinado poço. Para validação da metodologia, foram realizados experimentos de clusterização envolvendo dados de 120 poços da costa sudeste brasileira. / [en] The construction of an oil well requires extensive and advanced planning. Among the various objectives of this planning is the verification of the need to purchase materials and equipment to carry out the stages of construction of the well. Such acquisitions often involve long contracts and, later, require a long lead-time, which can reach years. As this planning is carried out in a scenario of many uncertainties, several techniques, using different types of data, have already been proposed to correlate wells, in order to obtain in advance the material and equipment requirements to build a new well. One of these types of data is the lithological profile, which contains the rock segments present throughout the length of the well, collected through sensors and other methods present during the drilling. It is possible to generate artificial lithological profiles for not yet drilled wells, through seismic data. This work proposes a new methodology for grouping oil wells. The distance measure is based on the degree of similarity between wells, obtained by applying a sequence alignment algorithm, which, in turn, are generated exclusively from the lithological profiles of such wells. In this way, it is possible to obtain wells related to a specific well. To validate the methodology, clustering experiments involves data from 120 wells on the southeastern Brazilian coast.
|
19 |
[pt] ALINHAMENTO PESSOA-ORGANIZAÇÃO (PERSON-ORGANIZATION FIT) E ENGAJAMENTO DE COLABORADORES DE UMA EMPRESA EM MUDANÇA: UM ESTUDO DE CASO / [en] PERSON-ORGANIZATION FIT AND ENGAGEMENT OF EMPLOYEES IN A COMPANY IN CHANGE: A STUDY CASE05 September 2016 (has links)
[pt] O objetivo central desta dissertação foi analisar o alinhamento pessoaorganização
(Person-Organization fit ou P-O fit) e sua influência no engajamento
dos colaboradores de uma organização, através de um estudo de caso em uma
empresa multinacional do segmento industrial – empresa A – que está passando
por transformações e crescimento no Brasil. A pesquisa teve como base os
conceitos de P-O fit de Chatman (1989), Valores Pessoais de Schwartz (1994) e
Organizacionais de Oliveira e Tamayo (2004), assim como Engajamento no
Trabaho de Kahn (1990). Como este assunto possui uma grande aproximação com
a cultura organizacional, foi abordado o tema por Schein (2009). A metodologia
adotada para a pesquisa foi mista, através da combinação de métodos diversos de
coleta e análise de dados. Para a análise quantitativa, foi aplicadoum questionário
em 132 colaboradores, composto pelo questionário de Almeida e Sobral (2009),
versão validada no Brasil do Portrait Values Questionnaire PVQ-21 de Schwartz
(2001), pelo Inventário de Perfis de Valores Organizacionais (IPVO), de Oliveira
e Tamayo (2009) e também pela Escala de Engajamento de Trabalho (EEGT), de
Siqueira (2014). Por fim, para a pesquisa qualitativa foram realizadas a análise de
documentos internos, entrevistas semi-estruturadas em 15 colaboradores, assim
como a observação participativa em duas turmas de treinamento do programa
SOMOS A. Os resultados indicaram que não há a presença do alinhamento
pessoa-organização, possível consequência das mudanças culturais vividas na
empresa. Os estudos estatísticos demonstraram quais valores podem ter relação
significativa e impacto no engajamento dos colaboradores, concluindo-se a
relevante contribuição desta pesquisa. / [en] The main objective of this dissertation was to analyze the personorganization
fit (P-O fit) and its influence on employee engagement in an
organization, through a case study in a multinational company in the industrial
segment – company A - that is under transformation and growth in Brazil. The
research was based on the concepts of P-O fit by Chatman (1989), Personal
Values by Schwartz (1994), Organizational Values by Oliveira and Tamayo
(2004), and also of engagement at work by Kahn (1990). As this issue is closely
linked to organizational culture, Schein (2009) was also taken into consideration.
The methodology adopted for the research was mixed, combining various
methods of data collection and analysis. Quantitative analysiswas made by a
questionnaire, applied to 132 employees, comprising the validated questionnaire
in Brazil by Almeida and Sobral (2009) of Portrait Values Questionnaire PVQ-
21(SCHWARTZ, 2001), by the Inventory of Organizational Values Profile
(IPVO), by Oliveira and Tamayo ( 2009) and also the Working Engagement Scale
(EEGT), by Siqueira (2014). Finally, qualitative research was conducted by
analysis of internal documents, semi-structured interviews with 15 employees, as
well as the participatory observation in two training sessions of the program We
are A. The results indicated that there is no presence of the person-organization
fit, possible consequence of the cultural changes experienced in the company. The
statistical studies have shown wich values might have a meaningful relationship
and impact on employee engagement, concluding the relevant contribution of this
research.
|
20 |
[en] TOWARDS A WELL-INTERLINKED WEB THROUGH MATCHING AND INTERLINKING APPROACHES / [pt] INTERLIGANDO RECURSOS NA WEB ATRAVÉS DE ABORDAGENS DE MATCHING E INTERLINKINGBERNARDO PEREIRA NUNES 07 January 2016 (has links)
[pt] Com o surgimento da Linked (Open) Data, uma série de novos e importantes
desafios de pesquisa vieram à tona. A abertura de dados, como muitas vezes a
Linked Data é conhecida, oferece uma oportunidade para integrar e conectar, de
forma homogênea, fontes de dados heterogêneas na Web. Como diferentes fontes
de dados, com recursos em comum ou relacionados, são publicados por diferentes
editores, a sua integração e consolidação torna-se um verdadeiro desafio. Outro
desafio advindo da Linked Data está na criação de um grafo denso de dados na
Web. Com isso, a identificação e interligação, não só de recursos idênticos, mas
também dos recursos relacionadas na Web, provê ao consumidor (data consumer)
uma representação mais rica dos dados e a possibilidade de exploração dos recursos
conectados. Nesta tese, apresentamos três abordagens para enfrentar os problemas
de integração, consolidação e interligação de dados. Nossa primeira abordagem
combina técnicas de informação mútua e programação genética para solucionar o
problema de alinhamento complexo entre fontes de dados, um problema raramente
abordado na literatura. Na segunda e terceira abordagens, adotamos e ampliamos
uma métrica utilizada em teoria de redes sociais para enfrentar o problema de
consolidação e interligação de dados. Além disso, apresentamos um aplicativo Web
chamado Cite4Me que fornece uma nova perspectiva sobre a pesquisa e recuperação
de conjuntos de Linked Open Data, bem como os benefícios da utilização de nossas
abordagens. Por fim, uma série de experimentos utilizando conjuntos de dados reais
demonstram que as nossas abordagens superam abordagens consideradas como
estado da arte. / [en] With the emergence of Linked (Open) Data, a number of novel and notable
research challenges have been raised. The openness that often characterises Linked
Data offers an opportunity to homogeneously integrate and connect heterogeneous
data sources on the Web. As disparate data sources with overlapping or related resources
are provided by different data publishers, their integration and consolidation
becomes a real challenge. An additional challenge of Linked Data lies in the creation
of a well-interlinked graph of Web data. Identifying and linking not only identical
Web resources, but also lateral Web resources, provides the data consumer with
richer representation of the data and the possibility of exploiting connected resources.
In this thesis, we present three approaches that tackle data integration, consolidation
and linkage problems. Our first approach combines mutual information and genetic
programming techniques for complex datatype property matching, a rarely addressed
problem in the literature. In the second and third approaches, we adopt and extend a
measure from social network theory to address data consolidation and interlinking.
Furthermore, we present a Web-based application named Cite4Me that provides
a new perspective on search and retrieval of Linked Open Data sets, as well as
the benefits of using our approaches. Finally, we validate our approaches through
extensive evaluations using real-world datasets, reporting results that outperform
state of the art approaches.
|
Page generated in 0.4182 seconds