1 |
[en] PROVENANCE FOR BIOINFORMATICS WORKFLOWS / [pt] PROVENIÊNCIA PARA WORKFLOWS DE BIOINFORMÁTICALUCIANA DA SILVA ALMENDRA GOMES 25 October 2011 (has links)
[pt] Muitos experimentos científicos são elaborados como fluxos de tarefas
computacionais, que podem ser implementados através do uso de linguagens de
programação. Na área de bioinformática é muito comum o uso de scripts ad-hoc
para construir fluxos de tarefas. Os Sistemas de Gerência de Workflow Científico
(SGWC) surgiram como uma alternativa a estes scripts. Uma das
funcionalidades desses sistemas que têm recebido bastante atenção pela
comunidade científica é a captura automática de dados de proveniência. Estes
permitem averiguar quais foram os recursos e parâmetros utilizados na geração
dos resultados, dentre muitas outras informações indispensáveis para a
validação e publicação de um experimento. Neste trabalho foram levantados
alguns desafios na área de proveniência de dados em SGWCs, como por
exemplo (i) a heterogeneidade de formas de representação dos dados nos
diferentes sistemas, dificultando a compreensão e a interoperabilidade; (ii) o
armazenamento de dados consumidos e produzidos e (iii) a reprodutibilidade de
uma execução específica. Estes desafios motivaram a elaboração de um
esquema conceitual de proveniência de dados para a representação de
workflows. Foi implementada também uma extensão em um SGWC específico
(BioSide) para incluir dados de proveniência e armazená-los utilizando o
esquema conceitual proposto. Foram priorizados neste trabalho alguns requisitos
comumente encontrados em workflows de Bioinformática. / [en] Many scientific experiments are designed as computational workflows,
which can be implemented using traditional programming languages. In the
Bioinformatics domain ad-hoc scripts are often used to build workflows. Scientific
Workflow Management Systems (SWMS) have emerged as an alternative to
those scripts. One particular SWMS feature that has received much attention by
the scientific community is the automatic capture of provenance data. These
allow users to track which resources and parameters were used to obtain the
results, among many other required information to validate and publish an
experiment. In the present work we have elicited some data provenance
challenges in the SWMS context, such as (i) the heterogeneity of data
representation schemes that hinders the understanding and interoperability; (ii)
the storage of consumed and produced data and (iii) the reproducibility of a
specific execution. These challenges have motivated the proposal of a data
provenance conceptual scheme for workflow representation. We have
implemented an extension of a particular SWMS system (Bioside) to include
provenance data and store them using the proposed conceptual scheme. We
have focused on some requirements commonly found in bioinformatics
workflows.
|
2 |
[en] PROVENANCE CONCEPTUAL MODELS / [pt] MODELOS CONCEITUAIS PARA PROVENIÊNCIAANDRE LUIZ ALMEIDA MARINS 07 July 2008 (has links)
[pt] Sistemas de informação, desenvolvidos para diversos setores econômicos, necessitam com maior freqüência capacidade de rastreabilidade dos dados. Para habilitar tal capacidade, é necessário modelar a proveniência dos dados. Proveniência permite testar conformidade com a legislação, repetição de experimentos, controle de qualidade, entre outros. Habilita também a identificação de agentes (pessoas, organizações ou agentes de software) e pode ser utilizada para estabelecer níveis de confiança para as transformações dos dados. Esta dissertação propõe um modelo genérico de proveniência criado com base no alinhamento de recortes de ontologias de alto nível, padrões internacionais e propostas de padrões que tratam direta ou indiretamente de conceitos relacionados à proveniência. As contribuições da dissertação são portanto em duas direções: um modelo conceitual para proveniência - bem fundamentado - e a aplicação da estratégia de projeto conceitual baseada em alinhamento de ontologias. / [en] Information systems, developed for several economic
segments,
increasingly demand data traceability functionality. To
endow information
systems with such capacity, we depend on data provenance
modeling.
Provenance enables legal compliance, experiment validation,
and quality control,
among others . Provenance also helps identifying
participants (determinants or
immanents) like people, organizations, software agents
among others, as well as
their association with activities, events or processes. It
can also be used to
establish levels of trust for data transformations. This
dissertation proposes a
generic conceptual model for provenance, designed by
aligning fragments of
upper ontologies, international standards and broadly
recognized projects. The
contributions are in two directions: a provenance
conceptual model - extensively
documented - that facilitates interoperability and the
application of a design
methodology based on ontology alignment.
|
3 |
[en] AUTONOMOUS SYSTEMS EXPLAINABLE THROUGH DATA PROVENANCE / [pt] SISTEMAS AUTÔNOMOS EXPLICÁVEIS POR MEIO DE PROVENIÊNCIA DE DADOSTASSIO FERENZINI MARTINS SIRQUEIRA 25 June 2020 (has links)
[pt] Determinar a proveniência dos dados, isto é, o processo que levou a
esses dados, é vital em muitas áreas, especialmente quando é essencial que
os resultados ou ações sejam confiáveis. Com o crescente número de aplicações
baseadas em inteligência artificial, criou-se a necessidade de torná-las
capazes de explicar seu comportamento e responder às suas decisões. Isso é
um desafio, especialmente se as aplicações forem distribuídas e compostas de
vários agentes autônomos, formando um Sistema Multiagente (SMA). Uma
maneira fundamental de tornar tais sistemas explicáveis é rastrear o comportamento
do agente, isto é, registrar a origem de suas ações e raciocínios,
como em uma depuração onisciente. Embora a ideia de proveniência já
tenha sido explorada em alguns contextos, ela não foi extensivamente explorada
no contexto de SMA, deixando muitas questões para serem compreendidas
e abordadas. Nosso objetivo neste trabalho é justificar a importância
da proveniência dos dados para SMA, discutindo quais perguntas
podem ser respondidas em relação ao comportamento do SMA, utilizando
a proveniência e ilustrando, através de cenários de aplicação, os benefícios
que a proveniência proporciona para responder a essas questões. Este estudo
envolve a criação de um framework de software, chamado FProvW3C,
que suporta a coleta e armazenamento da proveniência dos dados produzidos
pelo SMA, que foi integrado a plataforma BDI4JADE (41), formando
o que denominamos de Prov-BDI4JADE. Por meio desta plataforma, utilizando
exemplos de sistemas autônomos, demostramos com rigor que, o
uso da proveniência de dados em SMA é uma solução sólida, para tornar
transparente o processo de raciocínio e ação do agente. / [en] Determining the data provenance, that is, the process that led to those
data, is vital in many areas, especially when it is essential that the results
or actions be reliable. With the increasing number of applications based
on artificial intelligence, the need has been created to make them capable
of explaining their behavior and be responsive to their decisions. This is
a challenge especially if the applications are distributed, and composed
of multiple autonomous agents, forming a Multiagent System (MAS).
A key way of making such systems explicable is to track the agent s
behavior, that is, to record the source of their actions and reasoning,
as in an omniscient debugging. Although the idea of provenance has
already been explored in some contexts, it has not been extensively explored
in the context of MAS, leaving many questions to be understood and
addressed. Our objective in this work is to justify the importance of the
data provenance to MAS, discussing which questions can be answered
regarding the behavior of MAS using the provenance and illustrating,
through application scenarios, to demonstrate the benefits that provenance
provides to reply to these questions. This study involves the creation
of a software framework, called FProvW3C, which supports the collects
and stores the provenance of the data produced by the MAS, which
was integrated with the platform BDI4JADE (41), forming what we call
Prov-BDI4JADE. Through this platform, using examples of autonomous
systems, we have rigorously demonstrated that the use of data provenance
in MAS is a solid solution to make the agent’s reasoning and action process
transparent.
|
Page generated in 0.0496 seconds