Spelling suggestions: "subject:"bancos dde dados"" "subject:"bancos dde lados""
61 |
[en] INTELLIGENT ASSISTANCE FOR KDD-PROCESS ORIENTATION / [pt] ASSISTÊNCIA INTELIGENTE À ORIENTAÇÃO DO PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASES DE DADOSRONALDO RIBEIRO GOLDSCHMIDT 15 December 2003 (has links)
[pt] A notória complexidade inerente ao processo de KDD -
Descoberta de Conhecimento em Bases de Dados - decorre
essencialmente de aspectos relacionados ao controle e à
condução deste processo (Fayyad et al., 1996b; Hellerstein
et al., 1999). De uma maneira geral, estes aspectos envolvem
dificuldades em perceber inúmeros fatos cuja origem e os
níveis de detalhe são os mais diversos e difusos, em
interpretar adequadamente estes fatos, em conjugar
dinamicamente tais interpretações e em decidir que ações
devem ser realizadas de forma a procurar obter bons
resultados. Como identificar precisamente os objetivos do
processo, como escolher dentre os inúmeros algoritmos de
mineração e de pré-processamento de dados existentes e,
sobretudo, como utilizar adequadamente os algoritmos
escolhidos em cada situação são alguns exemplos
das complexas e recorrentes questões na condução de
processos de KDD. Cabe ao analista humano a árdua tarefa de
orientar a execução de processos de KDD. Para tanto, diante
de cada cenário, o homem utiliza sua experiência anterior,
seus conhecimentos e sua intuição para interpretar e
combinar os fatos de forma a decidir qual a estratégia a
ser adotada (Fayyad et al., 1996a, b; Wirth et al., 1998).
Embora reconhecidamente úteis e desejáveis, são poucas as
alternativas computacionais existentes voltadas a auxiliar
o homem na condução do processo de KDD (Engels, 1996; Amant
e Cohen, 1997; Livingston, 2001; Bernstein et al., 2002;
Brazdil et al., 2003). Aliado ao exposto acima, a demanda
por aplicações de KDD em diversas áreas vem crescendo de
forma muito acentuada nos últimos anos (Buchanan, 2000). É
muito comum não existirem profissionais com experiência em
KDD disponíveis para atender a esta crescente demanda
(Piatetsky-Shapiro, 1999). Neste contexto, a criação de
ferramentas inteligentes que auxiliem o homem no controle
do processo de KDD se mostra ainda mais oportuna (Brachman
e Anand, 1996; Mitchell, 1997). Assim sendo, esta tese teve
como objetivos pesquisar, propor, desenvolver e avaliar uma
Máquina de Assistência Inteligente à Orientação do Processo
de KDD que possa ser utilizada, fundamentalmente, como
instrumento didático voltado à formação de profissionais
especializados na área da Descoberta de Conhecimento em
Bases de Dados. A máquina proposta foi formalizada com base
na Teoria do Planejamento para Resolução de Problemas
(Russell e Norvig, 1995) da Inteligência Artificial
e implementada a partir da integração de funções de
assistência utilizadas em diferentes níveis de controle do
processo de KDD: Definição de Objetivos, Planejamento de
Ações de KDD, Execução dos Planos de Ações de KDD e
Aquisição e Formalização do Conhecimento. A Assistência à
Definição de Objetivos tem como meta auxiliar o homem
na identificação de tarefas de KDD cuja execução seja
potencialmente viável em aplicações de KDD. Esta
assistência foi inspirada na percepção de um certo tipo
de semelhança no nível intensional apresentado entre
determinados bancos de dados. Tal percepção auxilia na
prospecção do tipo de conhecimento a ser procurado, uma vez
que conjuntos de dados com estruturas similares tendem a
despertar interesses similares mesmo em aplicações de KDD
distintas. Conceitos da Teoria da Equivalência entre
Atributos de Bancos de Dados (Larson et al., 1989)
viabilizam a utilização de uma estrutura comum na qual
qualquer base de dados pode ser representada. Desta forma,
bases de dados, ao serem representadas na nova estrutura,
podem ser mapeadas em tarefas de KDD, compatíveis com tal
estrutura. Conceitos de Espaços Topológicos (Lipschutz,
1979) e recursos de Redes Neurais Artificiais (Haykin,
1999) são utilizados para viabilizar os mapeamentos entre
padrões heterogêneos. Uma vez definidos os objetivos em uma
aplicação de KDD, decisões sobre como tais objetivos podem
ser alcançados se tornam necessárias. O primeiro
passo envolve a escolha de qual algoritmo de mineração de dados é o mais
apropriado para o problema em questão. A Assistência ao Planejamento de Ações
de KDD auxilia o homem nesta escolha. Utiliza, para tanto, uma metodologia de
ordenação dos algoritmos de mineração baseada no desempenho prévio destes
algoritmos em problemas similares (Soares et al., 2001; Brazdil et al., 2003).
Critérios de ordenação de algoritmos baseados em similaridade entre bases de
dados nos níveis intensional e extensional foram propostos, descritos e avaliados.
A partir da escolha de um ou mais algoritmos de mineração de dados, o passo
seguinte requer a escolha de como deverá ser realizado o pré-processamento dos
dados. Devido à diversidade de algoritmos de pré-processamento, são muitas as
alternativas de combinação entre eles (Bernstein et al., 2002). A Assistência ao
Planejamento de Ações de KDD também auxilia o homem na formulação e na
escolha do plano ou dos planos de ações de KDD a serem adotados. Utiliza, para
tanto, conceitos da Teoria do Planejamento para Resolução de Problemas.
Uma vez escolhido um plano de ações de KDD, surge a necessidade de
executá-lo. A execução de um plano de ações de KDD compreende a execução, de
forma ordenada, dos algoritmos de KDD previstos no plano. A execução de um
algoritmo de KDD requer conhecimento sobre ele. A Assistência à Execução dos
Planos de Ações de KDD provê orientações específicas sobre algoritmos de KDD.
Adicionalmente, esta assistência dispõe de mecanismos que auxiliam, de forma
especializada, no processo de execução de algoritmos de KDD e na análise dos
resultados obtidos. Alguns destes mecanismos foram descritos e avaliados.
A execução da Assistência à Aquisição e Formalização do Conhecimento
constitui-se em um requisito operacional ao funcionamento da máquina proposta.
Tal assistência tem por objetivo adquirir e disponibilizar os conhecimentos sobre
KDD em uma representação e uma organização que viabilizem o processamento
das funções de assistência mencionadas anteriormente. Diversos recursos e
técnicas de aquisição de conhecimento foram utilizados na concepção desta
assistência. / [en] Generally speaking, such aspects involve difficulties in
perceiving innumerable facts whose origin and levels of
detail are highly diverse and diffused, in adequately
interpreting these facts, in dynamically conjugating such
interpretations, and in deciding which actions must be
performed in order to obtain good results. How are the
objectives of the process to be identified in a precise
manner? How is one among the countless existing data mining
and preprocessing algorithms to be selected? And most
importantly, how can the selected algorithms be put to
suitable use in each different situation? These are but
a few examples of the complex and recurrent questions that
are posed when KDD processes are performed. Human analysts
must cope with the arduous task of orienting the execution
of KDD processes. To this end, in face of each different
scenario, humans resort to their previous experiences,
their knowledge, and their intuition in order to interpret
and combine the facts and therefore be able to decide on
the strategy to be adopted (Fayyad et al., 1996a, b; Wirth
et al., 1998). Although the existing computational
alternatives have proved to be useful and desirable, few of
them are designed to help humans to perform KDD processes
(Engels, 1996; Amant and Cohen, 1997; Livingston, 2001;
Bernstein et al., 2002; Brazdil et al., 2003). In
association with the above-mentioned fact, the demand for
KDD applications in several different areas has increased
dramatically in the past few years (Buchanan, 2000). Quite
commonly, the number of available practitioners with
experience in KDD is not sufficient to satisfy this growing
demand (Piatetsky-Shapiro, 1999). Within such a context,
the creation of intelligent tools that aim to assist humans
in controlling KDD processes proves to be even more
opportune (Brachman and Anand, 1996; Mitchell, 1997).
Such being the case, the objectives of this thesis were to
investigate, propose, develop, and evaluate an Intelligent
Machine for KDD-Process Orientation that is basically
intended to serve as a teaching tool to be used in
professional specialization courses in the area of
Knowledge Discovery in Databases. The basis for
formalization of the proposed machine was the Planning
Theory for Problem-Solving (Russell and Norvig, 1995) in
Artificial Intelligence. Its implementation was based on
the integration of assistance functions that are used at
different KDD process control levels: Goal Definition, KDD
Action-Planning, KDD Action Plan Execution, and Knowledge
Acquisition and Formalization. The Goal Definition
Assistant aims to assist humans in identifying KDD
tasks that are potentially executable in KDD applications.
This assistant was inspired by the detection of a certain
type of similarity between the intensional levels presented
by certain databases. The observation of this fact helps
humans to mine the type of knowledge that must be
discovered since data sets with similar structures tend to
arouse similar interests even in distinct KDD applications.
Concepts from the Theory of Attribute Equivalence in
Databases (Larson et al., 1989) make it possible to use a
common structure in which any database may be represented.
In this manner, when databases are represented in the new
structure, it is possible to map them into KDD tasks that
are compatible with such a structure. Topological space
concepts and ANN resources as described in Topological
Spaces (Lipschutz, 1979) and Artificial Neural Nets
(Haykin, 1999) have been employed so as to allow mapping
between heterogeneous patterns. After the goals have been
defined in a KDD application, it is necessary to decide how
such goals are to be achieved. The first step involves
selecting the most appropriate data mining algorithm for
the problem at hand. The KDD Action-Planning Assistant
helps humans to make this choice. To this end, it makes
use of a methodology for ordering the mining algorithms
that is based on the previous experiences, their knowledge, and their intuition in order to
interpret and combine the facts and therefore be able to decide on the strategy to
be adopted (Fayyad et al., 1996a, b; Wirth et al., 1998). Although the existing
computational alternatives have proved to be useful and desirable, few of them are
designed to help humans to perform KDD processes (Engels, 1996; Amant &
Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). In
association with the above-mentioned fact, the demand for KDD applications in
several different areas has increased dramatically in the past few years (Buchanan,
2000). Quite commonly, the number of available practitioners with experience in
KDD is not sufficient to satisfy this growing demand (Piatetsky-Shapiro, 1999).
Within such a context, the creation of intelligent tools that aim to assist humans in
controlling KDD processes proves to be even more opportune (Brachman &
Anand, 1996; Mitchell, 1997).
Such being the case, the objectives of this thesis were to investigate,
propose, develop, and evaluate an Intelligent Machine for KDD-Process
Orientation that is basically intended to serve as a teaching tool to be used in
professional specialization courses in the area of Knowledge Discovery in
Databases.
The basis for formalization of the proposed machine was the Planning
Theory for Problem-Solving (Russell and Norvig, 1995) in Artificial Intelligence.
Its implementation was based on the integration of assistance functions that are
used at different KDD process control levels: Goal Definition, KDD Action-
Planning, KDD Action Plan Execution, and Knowledge Acquisition and
Formalization.
The Goal Definition Assistant aims to assist humans in identifying KDD
tasks that are potentially executable in KDD applications. This assistant was
inspired by the detection of a certain type of similarity between the intensional
levels presented by certain databases. The observation of this fact helps humans to
mine the type of knowledge that must be discovered since data sets with similar
structures tend to arouse similar interests even in distinct KDD applications.
Concepts from the Theory of Attribute Equivalence in Databases (Larson et al.,
1989) make it possible to use a common structure in which any database may be
represented. In this manner, when databases are represented in the new structure,
it is possible to map them into KDD tasks that are compatible with such a
structure. Topological space concepts and ANN resources as described in
Topological Spaces (Lipschutz, 1979) and Artificial Neural Nets (Haykin, 1999)
have been employed so as to allow mapping between heterogeneous patterns.
After the goals have been defined in a KDD application, it is necessary to
decide how such goals are to be achieved. The first step involves selecting the
most appropriate data mining algorithm for the problem at hand. The KDD
Action-Planning Assistant helps humans to make this choice. To this end, it makes
use of a methodology for ordering the mining algorithms that is based on the
previous performance of these algorithms in similar problems (Soares et al., 2001;
Brazdil et al., 2003). Algorithm ordering criteria based on database similarity at
the intensional and extensional levels were proposed, described and evaluated.
The data mining algorithm or algorithms having been selected, the next step
involves selecting the way in which data preprocessing is to be performed. Since
there is a large variety of preprocessing algorithms, many are the alternatives for
combining them (Bernstein et al., 2002). The KDD Action-Planning Assistant also
helps humans to formulate and to select the KDD action plan or plans to be
adopted. To this end, it makes use of concepts contained in the Planning Theory
for Problem-Solving.
Once a KDD action plan has been chosen, it is necessary to execute it.
Executing a KDD action plan involves the ordered execution of the KDD
algorithms that have been anticipated in the plan. Executing a KDD algorithm
requires knowledge about it. The KDD Action Plan Execution Assistant provides
specific guidance on KDD algorithms. In addition, this assistant is equipped with
mechanisms that provide specialized assistance for performing the KDD
algorithm execution process and for analyzing the results obtained. Some of these
mechanisms have been described and evaluated.
The execution of the Knowledge Acquisition and Formalization Assistant
is an operational requirement for running the proposed machine. The objective of
this assistant is to acquire knowledge about KDD and to make such knowledge
available by representing and organizing it a way that makes it possible to process
the above-mentioned assistance functions. A variety of knowledge acquisition
resources and techniques were employed in the conception of this assistant.
|
62 |
Ressonância magnética funcional em indivíduos normais: base de dados do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo / Functional magnetic resonance imaging of normal subjects: a database for the Hospital das Clínicas da Faculdade de Medicina da Universidade de São PauloMartin, Maria da Graça Morais 04 October 2007 (has links)
Introdução: Apesar do grande impacto da ressonância magnética funcional em neurociências, a sua aplicabilidade clínica ainda é pequena. Um dos principais motivos é a falta de dados populacionais para dar suporte à decisão clínica. Esta tese teve por objetivo formar um banco de dados normais, representativo de pacientes do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HCFMUSP). Métodos: Foram estudados 64 acompanhantes normais dos pacientes do HCFMUSP. Cada indivíduo realizou tarefas quem envolviam função de linguagem, somatossensorial, motor, audiovisual e de memória em aparelho de 1,5 T. Foram colhidos dados demográficos, de desempenho e neuropsicológicos dos sujeitos e de controle de qualidade do magneto de RM. As imagens funcionais foram analisadas através do software XBAM para cada indivíduo, para os grupos e para análise de correlação comportamental. Resultados: A amostra teve uma distribução demográfica variada. Os resultados das análises de grupo mostraram padrões de acordo com a literatura. O paradigma motor mostrou efeito BOLD positivo nos giros pré e pós-centrais estendendo-se para regiões pré-motoras e parietais, área motora suplementar, áreas somatosensoriais secundárias, núcleos da base e tálamo contralaterais à mão avaliada e hemisférios cerebelares ipsilaterais. O paradigma somatossensorial das mãos demonstrou efeito BOLD positivo nos giros pré e pós-centrais, núcleos da base e tálamos contralaterais à mão estimulada, cerebelo ipsilateral à mão estimulada e o córtex somatossensorial secundário bilateralmente e o da face mostrou os giros pré e pós-centrais, o córtex parietal, regiões pré-motoras, regiões temporais posteriores e inferiores e área somatosensorial secundária bilateralmente. A análise de grupo dos paradigmas de linguagem mostrou efeito BOLD positivo no giro frontal inferior e ínsula bilateralmente, maiores à esquerda, giro frontal médio esquerdo, cíngulo anterior, área motora suplementar, cerebelo à direita e vermis cerebelar, núcleos da base e tálamos à esquerda e em particular na fluência verbal falada com apresentação de letras diferentes, lobo parietal esquerdo. No paradigma audiovisual a condição visual mostrou efeito BOLD positivo no córtex occipital, parietal e cerebelo bilateralmente e a condição auditiva, nos lobos temporais bilaterais, com extensão fronto-parietal à esquerda. A análise de grupo do paradigma memória mostrou áreas no cerebelo, córtex occipital, giro frontal médio, região frontal mesial anterior e lobo parietal, com predomínio à direita. Nos mapas individuais foram detectadas muitas regiões em cada paradigma e houve grande variabilidade, sendo as regiões cerebrais que apresentaram efeito BOLD positivo com maior frequência ( 85%): giro pré-central esquerdo (95%) e cerebelo superior direito (87%) no movimento da mão direita; giro pré-central direito (88%) no movimento da mão esquerda; giro pós-central esquerdo (88%) no estímulo somatosensorial da mão direita; giro pós-central direito (89%) no estímulo somatosensorial da mão esquerda; giro lingual direito (90%) e esquerdo (88%) no estímulo visual; e giro temporal médio direito (93%) e esquerdo (91%) na condição auditiva. As tarefas de memória e fluência verbal não tiveram nenhuma região com frequência acima de 80%. Conclusões: Os padrões de ativação cerebral obtidos nas imagens de RMf do grupo de participantes são semelhantes à literatura. A freqüência das regiões com efeito BOLD positivo foi maior nos córtices primários sensoriais e motores. As informações colhidas no trabalho constituem uma base de dados que pode ser utilizada para suporte à decisão clínica. / Introduction: Functional magnetic resonance imaging has had a great impact on neuroscience, but its clinical applicability is still small. One of the main reasons is the lack of populational databases to support clinical decision. The aim of this work was to constitute a local normal database, representative of the patients from the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HC-FMUSP). Methods: The sample included 64 normal subjects who, at some point, accompanied patients from the HCFMUSP. They all performed motor, somatosensory, language, audiovisual and memory paradigms in a 1,5 T magnet. Demographic, neuropsychological and behavioral data were collected. Scanner quality control was also verified. Data was analyzed through XBAM software on individual and group basis, and for behavioral correlation. Results: The sample had a variable demographic distribution. Group analysis showed results in agreement with the literature. The motor paradigm elicited positive BOLD effect in the pre and postcentral gyri, extending to premotor and parietal regions, supplementary motor area, secondary somatosensory areas, basal ganglia and thalamus contralateral to the hand in question, and ipsilateral cerebellum. Group analysis of the hand somatosensory paradigm showed pre and postcentral gyri, basal ganglia and thalamus contralateral to the stimulated hand, ipsilateral cerebellum and bilateral secondary somatosensory areas. The group analysis of the somatosensory paradigm of the face showed pre and postcentral gyri, parietal cortex, premotor areas, inferior-posterior temporal cortex and secondary somatosensory areas bilaterally. Language paradigms showed positive BOLD effect in the inferior frontal gyrus and insula bilaterally, bigger on the left, left middle frontal gyrus, anterior cingulate, supplementary motor area, right cerebellum, cerebellar vermis, left basal ganglia and thalamus, and in particular, overt verbal fluency with presentation of different letters also showed the left parietal lobe. The audiovisual paradigm group analysis showed positive BOLD effect in the occipital and parietal cortex and cerebellum bilaterally during the visual condition, and bilateral temporal with left frontal and parietal extension during the auditory condition. Finally, working memory task showed activation in the occipital cortex, cerebellum, middle frontal gyri, parietal association cortex and mesial frontal region bilaterally, with right predominance. On individual basis we detected a multitude of brain areas in each paradigm with great variability, and those with the higher frequency ( 85%) were: left precentral gyrus (95%) and superior right cerebellum (87%) during the right hand movement; right precentral gyrus (88%) during the left hand movement; left postcentral gyrus (88%) for the somatosensory stimulus of the right hand; right postcentral gyrus (89%) for the somatosensory stimulus of the left hand; right (90%) and left (88%) lingual gyri during the visual stimulus; and right (93%) and left (91%) middle temporal gyrus for the auditory stimulus. Working memory and verbal fluency had no region with a frequency above 80%. Conclusions: The patterns of cerebral activations obtained in group analysis are in agreement with the literature. Individual analysis showed a higher frequency of positive BOLD effect in the primary and sensory cortices. The data collected during this work constitute a database that can be used to support clinical decision.
|
63 |
Ressonância magnética funcional em indivíduos normais: base de dados do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo / Functional magnetic resonance imaging of normal subjects: a database for the Hospital das Clínicas da Faculdade de Medicina da Universidade de São PauloMaria da Graça Morais Martin 04 October 2007 (has links)
Introdução: Apesar do grande impacto da ressonância magnética funcional em neurociências, a sua aplicabilidade clínica ainda é pequena. Um dos principais motivos é a falta de dados populacionais para dar suporte à decisão clínica. Esta tese teve por objetivo formar um banco de dados normais, representativo de pacientes do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HCFMUSP). Métodos: Foram estudados 64 acompanhantes normais dos pacientes do HCFMUSP. Cada indivíduo realizou tarefas quem envolviam função de linguagem, somatossensorial, motor, audiovisual e de memória em aparelho de 1,5 T. Foram colhidos dados demográficos, de desempenho e neuropsicológicos dos sujeitos e de controle de qualidade do magneto de RM. As imagens funcionais foram analisadas através do software XBAM para cada indivíduo, para os grupos e para análise de correlação comportamental. Resultados: A amostra teve uma distribução demográfica variada. Os resultados das análises de grupo mostraram padrões de acordo com a literatura. O paradigma motor mostrou efeito BOLD positivo nos giros pré e pós-centrais estendendo-se para regiões pré-motoras e parietais, área motora suplementar, áreas somatosensoriais secundárias, núcleos da base e tálamo contralaterais à mão avaliada e hemisférios cerebelares ipsilaterais. O paradigma somatossensorial das mãos demonstrou efeito BOLD positivo nos giros pré e pós-centrais, núcleos da base e tálamos contralaterais à mão estimulada, cerebelo ipsilateral à mão estimulada e o córtex somatossensorial secundário bilateralmente e o da face mostrou os giros pré e pós-centrais, o córtex parietal, regiões pré-motoras, regiões temporais posteriores e inferiores e área somatosensorial secundária bilateralmente. A análise de grupo dos paradigmas de linguagem mostrou efeito BOLD positivo no giro frontal inferior e ínsula bilateralmente, maiores à esquerda, giro frontal médio esquerdo, cíngulo anterior, área motora suplementar, cerebelo à direita e vermis cerebelar, núcleos da base e tálamos à esquerda e em particular na fluência verbal falada com apresentação de letras diferentes, lobo parietal esquerdo. No paradigma audiovisual a condição visual mostrou efeito BOLD positivo no córtex occipital, parietal e cerebelo bilateralmente e a condição auditiva, nos lobos temporais bilaterais, com extensão fronto-parietal à esquerda. A análise de grupo do paradigma memória mostrou áreas no cerebelo, córtex occipital, giro frontal médio, região frontal mesial anterior e lobo parietal, com predomínio à direita. Nos mapas individuais foram detectadas muitas regiões em cada paradigma e houve grande variabilidade, sendo as regiões cerebrais que apresentaram efeito BOLD positivo com maior frequência ( 85%): giro pré-central esquerdo (95%) e cerebelo superior direito (87%) no movimento da mão direita; giro pré-central direito (88%) no movimento da mão esquerda; giro pós-central esquerdo (88%) no estímulo somatosensorial da mão direita; giro pós-central direito (89%) no estímulo somatosensorial da mão esquerda; giro lingual direito (90%) e esquerdo (88%) no estímulo visual; e giro temporal médio direito (93%) e esquerdo (91%) na condição auditiva. As tarefas de memória e fluência verbal não tiveram nenhuma região com frequência acima de 80%. Conclusões: Os padrões de ativação cerebral obtidos nas imagens de RMf do grupo de participantes são semelhantes à literatura. A freqüência das regiões com efeito BOLD positivo foi maior nos córtices primários sensoriais e motores. As informações colhidas no trabalho constituem uma base de dados que pode ser utilizada para suporte à decisão clínica. / Introduction: Functional magnetic resonance imaging has had a great impact on neuroscience, but its clinical applicability is still small. One of the main reasons is the lack of populational databases to support clinical decision. The aim of this work was to constitute a local normal database, representative of the patients from the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HC-FMUSP). Methods: The sample included 64 normal subjects who, at some point, accompanied patients from the HCFMUSP. They all performed motor, somatosensory, language, audiovisual and memory paradigms in a 1,5 T magnet. Demographic, neuropsychological and behavioral data were collected. Scanner quality control was also verified. Data was analyzed through XBAM software on individual and group basis, and for behavioral correlation. Results: The sample had a variable demographic distribution. Group analysis showed results in agreement with the literature. The motor paradigm elicited positive BOLD effect in the pre and postcentral gyri, extending to premotor and parietal regions, supplementary motor area, secondary somatosensory areas, basal ganglia and thalamus contralateral to the hand in question, and ipsilateral cerebellum. Group analysis of the hand somatosensory paradigm showed pre and postcentral gyri, basal ganglia and thalamus contralateral to the stimulated hand, ipsilateral cerebellum and bilateral secondary somatosensory areas. The group analysis of the somatosensory paradigm of the face showed pre and postcentral gyri, parietal cortex, premotor areas, inferior-posterior temporal cortex and secondary somatosensory areas bilaterally. Language paradigms showed positive BOLD effect in the inferior frontal gyrus and insula bilaterally, bigger on the left, left middle frontal gyrus, anterior cingulate, supplementary motor area, right cerebellum, cerebellar vermis, left basal ganglia and thalamus, and in particular, overt verbal fluency with presentation of different letters also showed the left parietal lobe. The audiovisual paradigm group analysis showed positive BOLD effect in the occipital and parietal cortex and cerebellum bilaterally during the visual condition, and bilateral temporal with left frontal and parietal extension during the auditory condition. Finally, working memory task showed activation in the occipital cortex, cerebellum, middle frontal gyri, parietal association cortex and mesial frontal region bilaterally, with right predominance. On individual basis we detected a multitude of brain areas in each paradigm with great variability, and those with the higher frequency ( 85%) were: left precentral gyrus (95%) and superior right cerebellum (87%) during the right hand movement; right precentral gyrus (88%) during the left hand movement; left postcentral gyrus (88%) for the somatosensory stimulus of the right hand; right postcentral gyrus (89%) for the somatosensory stimulus of the left hand; right (90%) and left (88%) lingual gyri during the visual stimulus; and right (93%) and left (91%) middle temporal gyrus for the auditory stimulus. Working memory and verbal fluency had no region with a frequency above 80%. Conclusions: The patterns of cerebral activations obtained in group analysis are in agreement with the literature. Individual analysis showed a higher frequency of positive BOLD effect in the primary and sensory cortices. The data collected during this work constitute a database that can be used to support clinical decision.
|
64 |
Uma abordagem contingencial de gerenciamento de projetos no desenvolvimento de uma ferramenta de apoio à gestão da pós-graduação stricto sensu / A project management contingency approach in the development of a tool to support stricto sensu post-graduation managementSilva, Ricardo Antônio Câmara da 12 May 2016 (has links)
Submitted by Nadir Basilio (nadirsb@uninove.br) on 2016-07-01T21:30:23Z
No. of bitstreams: 1
Ricardo Antonio Camara Da Silva.pdf: 2485810 bytes, checksum: f152647370f0e6a1c84222f03ca5c34b (MD5) / Made available in DSpace on 2016-07-01T21:30:23Z (GMT). No. of bitstreams: 1
Ricardo Antonio Camara Da Silva.pdf: 2485810 bytes, checksum: f152647370f0e6a1c84222f03ca5c34b (MD5)
Previous issue date: 2016-05-12 / The strong acceleration that has been happening in the development and use of information initiated a transition process with major implications for the societies around the world, affecting education, among many other aspects of life. Higher Education Institutions (HEIs) are organizations devoted to the creation, transmission and dissemination of knowledge, playing a prominent role in the processes that shape contemporary society. Efficient management of the HEIs is required to create and maintain a competitive advantage, so that they can meet government standards of academic quality and still face competition, as a condition for their continuity. The post-graduation programs play important role to help HEIs meet their goals. The scientific production of Brazilian post-graduation is an important source of knowledge, directly contributing to the production and scientific development of the country. Information related to it, however, are stored in different and non integrated bases. There are difficulties to retrieve data in a direct way, in order to perform analyzes on the production of a university, a knowledge area or a geographical region, supporting HEIs management. This work consists in an applied, qualitative exploratory study, carried out by the method of action research. It aims at investigating the application of a contingency approach to manage a project to develop a tool with practical application: support stricto sensu post-graduation management. In the initial phase of the project, the Adaptive approach was chosen, by applying the Project Management Life Cycle method. The work includes the integration of data stored in government agencies databases, such as those in CAPES and CNPq sites. Besides that, includes building a prototype, that provides consultations to the integrated data and allows automated generation of entry lists to ScriptSucupira program. The implementation of the proposed tool will facilitate more efficient retrieval of scientific production of Brazilian post-graduation professors, contributing to the generation of knowledge and expertise to support post-graduate programs management, in activities such as providing information to CAPES evaluation system, academic production analysis, collaborative researchers networks analysis, program monitoring and evaluation, among other initiatives. / A forte aceleração que tem se verificado no desenvolvimento e uso da informação iniciou um processo de transição com grandes implicações para as sociedades em todo o mundo, afetando a educação, entre vários outros aspectos da vida. As Instituições de Ensino Superior (IESs) são organizações voltadas para a criação, transmissão e disseminação do conhecimento, que desempenham papel destacado nos processos que configuram a sociedade contemporânea. A gestão eficiente das IESs é necessária para criar e manter uma vantagem competitiva, de forma que seja possível cumprir as normas governamentais de qualidade acadêmica e ainda enfrentar a concorrência, como condição para continuidade. Os programas de pós-graduação desempenham papel de destaque para que as IESs cumpram seus objetivos. A produção científica da pós-graduação brasileira é importante fonte geradora de conhecimento, contribuindo diretamente para o desenvolvimento produtivo e científico do país. As informações referentes a ela, entretanto, estão armazenadas em bancos de dados diferentes e não integrados. Há dificuldades para recuperar dados de maneira direta, a fim de realizar análises sobre a produção de uma universidade, uma área de conhecimento ou uma região geográfica, apoiando a gestão das IESs. Este trabalho constitui-se em uma pesquisa aplicada, qualitativa e exploratória, realizada pelo método da pesquisa-ação. Tem como objetivo investigar a aplicação de uma abordagem contingencial no gerenciamento de um projeto destinado a desenvolver uma ferramenta com aplicação prática no apoio à gestão da pós graduação stricto sensu. Na fase inicial do projeto foi escolhida a abordagem Adaptativa, por meio da aplicação do método do Ciclo de Vida de Gerenciamento de Projetos. O trabalho compreende a integração de dados armazenados em bancos dos órgãos governamentais CAPES e CNPq, assim como a construção de um protótipo que disponibilize consultas aos dados integrados e permita a geração automatizada de listas de entrada para o programa ScriptSucupira. A implementação da ferramenta proposta facilitará a recuperação mais eficiente da produção científica dos docentes, contribuindo para a geração de conhecimentos teóricos e práticos capazes de apoiar a gestão de programas de pós-graduação stricto sensu, em atividades como o fornecimento de informações para o sistema de avaliação da CAPES, análises de produção acadêmica, análises de redes de colaboração de pesquisadores, formulação de políticas, acompanhamento e avaliação de programas de pós-graduação, entre outras iniciativas.
|
65 |
[en] PARALLEL PROGRAMING IN THE REDIS KEY-VALUE DATASTORE / [pt] PROGRAMAÇÃO PARALELA NO BANCO DE DADOS CHAVE-VALOR REDISJUAREZ DA SILVA BOCHI 12 April 2016 (has links)
[pt] Redis é um banco de dados chave-valor de código livre que dá suporte à
avaliação de scripts Lua, mas sua implementação utiliza apenas uma tarefa
de sistema operacional. Scripts longos são desencorajados porque a avaliação
do código é bloqueante, o que pode causar degradação de desempenho para
os demais usuários. Através da aplicação do modelo de concorrência M:N,
que combina tarefas de nível de sistema operacional com tarefas do nível
de usuário, adicionamos no Redis a capacidade de execução de scripts em
paralelo, permitindo que todos os núcleos do servidor sejam explorados.
Com a utilização de corotinas Lua, implementamos um escalonador capaz
de alocar e suspender a execução de tarefas de nível de usuário nos núcleos
disponíveis sem necessidade de alteração do código dos scripts. Este modelo
permitiu proteger o programador das complexidades naturais do paralelismo
como sincronização no acesso a recursos compartilhados e escalonamento
das tarefas. / [en] Redis is an open source key-value database that supports Lua programming
language scripts, but it s implementation is single threaded. Long running
scripts are discouraged because script evaluation is blocking, which may
cause service levels deterioration. Applying the M:N threading model,
which combines user and operating system threads, we added to Redis the
ability of running scripts in parallel, leveraging all server cores.With the use
of Lua coroutines, we implemented a scheduler able to allocate and suspend
user-level tasks in the available cores without the need of changing scripts
source code. The M:N model allowed us to protect the programmer from the
natural complexities that arise from parallel programming, such as access
to shared resources synchronization and scheduling of tasks into different
operational system threads.
|
66 |
Uso de propriedades visuais-interativas na avaliação da qualidade de dados / Using visual-interactive properties in the data quality assessmentJosko, João Marcelo Borovina 29 April 2016 (has links)
Os efeitos dos dados defeituosos sobre os resultados dos processos analíticos são notórios. Aprimorar a qualidade dos dados exige estabelecer alternativas a partir de vários métodos, técnicas e procedimentos disponíveis. O processo de Avaliação da Qualidade dos Dados - pAQD - provê relevantes insumos na definição da alternativa mais adequada por meio do mapeamento dos defeitos nos dados. Relevantes abordagens computacionais apoiam esse processo. Tais abordagens utilizam métodos quantitativos ou baseados em asserções que usualmente restringem o papel humano a interpretação dos seus resultados. Porém, o pAQD depende do conhecimento do contexto dos dados visto que é impossível confirmar ou refutar a presença de defeitos baseado exclusivamente nos dados. Logo, a supervisão humana é essencial para esse processo. Sistemas de visualização pertencem a uma classe de abordagens supervisionadas que podem tornar visíveis as estruturas dos defeitos nos dados. Apesar do considerável conhecimento sobre o projeto desses sistemas, pouco existe para o domínio da avaliação visual da qualidade dos dados. Isto posto, este trabalho apresenta duas contribuições. A primeira reporta uma taxonomia que descreve os defeitos relacionados aos critérios de qualidade da acuracidade, completude e consistência para dados estruturados e atemporais. Essa taxonomia seguiu uma metodologia que proporcionou a cobertura sistemática e a descrição aprimorada dos defeitos em relação ao estado-da-arte das taxonomias. A segunda contribuição reporta relacionamentos entre propriedades-defeitos que estabelecem que certas propriedades visuais-interativas são mais adequadas para a avaliação visual de certos defeitos em dadas resoluções de dados. Revelados por um estudo de caso múltiplo e exploratório, esses relacionamentos oferecem indicações que reduzem a subjetividade durante o projeto de sistemas de visualização de apoio a avaliação visual da qualidade dos dados. / The effects of poor data quality on the reliability of the outcomes of analytical processes are notorious. Improving data quality requires alternatives that combine procedures, methods, techniques and technologies. The Data Quality Assessment process - DQAp - provides relevant and practical inputs for choosing the most suitable alternative through a data defects mapping. Relevant computational approaches support this process. Such approaches apply quantitative or assertions-based methods that usually limit the human interpretation of their outcomes. However, the DQAp process strongly depends on data context knowledge since it is impossible to confirm or refute a defect based only on data. Hence, human supervision is essential throughout this process. Visualization systems belong to a class of supervised approaches that can make visible data defect structures. Despite their considerable design knowledge encodings, there is little support design to data quality visual assessment. Therefore, this work reports two contributions. The first reports a taxonomy that organizes a detailed description of defects on structured and timeless data related to the quality criteria of accuracy, completeness and consistency. This taxonomy followed a methodology which enabled a systematic coverage of data defects and an improved description of data defects in regard to state-of-art literature. The second contribution reports a set of property-defect relationships that establishes that certain visual and interactive properties are more suitable for visual assessment of certain data defects in a given data resolution. Revealed by an exploratory and multiple study case, these relationships provides implications that reduce the subjectivity in the visualization systems design for data quality visual assessment.
|
67 |
Habeas data e tutela jurisdicional da privacidade: aspectos processuais / Habeas data: judicial protection of privacy proceduralRibeiro, Sérgio Luiz de Almeida 24 September 2013 (has links)
Made available in DSpace on 2016-04-26T20:22:03Z (GMT). No. of bitstreams: 1
Sergio Luiz de Almeida Ribeiro.pdf: 960554 bytes, checksum: 933a380e14a9abc84a29f86a8f043069 (MD5)
Previous issue date: 2013-09-24 / This dissertation is about the habeas data and its procedural aspects, as a mean to protect privacy. The main objective of this study is to analyze the usefulness of this feature as a specific instrument for protection of individuals' privacy, as well as to ensure that citizens may control the wrongful use of their personal data through social networks and credit protection institutions. In this sense, the habeas data would not be restricted to obtaining general information or rectifying data before public authorities and private companies. In order to achieve this purpose, and based on the deductive method and bibliographical research, the following topics have been addressed in this paper: historical aspects, concept and objetive of the habeas data, proceedings upon habeas data under Law 9507/1997, and, lastly, controversial aspects on habeas data. As a conclusion, the main criticism developed herein is related to the comparison between the habeas data and the writ of mandamus, which has caused a procedural impact on the Law 9507/97. This Law, that rules the habeas data, changed the primary constitutional objective of it, which was very much related to the protection of privacy and the proceedings to achieve this objective. Another criticism that is addressed herein is related to the rule that imposes to the parties the burden of having an entire administrative process before making use of the habeas data to obtain information or rectify personal data. In theory, this rule refrains the habeas data to become an effective instrument for the avoidance of damages to individuals' privacy caused by credit protection institutions and social networks, for instance / Versa a presente dissertação sobre o instituto do habeas data como tutela jurisdicional da intimidade e seus aspectos processuais. O principal objetivo é analisar a utilidade do referido instituto como instrumento específico de proteção da vida íntima e evidenciar a possibilidade de o indivíduo exercer preventivamente o controle do manuseio indevido de dados pessoais por entidades mantenedoras de bancos dados, como é o caso de redes sociais e órgãos de proteção ao crédito, não se restringindo apenas ao meio processual para obter e/ou retificar informações em entidades mantenedoras de bancos dados, públicas e privadas de caráter público. Para atingir esse propósito, e com o suporte metodológico da abordagem dedutiva e da técnica de pesquisa bibliográfica, os seguintes assuntos foram abordados: aspectos históricos, conceito e escopo do habeas data, o procedimento da ação de habeas data na disciplina da Lei nº 9.507/1997 e, por último, as questões ainda controvertidas acerca do referido instituto. A título de conclusão, a principal crítica que emerge do tema analisado alude à comparação do habeas data ao mandado de segurança, que repercutiu no procedimento adotado por sua norma específica (Lei nº 9.507/1997), afastando assim este remédio constitucional da sua finalidade precípua, qual seja, preservar objetivamente a vida íntima e servir como instrumento processual específico para esse fim. Outra crítica se refere à exigência de o jurisdicionado trilhar e esgotar toda a via administrativa antes de se socorrer do Judiciário, por meio do habeas data, para obtenção de informações e/ou retificação de dados incorretos a seu respeito. Em rigor, tal exigência impede que o habeas data seja instrumento eficaz na prevenção de danos da vida privada perpetrados por órgãos de proteção ao crédito e redes sociais, por exemplo
|
68 |
[en] DATA MINING APPLIED TO DIRECT MARKETING AND MARKET SEGMENTATION / [es] MINERACIÓN DE DATOS PARA LA SOLUCIÓN DE PROBLEMAS DE MARKETING DIRECTO Y SEGMENTACIÓN DE MERCADO / [pt] MINERAÇÃO DE DADOS APLICADA NA SOLUÇÃO DE PROBLEMAS DE MARKETING DIRETO E SEGMENTAÇÃO DE MERCADOHUGO LEONARDO COSTA DE AZEVEDO 28 August 2001 (has links)
[pt] Devido à quantidade cada vez maior de dados armazenada
pelas instituições, a área de mineração de dados tem se
tornado cada vez mais relevante e vários métodos e métodos
têm sido propostos de maneira a aumentar sua aplicabilidade
e desempenho. Esta dissertação investiga o uso de diversos
métodos e técnicas de mineração de dados na modelagem e
solução de problemas de Marketing. O objetivo do trabalho
foi fazer um levantamento de alguns métodos e técnicas de
mineração, avaliar seus desempenhos e procurar integrá-los
na solução de problemas de marketing que envolvessem
tarefas de agrupamento ou classificação. O trabalho
consistiu de quatro etapas principais: estudo sobre o
processo de descoberta de conhecimento em bancos de dados
(KDD - Knowledge Discovery in Databases); estudo sobre
Marketing e alguns problemas de Marketing de Banco de Dados
(DBM - Database Marketing) que envolvessem tarefas de
agrupamento e classificação; levantamento e estudo de
métodos e técnicas de Inteligência Computacional e
Estatística que pudessem ser empregados na solução de
alguns desses problemas; e estudos de caso. A primeira
etapa do trabalho envolveu um estudo detalhado das diversas
fases do processo de KDD: limpeza dos dados; seleção;
codificação e transformação; redução de dimensionalidade;
mineração; e pós-processamento. Na segunda etapa foram
estudados os principais conceitos de Marketing e de DBM e a
relação entre eles e o processo de KDD. Pesquisaram-se
alguns dos tipos de problemas comuns na área e escolheram-
se para análise dois que fossem suficientemente complexos e
tivessem a possibilidade de se ter acesso a alguma empresa
que fornecesse os dados e validasse a solução
posteriormente. Os casos selecionados foram um de marketing
direto e outro de segmentação de mercado. Na terceira
etapa, foram estudados os métodos de Inteligência
Computacional e Estatística usualmente empregados em
tarefas de agrupamento e classificação de dados. Foram
estudados: Redes Perceptron Multi-Camadas, Mapas Auto-
Organizáveis, Fuzzy C-Means, K-means, sistemas Neuro-Fuzzy,
Árvores de Decisão, métodos Hierárquicos de agrupamento,
Regressão Logística, Fuções Discriminantes de Fisher, entre
outros. Por fim, na última etapa, procurou-se integrar
todos os métodos e técnicas estudados na solução de dois
estudos de caso, propostos inicialmente na segunda etapa do
trabalho. Uma vez proposta a solução para os estudos de
caso, elas foram levadas aos especialistas em Marketing das
empresas para serem validadas no âmbito do negócio. Os
estudos de caso mostraram a grande utilidade e
aplicabilidade dos métodos e técnicas estudadas em
problemas de marketing direto e segmentação de mercado. Sem
o emprego dos mesmos, a solução para muitos desses
problemas tornar-se-ia extremamente imprecisa ou até mesmo
inviável. Mostraram também a grande importância das fases
iniciais de pré-processamento dos dados no processo de KDD.
Muitos desafios persistem ainda na área de mineração de
dados, como a dificuldade de modelar dados não lineares e
de manipular quantidades muito grande de dados, o que
garante um vasto campo para pesquisa nos próximos anos. / [en] The Data Mining field has received great attention lately,
due to the increasing amount of data stored by companies
and institutions. A great number of Data Mining methods
have been proposed so far, which is good but sometimes
leads to confusion. This dissertation investigates the
performance of many different methods and techniques of
Data Mining used to model and solve Marketing problems. The
goal of this research was to look for and study some data
mining methods, compare them, and try to integrate them to
solve Marketing problems involving clustering and
classification tasks. This research can be divided in four
stages: a study of the process of Knowledge Discovery in
Databases (KDD); a study about Marketing problems involving
clustering and classification; a study of some methods and
techniques of Statistics and Computational Intelligence
that could be used to solve some of those problems; and
case studies. On the first stage of the research, the
different tasks (clustering, classification, modeling, etc)
and phases (data cleansing, data selection, data
transformation, Data Mining, etc) of a KDD process were
studied in detail. The second stage involved a study of the
main concepts of Marketing and Database Marketing and their
relation to the KDD process. The most common types of
problems in the field were studied and, among them, two
were selected to be furthered analyzed as case studies. One
case was related to Direct Marketing and the other to
Market Segmentation. These two cases were chosen because
they were complex enough and it was possible to find a
company to provide data to the problem and access to their
marketing department. On the third stage, many different
methods for clustering and classification were studied and
compared. Among those methods, there were: Multilayer
Perceptrons, Self Organizing Maps, Fuzzy C-Means, K-Means,
Neuro-Fuzzy systems, Decision Trees, Hierarquical
Clustering Methods, Logistic Regression, Fisher`s Linear
Discriminants, etc Finally, on the last stage, all the
methods and techniques studied were put together to solve
the two case studies proposed earlier. Once they were
solved, their solutions were submitted to the Marketing
Department of the company who provided the data, so that
they could validate the results in the context of their
business. The case studies were able to show the large
potential of applicability of the methods and techniques
studied on problems of Market Segmentation and Direct
Marketing. Without employing those methods, it would
be very hard or even impossible to solve those problems.
The case studies also helped verify the very important
role of the data pre-processing phase on the KDD process.
Many challenges persist in the data mining field. One could
mention, for example, the difficulty to model non-linear
data and to manipulate larges amounts of data. These and
many other challenges provide a vast field of research to
be done in the next years. / [es] Debido a la cantidad cada vez mayor de datos almacenados
por las instituiciones, el área de mineración de datos há
ganado relevancia y varios métodos han sido propuestos para
aumentar su aplicabilidad y desempeño. Esta disertación
investiga el uso de diversos métodos y técnicas de
mineración de datos en la modelación y solución de
problemas de Marketing. EL objetivo del trabajo fue hacer
un levantamiento de algunos métodos y técnicas de
mineración, evaluar su desempeño e integrarlos en la
solución de problemas de marketing que involucran tareas de
agrupamiento y clasificación. EL trabajo consta de cuatro
etapas principales: estudio sobre el proceso de
descubrimiento de conocimientos en bancos de datos (KDD -
Knowledge Discovery in Databases); estudio sobre Marketing
y algunos problemas de Marketing de Banco de Datos (DBM -
Database Marketing) que incluyen tareas de agrupamientoy
clasificación; levantamiento y estudio de métodos y
técnicas de Inteligencia Computacional y Estadística que
pueden ser empleados en la solución de algunos problemas; y
por último, estudios de casos. La primera etapa del trabajo
contiene un estudio detallado de las diversas fases del
proceso de KDD: limpeza de datos; selección; codificación y
transformación; reducción de dimensionalidad; mineración; y
posprocesamento. En la segunda etapa fueron estudados los
principales conceptos de Marketing y de DBM y la relación
entre ellos y el proceso de KDD. Algunos de los tipos de
problemas comunes en la área fueron investigados,
seleccionando dos de ellos, por ser suficientemente
complejos y tener posibilidad de acceso a alguna empresa
que suministrase los datos y evaluase posteriormente la
solución. Los casos selecionados fueron uno de marketing
directo y otro de segmentación de mercado. En la tercera
etapa, se estudiaron los métodos de Inteligencia
Computacional y Estadística que son empleados usualmente en
tareas de agrupamiento y clasificación de datos. Éstos
fueron: Redes Perceptron Multicamada, Mapas
Autoorganizables, Fuzzy C-Means, K-means, sistemas Neuro-
Fuzzy, Árboles de Decisión, métodos Jerárquicos de
agrupamiento, Regresión Logística, Fuciones Discriminantes
de Fisher, entre otros. En la última etapa, se integraron
todos los métodos y técnicas estudiados en la solución de
dos estudios de casos, propuestos inicialmente en la
segunda etapa del trabajo. Una vez proposta la solución
para el estudios de casos, éstas fueron evaluadas por los
especialistas en Marketing de las empresas. Los estudios de
casos mostraron la grande utilidad y aplicabilidad de los
métodos y técnicas estudiadas en problemas de marketing
directo y segmentación de mercado. Sin el empleo de dichos
métodos, la solución para muchos de esos problemas sería
extremadamente imprecisa o hasta incluso inviáble. Se
comprobó también la gran importancia de las fases iniciales
de preprocesamiento de datos en el proceso de KDD. Existen
todavía muchos desafíos en el área de mineración de datos,
como la dificuldad de modelar datos no lineales y de
manipular cantidades muy grandes de datos, lo que garantiza
un vasto campo de investigación
|
69 |
Uso de propriedades visuais-interativas na avaliação da qualidade de dados / Using visual-interactive properties in the data quality assessmentJoão Marcelo Borovina Josko 29 April 2016 (has links)
Os efeitos dos dados defeituosos sobre os resultados dos processos analíticos são notórios. Aprimorar a qualidade dos dados exige estabelecer alternativas a partir de vários métodos, técnicas e procedimentos disponíveis. O processo de Avaliação da Qualidade dos Dados - pAQD - provê relevantes insumos na definição da alternativa mais adequada por meio do mapeamento dos defeitos nos dados. Relevantes abordagens computacionais apoiam esse processo. Tais abordagens utilizam métodos quantitativos ou baseados em asserções que usualmente restringem o papel humano a interpretação dos seus resultados. Porém, o pAQD depende do conhecimento do contexto dos dados visto que é impossível confirmar ou refutar a presença de defeitos baseado exclusivamente nos dados. Logo, a supervisão humana é essencial para esse processo. Sistemas de visualização pertencem a uma classe de abordagens supervisionadas que podem tornar visíveis as estruturas dos defeitos nos dados. Apesar do considerável conhecimento sobre o projeto desses sistemas, pouco existe para o domínio da avaliação visual da qualidade dos dados. Isto posto, este trabalho apresenta duas contribuições. A primeira reporta uma taxonomia que descreve os defeitos relacionados aos critérios de qualidade da acuracidade, completude e consistência para dados estruturados e atemporais. Essa taxonomia seguiu uma metodologia que proporcionou a cobertura sistemática e a descrição aprimorada dos defeitos em relação ao estado-da-arte das taxonomias. A segunda contribuição reporta relacionamentos entre propriedades-defeitos que estabelecem que certas propriedades visuais-interativas são mais adequadas para a avaliação visual de certos defeitos em dadas resoluções de dados. Revelados por um estudo de caso múltiplo e exploratório, esses relacionamentos oferecem indicações que reduzem a subjetividade durante o projeto de sistemas de visualização de apoio a avaliação visual da qualidade dos dados. / The effects of poor data quality on the reliability of the outcomes of analytical processes are notorious. Improving data quality requires alternatives that combine procedures, methods, techniques and technologies. The Data Quality Assessment process - DQAp - provides relevant and practical inputs for choosing the most suitable alternative through a data defects mapping. Relevant computational approaches support this process. Such approaches apply quantitative or assertions-based methods that usually limit the human interpretation of their outcomes. However, the DQAp process strongly depends on data context knowledge since it is impossible to confirm or refute a defect based only on data. Hence, human supervision is essential throughout this process. Visualization systems belong to a class of supervised approaches that can make visible data defect structures. Despite their considerable design knowledge encodings, there is little support design to data quality visual assessment. Therefore, this work reports two contributions. The first reports a taxonomy that organizes a detailed description of defects on structured and timeless data related to the quality criteria of accuracy, completeness and consistency. This taxonomy followed a methodology which enabled a systematic coverage of data defects and an improved description of data defects in regard to state-of-art literature. The second contribution reports a set of property-defect relationships that establishes that certain visual and interactive properties are more suitable for visual assessment of certain data defects in a given data resolution. Revealed by an exploratory and multiple study case, these relationships provides implications that reduce the subjectivity in the visualization systems design for data quality visual assessment.
|
70 |
[en] A NOVEL SOLUTION TO EMPOWER NATURAL LANGUAGE INTERFACES TO DATABASES (NLIDB) TO HANDLE AGGREGATIONS / [pt] UMA NOVA SOLUÇÃO PARA CAPACITAR INTERFACES DE LINGUAGEM NATURAL PARA BANCOS DE DADOS (NLIDB) PARA LIDAR COM AGREGAÇÕESALEXANDRE FERREIRA NOVELLO 19 July 2021 (has links)
[pt] Perguntas e Respostas (Question Answering - QA) é um campo de estudo dedicado à construção de sistemas que respondem automaticamente a perguntas feitas em linguagem natural. A tradução de uma pergunta feita em linguagem natural em uma consulta estruturada (SQL ou SPARQL) em um banco de dados também é conhecida como Interface de Linguagem Natural para Bancos de Dados (Natural Language Interface to Database - NLIDB). Os sistemas NLIDB geralmente não lidam com agregações, que podem ter os seguintes elementos: funções de agregação (como contagem, soma, média, mínimo e máximo), uma cláusula de agrupamento (GROUP BY) e uma cláusula HAVING. No entanto, eles fornecem bons resultados para consultas normais. Esta dissertação aborda a criação de um módulo genérico, para ser utilizado em sistemas NLIDB, que permite a tais sistemas realizar consultas com agregações, desde que os resultados da consulta que o NLIDB retorna sejam, ou possam ser transformados, em um resultado no formato tabular. O trabalho cobre agregações com especificidades como ambiguidades, diferenças de escala de tempo, agregações em atributos múltiplos, o uso de adjetivos superlativos, reconhecimento básico de unidade de medida, agregações em atributos com nomes compostos e subconsultas com funções de agregação aninhadas em até dois níveis. / [en] Question Answering (QA) is a field of study dedicated to building systems that automatically answer questions asked in natural language. The translation of a question asked in natural language into a structured query (SQL or SPARQL) in a database is also known as Natural Language Interface to Database (NLIDB). NLIDB systems usually do not deal with aggregations, which can have the following elements: aggregation functions (as count, sum, average, minimum and maximum), a grouping clause (GROUP BY) and a having clause (HAVING). However, they deliver good results for normal queries. This dissertation addresses the creation of a generic module, to be used in NLIDB systems, that allows such systems to perform queries with aggregations, on the condition that the query results the NLIDB return are, or can be transformed into, a result set in the form of a table. The work covers aggregations with specificities such as ambiguities, timescale differences, aggregations in multiple attributes, the use of superlative adjectives, basic unit measure recognition, aggregations in attributes with compound names and subqueries with aggregation functions nested up to two levels.
|
Page generated in 0.0793 seconds