• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 68
  • 2
  • Tagged with
  • 70
  • 70
  • 37
  • 28
  • 14
  • 14
  • 11
  • 11
  • 10
  • 10
  • 10
  • 10
  • 9
  • 9
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

[en] INTELLIGENT ASSISTANCE FOR KDD-PROCESS ORIENTATION / [pt] ASSISTÊNCIA INTELIGENTE À ORIENTAÇÃO DO PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS

RONALDO RIBEIRO GOLDSCHMIDT 15 December 2003 (has links)
[pt] A notória complexidade inerente ao processo de KDD - Descoberta de Conhecimento em Bases de Dados - decorre essencialmente de aspectos relacionados ao controle e à condução deste processo (Fayyad et al., 1996b; Hellerstein et al., 1999). De uma maneira geral, estes aspectos envolvem dificuldades em perceber inúmeros fatos cuja origem e os níveis de detalhe são os mais diversos e difusos, em interpretar adequadamente estes fatos, em conjugar dinamicamente tais interpretações e em decidir que ações devem ser realizadas de forma a procurar obter bons resultados. Como identificar precisamente os objetivos do processo, como escolher dentre os inúmeros algoritmos de mineração e de pré-processamento de dados existentes e, sobretudo, como utilizar adequadamente os algoritmos escolhidos em cada situação são alguns exemplos das complexas e recorrentes questões na condução de processos de KDD. Cabe ao analista humano a árdua tarefa de orientar a execução de processos de KDD. Para tanto, diante de cada cenário, o homem utiliza sua experiência anterior, seus conhecimentos e sua intuição para interpretar e combinar os fatos de forma a decidir qual a estratégia a ser adotada (Fayyad et al., 1996a, b; Wirth et al., 1998). Embora reconhecidamente úteis e desejáveis, são poucas as alternativas computacionais existentes voltadas a auxiliar o homem na condução do processo de KDD (Engels, 1996; Amant e Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). Aliado ao exposto acima, a demanda por aplicações de KDD em diversas áreas vem crescendo de forma muito acentuada nos últimos anos (Buchanan, 2000). É muito comum não existirem profissionais com experiência em KDD disponíveis para atender a esta crescente demanda (Piatetsky-Shapiro, 1999). Neste contexto, a criação de ferramentas inteligentes que auxiliem o homem no controle do processo de KDD se mostra ainda mais oportuna (Brachman e Anand, 1996; Mitchell, 1997). Assim sendo, esta tese teve como objetivos pesquisar, propor, desenvolver e avaliar uma Máquina de Assistência Inteligente à Orientação do Processo de KDD que possa ser utilizada, fundamentalmente, como instrumento didático voltado à formação de profissionais especializados na área da Descoberta de Conhecimento em Bases de Dados. A máquina proposta foi formalizada com base na Teoria do Planejamento para Resolução de Problemas (Russell e Norvig, 1995) da Inteligência Artificial e implementada a partir da integração de funções de assistência utilizadas em diferentes níveis de controle do processo de KDD: Definição de Objetivos, Planejamento de Ações de KDD, Execução dos Planos de Ações de KDD e Aquisição e Formalização do Conhecimento. A Assistência à Definição de Objetivos tem como meta auxiliar o homem na identificação de tarefas de KDD cuja execução seja potencialmente viável em aplicações de KDD. Esta assistência foi inspirada na percepção de um certo tipo de semelhança no nível intensional apresentado entre determinados bancos de dados. Tal percepção auxilia na prospecção do tipo de conhecimento a ser procurado, uma vez que conjuntos de dados com estruturas similares tendem a despertar interesses similares mesmo em aplicações de KDD distintas. Conceitos da Teoria da Equivalência entre Atributos de Bancos de Dados (Larson et al., 1989) viabilizam a utilização de uma estrutura comum na qual qualquer base de dados pode ser representada. Desta forma, bases de dados, ao serem representadas na nova estrutura, podem ser mapeadas em tarefas de KDD, compatíveis com tal estrutura. Conceitos de Espaços Topológicos (Lipschutz, 1979) e recursos de Redes Neurais Artificiais (Haykin, 1999) são utilizados para viabilizar os mapeamentos entre padrões heterogêneos. Uma vez definidos os objetivos em uma aplicação de KDD, decisões sobre como tais objetivos podem ser alcançados se tornam necessárias. O primeiro passo envolve a escolha de qual algoritmo de mineração de dados é o mais apropriado para o problema em questão. A Assistência ao Planejamento de Ações de KDD auxilia o homem nesta escolha. Utiliza, para tanto, uma metodologia de ordenação dos algoritmos de mineração baseada no desempenho prévio destes algoritmos em problemas similares (Soares et al., 2001; Brazdil et al., 2003). Critérios de ordenação de algoritmos baseados em similaridade entre bases de dados nos níveis intensional e extensional foram propostos, descritos e avaliados. A partir da escolha de um ou mais algoritmos de mineração de dados, o passo seguinte requer a escolha de como deverá ser realizado o pré-processamento dos dados. Devido à diversidade de algoritmos de pré-processamento, são muitas as alternativas de combinação entre eles (Bernstein et al., 2002). A Assistência ao Planejamento de Ações de KDD também auxilia o homem na formulação e na escolha do plano ou dos planos de ações de KDD a serem adotados. Utiliza, para tanto, conceitos da Teoria do Planejamento para Resolução de Problemas. Uma vez escolhido um plano de ações de KDD, surge a necessidade de executá-lo. A execução de um plano de ações de KDD compreende a execução, de forma ordenada, dos algoritmos de KDD previstos no plano. A execução de um algoritmo de KDD requer conhecimento sobre ele. A Assistência à Execução dos Planos de Ações de KDD provê orientações específicas sobre algoritmos de KDD. Adicionalmente, esta assistência dispõe de mecanismos que auxiliam, de forma especializada, no processo de execução de algoritmos de KDD e na análise dos resultados obtidos. Alguns destes mecanismos foram descritos e avaliados. A execução da Assistência à Aquisição e Formalização do Conhecimento constitui-se em um requisito operacional ao funcionamento da máquina proposta. Tal assistência tem por objetivo adquirir e disponibilizar os conhecimentos sobre KDD em uma representação e uma organização que viabilizem o processamento das funções de assistência mencionadas anteriormente. Diversos recursos e técnicas de aquisição de conhecimento foram utilizados na concepção desta assistência. / [en] Generally speaking, such aspects involve difficulties in perceiving innumerable facts whose origin and levels of detail are highly diverse and diffused, in adequately interpreting these facts, in dynamically conjugating such interpretations, and in deciding which actions must be performed in order to obtain good results. How are the objectives of the process to be identified in a precise manner? How is one among the countless existing data mining and preprocessing algorithms to be selected? And most importantly, how can the selected algorithms be put to suitable use in each different situation? These are but a few examples of the complex and recurrent questions that are posed when KDD processes are performed. Human analysts must cope with the arduous task of orienting the execution of KDD processes. To this end, in face of each different scenario, humans resort to their previous experiences, their knowledge, and their intuition in order to interpret and combine the facts and therefore be able to decide on the strategy to be adopted (Fayyad et al., 1996a, b; Wirth et al., 1998). Although the existing computational alternatives have proved to be useful and desirable, few of them are designed to help humans to perform KDD processes (Engels, 1996; Amant and Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). In association with the above-mentioned fact, the demand for KDD applications in several different areas has increased dramatically in the past few years (Buchanan, 2000). Quite commonly, the number of available practitioners with experience in KDD is not sufficient to satisfy this growing demand (Piatetsky-Shapiro, 1999). Within such a context, the creation of intelligent tools that aim to assist humans in controlling KDD processes proves to be even more opportune (Brachman and Anand, 1996; Mitchell, 1997). Such being the case, the objectives of this thesis were to investigate, propose, develop, and evaluate an Intelligent Machine for KDD-Process Orientation that is basically intended to serve as a teaching tool to be used in professional specialization courses in the area of Knowledge Discovery in Databases. The basis for formalization of the proposed machine was the Planning Theory for Problem-Solving (Russell and Norvig, 1995) in Artificial Intelligence. Its implementation was based on the integration of assistance functions that are used at different KDD process control levels: Goal Definition, KDD Action-Planning, KDD Action Plan Execution, and Knowledge Acquisition and Formalization. The Goal Definition Assistant aims to assist humans in identifying KDD tasks that are potentially executable in KDD applications. This assistant was inspired by the detection of a certain type of similarity between the intensional levels presented by certain databases. The observation of this fact helps humans to mine the type of knowledge that must be discovered since data sets with similar structures tend to arouse similar interests even in distinct KDD applications. Concepts from the Theory of Attribute Equivalence in Databases (Larson et al., 1989) make it possible to use a common structure in which any database may be represented. In this manner, when databases are represented in the new structure, it is possible to map them into KDD tasks that are compatible with such a structure. Topological space concepts and ANN resources as described in Topological Spaces (Lipschutz, 1979) and Artificial Neural Nets (Haykin, 1999) have been employed so as to allow mapping between heterogeneous patterns. After the goals have been defined in a KDD application, it is necessary to decide how such goals are to be achieved. The first step involves selecting the most appropriate data mining algorithm for the problem at hand. The KDD Action-Planning Assistant helps humans to make this choice. To this end, it makes use of a methodology for ordering the mining algorithms that is based on the previous experiences, their knowledge, and their intuition in order to interpret and combine the facts and therefore be able to decide on the strategy to be adopted (Fayyad et al., 1996a, b; Wirth et al., 1998). Although the existing computational alternatives have proved to be useful and desirable, few of them are designed to help humans to perform KDD processes (Engels, 1996; Amant & Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). In association with the above-mentioned fact, the demand for KDD applications in several different areas has increased dramatically in the past few years (Buchanan, 2000). Quite commonly, the number of available practitioners with experience in KDD is not sufficient to satisfy this growing demand (Piatetsky-Shapiro, 1999). Within such a context, the creation of intelligent tools that aim to assist humans in controlling KDD processes proves to be even more opportune (Brachman & Anand, 1996; Mitchell, 1997). Such being the case, the objectives of this thesis were to investigate, propose, develop, and evaluate an Intelligent Machine for KDD-Process Orientation that is basically intended to serve as a teaching tool to be used in professional specialization courses in the area of Knowledge Discovery in Databases. The basis for formalization of the proposed machine was the Planning Theory for Problem-Solving (Russell and Norvig, 1995) in Artificial Intelligence. Its implementation was based on the integration of assistance functions that are used at different KDD process control levels: Goal Definition, KDD Action- Planning, KDD Action Plan Execution, and Knowledge Acquisition and Formalization. The Goal Definition Assistant aims to assist humans in identifying KDD tasks that are potentially executable in KDD applications. This assistant was inspired by the detection of a certain type of similarity between the intensional levels presented by certain databases. The observation of this fact helps humans to mine the type of knowledge that must be discovered since data sets with similar structures tend to arouse similar interests even in distinct KDD applications. Concepts from the Theory of Attribute Equivalence in Databases (Larson et al., 1989) make it possible to use a common structure in which any database may be represented. In this manner, when databases are represented in the new structure, it is possible to map them into KDD tasks that are compatible with such a structure. Topological space concepts and ANN resources as described in Topological Spaces (Lipschutz, 1979) and Artificial Neural Nets (Haykin, 1999) have been employed so as to allow mapping between heterogeneous patterns. After the goals have been defined in a KDD application, it is necessary to decide how such goals are to be achieved. The first step involves selecting the most appropriate data mining algorithm for the problem at hand. The KDD Action-Planning Assistant helps humans to make this choice. To this end, it makes use of a methodology for ordering the mining algorithms that is based on the previous performance of these algorithms in similar problems (Soares et al., 2001; Brazdil et al., 2003). Algorithm ordering criteria based on database similarity at the intensional and extensional levels were proposed, described and evaluated. The data mining algorithm or algorithms having been selected, the next step involves selecting the way in which data preprocessing is to be performed. Since there is a large variety of preprocessing algorithms, many are the alternatives for combining them (Bernstein et al., 2002). The KDD Action-Planning Assistant also helps humans to formulate and to select the KDD action plan or plans to be adopted. To this end, it makes use of concepts contained in the Planning Theory for Problem-Solving. Once a KDD action plan has been chosen, it is necessary to execute it. Executing a KDD action plan involves the ordered execution of the KDD algorithms that have been anticipated in the plan. Executing a KDD algorithm requires knowledge about it. The KDD Action Plan Execution Assistant provides specific guidance on KDD algorithms. In addition, this assistant is equipped with mechanisms that provide specialized assistance for performing the KDD algorithm execution process and for analyzing the results obtained. Some of these mechanisms have been described and evaluated. The execution of the Knowledge Acquisition and Formalization Assistant is an operational requirement for running the proposed machine. The objective of this assistant is to acquire knowledge about KDD and to make such knowledge available by representing and organizing it a way that makes it possible to process the above-mentioned assistance functions. A variety of knowledge acquisition resources and techniques were employed in the conception of this assistant.
62

Ressonância magnética funcional em indivíduos normais: base de dados do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo / Functional magnetic resonance imaging of normal subjects: a database for the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo

Martin, Maria da Graça Morais 04 October 2007 (has links)
Introdução: Apesar do grande impacto da ressonância magnética funcional em neurociências, a sua aplicabilidade clínica ainda é pequena. Um dos principais motivos é a falta de dados populacionais para dar suporte à decisão clínica. Esta tese teve por objetivo formar um banco de dados normais, representativo de pacientes do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HCFMUSP). Métodos: Foram estudados 64 acompanhantes normais dos pacientes do HCFMUSP. Cada indivíduo realizou tarefas quem envolviam função de linguagem, somatossensorial, motor, audiovisual e de memória em aparelho de 1,5 T. Foram colhidos dados demográficos, de desempenho e neuropsicológicos dos sujeitos e de controle de qualidade do magneto de RM. As imagens funcionais foram analisadas através do software XBAM para cada indivíduo, para os grupos e para análise de correlação comportamental. Resultados: A amostra teve uma distribução demográfica variada. Os resultados das análises de grupo mostraram padrões de acordo com a literatura. O paradigma motor mostrou efeito BOLD positivo nos giros pré e pós-centrais estendendo-se para regiões pré-motoras e parietais, área motora suplementar, áreas somatosensoriais secundárias, núcleos da base e tálamo contralaterais à mão avaliada e hemisférios cerebelares ipsilaterais. O paradigma somatossensorial das mãos demonstrou efeito BOLD positivo nos giros pré e pós-centrais, núcleos da base e tálamos contralaterais à mão estimulada, cerebelo ipsilateral à mão estimulada e o córtex somatossensorial secundário bilateralmente e o da face mostrou os giros pré e pós-centrais, o córtex parietal, regiões pré-motoras, regiões temporais posteriores e inferiores e área somatosensorial secundária bilateralmente. A análise de grupo dos paradigmas de linguagem mostrou efeito BOLD positivo no giro frontal inferior e ínsula bilateralmente, maiores à esquerda, giro frontal médio esquerdo, cíngulo anterior, área motora suplementar, cerebelo à direita e vermis cerebelar, núcleos da base e tálamos à esquerda e em particular na fluência verbal falada com apresentação de letras diferentes, lobo parietal esquerdo. No paradigma audiovisual a condição visual mostrou efeito BOLD positivo no córtex occipital, parietal e cerebelo bilateralmente e a condição auditiva, nos lobos temporais bilaterais, com extensão fronto-parietal à esquerda. A análise de grupo do paradigma memória mostrou áreas no cerebelo, córtex occipital, giro frontal médio, região frontal mesial anterior e lobo parietal, com predomínio à direita. Nos mapas individuais foram detectadas muitas regiões em cada paradigma e houve grande variabilidade, sendo as regiões cerebrais que apresentaram efeito BOLD positivo com maior frequência ( 85%): giro pré-central esquerdo (95%) e cerebelo superior direito (87%) no movimento da mão direita; giro pré-central direito (88%) no movimento da mão esquerda; giro pós-central esquerdo (88%) no estímulo somatosensorial da mão direita; giro pós-central direito (89%) no estímulo somatosensorial da mão esquerda; giro lingual direito (90%) e esquerdo (88%) no estímulo visual; e giro temporal médio direito (93%) e esquerdo (91%) na condição auditiva. As tarefas de memória e fluência verbal não tiveram nenhuma região com frequência acima de 80%. Conclusões: Os padrões de ativação cerebral obtidos nas imagens de RMf do grupo de participantes são semelhantes à literatura. A freqüência das regiões com efeito BOLD positivo foi maior nos córtices primários sensoriais e motores. As informações colhidas no trabalho constituem uma base de dados que pode ser utilizada para suporte à decisão clínica. / Introduction: Functional magnetic resonance imaging has had a great impact on neuroscience, but its clinical applicability is still small. One of the main reasons is the lack of populational databases to support clinical decision. The aim of this work was to constitute a local normal database, representative of the patients from the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HC-FMUSP). Methods: The sample included 64 normal subjects who, at some point, accompanied patients from the HCFMUSP. They all performed motor, somatosensory, language, audiovisual and memory paradigms in a 1,5 T magnet. Demographic, neuropsychological and behavioral data were collected. Scanner quality control was also verified. Data was analyzed through XBAM software on individual and group basis, and for behavioral correlation. Results: The sample had a variable demographic distribution. Group analysis showed results in agreement with the literature. The motor paradigm elicited positive BOLD effect in the pre and postcentral gyri, extending to premotor and parietal regions, supplementary motor area, secondary somatosensory areas, basal ganglia and thalamus contralateral to the hand in question, and ipsilateral cerebellum. Group analysis of the hand somatosensory paradigm showed pre and postcentral gyri, basal ganglia and thalamus contralateral to the stimulated hand, ipsilateral cerebellum and bilateral secondary somatosensory areas. The group analysis of the somatosensory paradigm of the face showed pre and postcentral gyri, parietal cortex, premotor areas, inferior-posterior temporal cortex and secondary somatosensory areas bilaterally. Language paradigms showed positive BOLD effect in the inferior frontal gyrus and insula bilaterally, bigger on the left, left middle frontal gyrus, anterior cingulate, supplementary motor area, right cerebellum, cerebellar vermis, left basal ganglia and thalamus, and in particular, overt verbal fluency with presentation of different letters also showed the left parietal lobe. The audiovisual paradigm group analysis showed positive BOLD effect in the occipital and parietal cortex and cerebellum bilaterally during the visual condition, and bilateral temporal with left frontal and parietal extension during the auditory condition. Finally, working memory task showed activation in the occipital cortex, cerebellum, middle frontal gyri, parietal association cortex and mesial frontal region bilaterally, with right predominance. On individual basis we detected a multitude of brain areas in each paradigm with great variability, and those with the higher frequency ( 85%) were: left precentral gyrus (95%) and superior right cerebellum (87%) during the right hand movement; right precentral gyrus (88%) during the left hand movement; left postcentral gyrus (88%) for the somatosensory stimulus of the right hand; right postcentral gyrus (89%) for the somatosensory stimulus of the left hand; right (90%) and left (88%) lingual gyri during the visual stimulus; and right (93%) and left (91%) middle temporal gyrus for the auditory stimulus. Working memory and verbal fluency had no region with a frequency above 80%. Conclusions: The patterns of cerebral activations obtained in group analysis are in agreement with the literature. Individual analysis showed a higher frequency of positive BOLD effect in the primary and sensory cortices. The data collected during this work constitute a database that can be used to support clinical decision.
63

Ressonância magnética funcional em indivíduos normais: base de dados do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo / Functional magnetic resonance imaging of normal subjects: a database for the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo

Maria da Graça Morais Martin 04 October 2007 (has links)
Introdução: Apesar do grande impacto da ressonância magnética funcional em neurociências, a sua aplicabilidade clínica ainda é pequena. Um dos principais motivos é a falta de dados populacionais para dar suporte à decisão clínica. Esta tese teve por objetivo formar um banco de dados normais, representativo de pacientes do Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HCFMUSP). Métodos: Foram estudados 64 acompanhantes normais dos pacientes do HCFMUSP. Cada indivíduo realizou tarefas quem envolviam função de linguagem, somatossensorial, motor, audiovisual e de memória em aparelho de 1,5 T. Foram colhidos dados demográficos, de desempenho e neuropsicológicos dos sujeitos e de controle de qualidade do magneto de RM. As imagens funcionais foram analisadas através do software XBAM para cada indivíduo, para os grupos e para análise de correlação comportamental. Resultados: A amostra teve uma distribução demográfica variada. Os resultados das análises de grupo mostraram padrões de acordo com a literatura. O paradigma motor mostrou efeito BOLD positivo nos giros pré e pós-centrais estendendo-se para regiões pré-motoras e parietais, área motora suplementar, áreas somatosensoriais secundárias, núcleos da base e tálamo contralaterais à mão avaliada e hemisférios cerebelares ipsilaterais. O paradigma somatossensorial das mãos demonstrou efeito BOLD positivo nos giros pré e pós-centrais, núcleos da base e tálamos contralaterais à mão estimulada, cerebelo ipsilateral à mão estimulada e o córtex somatossensorial secundário bilateralmente e o da face mostrou os giros pré e pós-centrais, o córtex parietal, regiões pré-motoras, regiões temporais posteriores e inferiores e área somatosensorial secundária bilateralmente. A análise de grupo dos paradigmas de linguagem mostrou efeito BOLD positivo no giro frontal inferior e ínsula bilateralmente, maiores à esquerda, giro frontal médio esquerdo, cíngulo anterior, área motora suplementar, cerebelo à direita e vermis cerebelar, núcleos da base e tálamos à esquerda e em particular na fluência verbal falada com apresentação de letras diferentes, lobo parietal esquerdo. No paradigma audiovisual a condição visual mostrou efeito BOLD positivo no córtex occipital, parietal e cerebelo bilateralmente e a condição auditiva, nos lobos temporais bilaterais, com extensão fronto-parietal à esquerda. A análise de grupo do paradigma memória mostrou áreas no cerebelo, córtex occipital, giro frontal médio, região frontal mesial anterior e lobo parietal, com predomínio à direita. Nos mapas individuais foram detectadas muitas regiões em cada paradigma e houve grande variabilidade, sendo as regiões cerebrais que apresentaram efeito BOLD positivo com maior frequência ( 85%): giro pré-central esquerdo (95%) e cerebelo superior direito (87%) no movimento da mão direita; giro pré-central direito (88%) no movimento da mão esquerda; giro pós-central esquerdo (88%) no estímulo somatosensorial da mão direita; giro pós-central direito (89%) no estímulo somatosensorial da mão esquerda; giro lingual direito (90%) e esquerdo (88%) no estímulo visual; e giro temporal médio direito (93%) e esquerdo (91%) na condição auditiva. As tarefas de memória e fluência verbal não tiveram nenhuma região com frequência acima de 80%. Conclusões: Os padrões de ativação cerebral obtidos nas imagens de RMf do grupo de participantes são semelhantes à literatura. A freqüência das regiões com efeito BOLD positivo foi maior nos córtices primários sensoriais e motores. As informações colhidas no trabalho constituem uma base de dados que pode ser utilizada para suporte à decisão clínica. / Introduction: Functional magnetic resonance imaging has had a great impact on neuroscience, but its clinical applicability is still small. One of the main reasons is the lack of populational databases to support clinical decision. The aim of this work was to constitute a local normal database, representative of the patients from the Hospital das Clínicas da Faculdade de Medicina da Universidade de São Paulo (HC-FMUSP). Methods: The sample included 64 normal subjects who, at some point, accompanied patients from the HCFMUSP. They all performed motor, somatosensory, language, audiovisual and memory paradigms in a 1,5 T magnet. Demographic, neuropsychological and behavioral data were collected. Scanner quality control was also verified. Data was analyzed through XBAM software on individual and group basis, and for behavioral correlation. Results: The sample had a variable demographic distribution. Group analysis showed results in agreement with the literature. The motor paradigm elicited positive BOLD effect in the pre and postcentral gyri, extending to premotor and parietal regions, supplementary motor area, secondary somatosensory areas, basal ganglia and thalamus contralateral to the hand in question, and ipsilateral cerebellum. Group analysis of the hand somatosensory paradigm showed pre and postcentral gyri, basal ganglia and thalamus contralateral to the stimulated hand, ipsilateral cerebellum and bilateral secondary somatosensory areas. The group analysis of the somatosensory paradigm of the face showed pre and postcentral gyri, parietal cortex, premotor areas, inferior-posterior temporal cortex and secondary somatosensory areas bilaterally. Language paradigms showed positive BOLD effect in the inferior frontal gyrus and insula bilaterally, bigger on the left, left middle frontal gyrus, anterior cingulate, supplementary motor area, right cerebellum, cerebellar vermis, left basal ganglia and thalamus, and in particular, overt verbal fluency with presentation of different letters also showed the left parietal lobe. The audiovisual paradigm group analysis showed positive BOLD effect in the occipital and parietal cortex and cerebellum bilaterally during the visual condition, and bilateral temporal with left frontal and parietal extension during the auditory condition. Finally, working memory task showed activation in the occipital cortex, cerebellum, middle frontal gyri, parietal association cortex and mesial frontal region bilaterally, with right predominance. On individual basis we detected a multitude of brain areas in each paradigm with great variability, and those with the higher frequency ( 85%) were: left precentral gyrus (95%) and superior right cerebellum (87%) during the right hand movement; right precentral gyrus (88%) during the left hand movement; left postcentral gyrus (88%) for the somatosensory stimulus of the right hand; right postcentral gyrus (89%) for the somatosensory stimulus of the left hand; right (90%) and left (88%) lingual gyri during the visual stimulus; and right (93%) and left (91%) middle temporal gyrus for the auditory stimulus. Working memory and verbal fluency had no region with a frequency above 80%. Conclusions: The patterns of cerebral activations obtained in group analysis are in agreement with the literature. Individual analysis showed a higher frequency of positive BOLD effect in the primary and sensory cortices. The data collected during this work constitute a database that can be used to support clinical decision.
64

Uma abordagem contingencial de gerenciamento de projetos no desenvolvimento de uma ferramenta de apoio à gestão da pós-graduação stricto sensu / A project management contingency approach in the development of a tool to support stricto sensu post-graduation management

Silva, Ricardo Antônio Câmara da 12 May 2016 (has links)
Submitted by Nadir Basilio (nadirsb@uninove.br) on 2016-07-01T21:30:23Z No. of bitstreams: 1 Ricardo Antonio Camara Da Silva.pdf: 2485810 bytes, checksum: f152647370f0e6a1c84222f03ca5c34b (MD5) / Made available in DSpace on 2016-07-01T21:30:23Z (GMT). No. of bitstreams: 1 Ricardo Antonio Camara Da Silva.pdf: 2485810 bytes, checksum: f152647370f0e6a1c84222f03ca5c34b (MD5) Previous issue date: 2016-05-12 / The strong acceleration that has been happening in the development and use of information initiated a transition process with major implications for the societies around the world, affecting education, among many other aspects of life. Higher Education Institutions (HEIs) are organizations devoted to the creation, transmission and dissemination of knowledge, playing a prominent role in the processes that shape contemporary society. Efficient management of the HEIs is required to create and maintain a competitive advantage, so that they can meet government standards of academic quality and still face competition, as a condition for their continuity. The post-graduation programs play important role to help HEIs meet their goals. The scientific production of Brazilian post-graduation is an important source of knowledge, directly contributing to the production and scientific development of the country. Information related to it, however, are stored in different and non integrated bases. There are difficulties to retrieve data in a direct way, in order to perform analyzes on the production of a university, a knowledge area or a geographical region, supporting HEIs management. This work consists in an applied, qualitative exploratory study, carried out by the method of action research. It aims at investigating the application of a contingency approach to manage a project to develop a tool with practical application: support stricto sensu post-graduation management. In the initial phase of the project, the Adaptive approach was chosen, by applying the Project Management Life Cycle method. The work includes the integration of data stored in government agencies databases, such as those in CAPES and CNPq sites. Besides that, includes building a prototype, that provides consultations to the integrated data and allows automated generation of entry lists to ScriptSucupira program. The implementation of the proposed tool will facilitate more efficient retrieval of scientific production of Brazilian post-graduation professors, contributing to the generation of knowledge and expertise to support post-graduate programs management, in activities such as providing information to CAPES evaluation system, academic production analysis, collaborative researchers networks analysis, program monitoring and evaluation, among other initiatives. / A forte aceleração que tem se verificado no desenvolvimento e uso da informação iniciou um processo de transição com grandes implicações para as sociedades em todo o mundo, afetando a educação, entre vários outros aspectos da vida. As Instituições de Ensino Superior (IESs) são organizações voltadas para a criação, transmissão e disseminação do conhecimento, que desempenham papel destacado nos processos que configuram a sociedade contemporânea. A gestão eficiente das IESs é necessária para criar e manter uma vantagem competitiva, de forma que seja possível cumprir as normas governamentais de qualidade acadêmica e ainda enfrentar a concorrência, como condição para continuidade. Os programas de pós-graduação desempenham papel de destaque para que as IESs cumpram seus objetivos. A produção científica da pós-graduação brasileira é importante fonte geradora de conhecimento, contribuindo diretamente para o desenvolvimento produtivo e científico do país. As informações referentes a ela, entretanto, estão armazenadas em bancos de dados diferentes e não integrados. Há dificuldades para recuperar dados de maneira direta, a fim de realizar análises sobre a produção de uma universidade, uma área de conhecimento ou uma região geográfica, apoiando a gestão das IESs. Este trabalho constitui-se em uma pesquisa aplicada, qualitativa e exploratória, realizada pelo método da pesquisa-ação. Tem como objetivo investigar a aplicação de uma abordagem contingencial no gerenciamento de um projeto destinado a desenvolver uma ferramenta com aplicação prática no apoio à gestão da pós graduação stricto sensu. Na fase inicial do projeto foi escolhida a abordagem Adaptativa, por meio da aplicação do método do Ciclo de Vida de Gerenciamento de Projetos. O trabalho compreende a integração de dados armazenados em bancos dos órgãos governamentais CAPES e CNPq, assim como a construção de um protótipo que disponibilize consultas aos dados integrados e permita a geração automatizada de listas de entrada para o programa ScriptSucupira. A implementação da ferramenta proposta facilitará a recuperação mais eficiente da produção científica dos docentes, contribuindo para a geração de conhecimentos teóricos e práticos capazes de apoiar a gestão de programas de pós-graduação stricto sensu, em atividades como o fornecimento de informações para o sistema de avaliação da CAPES, análises de produção acadêmica, análises de redes de colaboração de pesquisadores, formulação de políticas, acompanhamento e avaliação de programas de pós-graduação, entre outras iniciativas.
65

[en] PARALLEL PROGRAMING IN THE REDIS KEY-VALUE DATASTORE / [pt] PROGRAMAÇÃO PARALELA NO BANCO DE DADOS CHAVE-VALOR REDIS

JUAREZ DA SILVA BOCHI 12 April 2016 (has links)
[pt] Redis é um banco de dados chave-valor de código livre que dá suporte à avaliação de scripts Lua, mas sua implementação utiliza apenas uma tarefa de sistema operacional. Scripts longos são desencorajados porque a avaliação do código é bloqueante, o que pode causar degradação de desempenho para os demais usuários. Através da aplicação do modelo de concorrência M:N, que combina tarefas de nível de sistema operacional com tarefas do nível de usuário, adicionamos no Redis a capacidade de execução de scripts em paralelo, permitindo que todos os núcleos do servidor sejam explorados. Com a utilização de corotinas Lua, implementamos um escalonador capaz de alocar e suspender a execução de tarefas de nível de usuário nos núcleos disponíveis sem necessidade de alteração do código dos scripts. Este modelo permitiu proteger o programador das complexidades naturais do paralelismo como sincronização no acesso a recursos compartilhados e escalonamento das tarefas. / [en] Redis is an open source key-value database that supports Lua programming language scripts, but it s implementation is single threaded. Long running scripts are discouraged because script evaluation is blocking, which may cause service levels deterioration. Applying the M:N threading model, which combines user and operating system threads, we added to Redis the ability of running scripts in parallel, leveraging all server cores.With the use of Lua coroutines, we implemented a scheduler able to allocate and suspend user-level tasks in the available cores without the need of changing scripts source code. The M:N model allowed us to protect the programmer from the natural complexities that arise from parallel programming, such as access to shared resources synchronization and scheduling of tasks into different operational system threads.
66

Uso de propriedades visuais-interativas na avaliação da qualidade de dados / Using visual-interactive properties in the data quality assessment

Josko, João Marcelo Borovina 29 April 2016 (has links)
Os efeitos dos dados defeituosos sobre os resultados dos processos analíticos são notórios. Aprimorar a qualidade dos dados exige estabelecer alternativas a partir de vários métodos, técnicas e procedimentos disponíveis. O processo de Avaliação da Qualidade dos Dados - pAQD - provê relevantes insumos na definição da alternativa mais adequada por meio do mapeamento dos defeitos nos dados. Relevantes abordagens computacionais apoiam esse processo. Tais abordagens utilizam métodos quantitativos ou baseados em asserções que usualmente restringem o papel humano a interpretação dos seus resultados. Porém, o pAQD depende do conhecimento do contexto dos dados visto que é impossível confirmar ou refutar a presença de defeitos baseado exclusivamente nos dados. Logo, a supervisão humana é essencial para esse processo. Sistemas de visualização pertencem a uma classe de abordagens supervisionadas que podem tornar visíveis as estruturas dos defeitos nos dados. Apesar do considerável conhecimento sobre o projeto desses sistemas, pouco existe para o domínio da avaliação visual da qualidade dos dados. Isto posto, este trabalho apresenta duas contribuições. A primeira reporta uma taxonomia que descreve os defeitos relacionados aos critérios de qualidade da acuracidade, completude e consistência para dados estruturados e atemporais. Essa taxonomia seguiu uma metodologia que proporcionou a cobertura sistemática e a descrição aprimorada dos defeitos em relação ao estado-da-arte das taxonomias. A segunda contribuição reporta relacionamentos entre propriedades-defeitos que estabelecem que certas propriedades visuais-interativas são mais adequadas para a avaliação visual de certos defeitos em dadas resoluções de dados. Revelados por um estudo de caso múltiplo e exploratório, esses relacionamentos oferecem indicações que reduzem a subjetividade durante o projeto de sistemas de visualização de apoio a avaliação visual da qualidade dos dados. / The effects of poor data quality on the reliability of the outcomes of analytical processes are notorious. Improving data quality requires alternatives that combine procedures, methods, techniques and technologies. The Data Quality Assessment process - DQAp - provides relevant and practical inputs for choosing the most suitable alternative through a data defects mapping. Relevant computational approaches support this process. Such approaches apply quantitative or assertions-based methods that usually limit the human interpretation of their outcomes. However, the DQAp process strongly depends on data context knowledge since it is impossible to confirm or refute a defect based only on data. Hence, human supervision is essential throughout this process. Visualization systems belong to a class of supervised approaches that can make visible data defect structures. Despite their considerable design knowledge encodings, there is little support design to data quality visual assessment. Therefore, this work reports two contributions. The first reports a taxonomy that organizes a detailed description of defects on structured and timeless data related to the quality criteria of accuracy, completeness and consistency. This taxonomy followed a methodology which enabled a systematic coverage of data defects and an improved description of data defects in regard to state-of-art literature. The second contribution reports a set of property-defect relationships that establishes that certain visual and interactive properties are more suitable for visual assessment of certain data defects in a given data resolution. Revealed by an exploratory and multiple study case, these relationships provides implications that reduce the subjectivity in the visualization systems design for data quality visual assessment.
67

Habeas data e tutela jurisdicional da privacidade: aspectos processuais / Habeas data: judicial protection of privacy procedural

Ribeiro, Sérgio Luiz de Almeida 24 September 2013 (has links)
Made available in DSpace on 2016-04-26T20:22:03Z (GMT). No. of bitstreams: 1 Sergio Luiz de Almeida Ribeiro.pdf: 960554 bytes, checksum: 933a380e14a9abc84a29f86a8f043069 (MD5) Previous issue date: 2013-09-24 / This dissertation is about the habeas data and its procedural aspects, as a mean to protect privacy. The main objective of this study is to analyze the usefulness of this feature as a specific instrument for protection of individuals' privacy, as well as to ensure that citizens may control the wrongful use of their personal data through social networks and credit protection institutions. In this sense, the habeas data would not be restricted to obtaining general information or rectifying data before public authorities and private companies. In order to achieve this purpose, and based on the deductive method and bibliographical research, the following topics have been addressed in this paper: historical aspects, concept and objetive of the habeas data, proceedings upon habeas data under Law 9507/1997, and, lastly, controversial aspects on habeas data. As a conclusion, the main criticism developed herein is related to the comparison between the habeas data and the writ of mandamus, which has caused a procedural impact on the Law 9507/97. This Law, that rules the habeas data, changed the primary constitutional objective of it, which was very much related to the protection of privacy and the proceedings to achieve this objective. Another criticism that is addressed herein is related to the rule that imposes to the parties the burden of having an entire administrative process before making use of the habeas data to obtain information or rectify personal data. In theory, this rule refrains the habeas data to become an effective instrument for the avoidance of damages to individuals' privacy caused by credit protection institutions and social networks, for instance / Versa a presente dissertação sobre o instituto do habeas data como tutela jurisdicional da intimidade e seus aspectos processuais. O principal objetivo é analisar a utilidade do referido instituto como instrumento específico de proteção da vida íntima e evidenciar a possibilidade de o indivíduo exercer preventivamente o controle do manuseio indevido de dados pessoais por entidades mantenedoras de bancos dados, como é o caso de redes sociais e órgãos de proteção ao crédito, não se restringindo apenas ao meio processual para obter e/ou retificar informações em entidades mantenedoras de bancos dados, públicas e privadas de caráter público. Para atingir esse propósito, e com o suporte metodológico da abordagem dedutiva e da técnica de pesquisa bibliográfica, os seguintes assuntos foram abordados: aspectos históricos, conceito e escopo do habeas data, o procedimento da ação de habeas data na disciplina da Lei nº 9.507/1997 e, por último, as questões ainda controvertidas acerca do referido instituto. A título de conclusão, a principal crítica que emerge do tema analisado alude à comparação do habeas data ao mandado de segurança, que repercutiu no procedimento adotado por sua norma específica (Lei nº 9.507/1997), afastando assim este remédio constitucional da sua finalidade precípua, qual seja, preservar objetivamente a vida íntima e servir como instrumento processual específico para esse fim. Outra crítica se refere à exigência de o jurisdicionado trilhar e esgotar toda a via administrativa antes de se socorrer do Judiciário, por meio do habeas data, para obtenção de informações e/ou retificação de dados incorretos a seu respeito. Em rigor, tal exigência impede que o habeas data seja instrumento eficaz na prevenção de danos da vida privada perpetrados por órgãos de proteção ao crédito e redes sociais, por exemplo
68

[en] DATA MINING APPLIED TO DIRECT MARKETING AND MARKET SEGMENTATION / [es] MINERACIÓN DE DATOS PARA LA SOLUCIÓN DE PROBLEMAS DE MARKETING DIRECTO Y SEGMENTACIÓN DE MERCADO / [pt] MINERAÇÃO DE DADOS APLICADA NA SOLUÇÃO DE PROBLEMAS DE MARKETING DIRETO E SEGMENTAÇÃO DE MERCADO

HUGO LEONARDO COSTA DE AZEVEDO 28 August 2001 (has links)
[pt] Devido à quantidade cada vez maior de dados armazenada pelas instituições, a área de mineração de dados tem se tornado cada vez mais relevante e vários métodos e métodos têm sido propostos de maneira a aumentar sua aplicabilidade e desempenho. Esta dissertação investiga o uso de diversos métodos e técnicas de mineração de dados na modelagem e solução de problemas de Marketing. O objetivo do trabalho foi fazer um levantamento de alguns métodos e técnicas de mineração, avaliar seus desempenhos e procurar integrá-los na solução de problemas de marketing que envolvessem tarefas de agrupamento ou classificação. O trabalho consistiu de quatro etapas principais: estudo sobre o processo de descoberta de conhecimento em bancos de dados (KDD - Knowledge Discovery in Databases); estudo sobre Marketing e alguns problemas de Marketing de Banco de Dados (DBM - Database Marketing) que envolvessem tarefas de agrupamento e classificação; levantamento e estudo de métodos e técnicas de Inteligência Computacional e Estatística que pudessem ser empregados na solução de alguns desses problemas; e estudos de caso. A primeira etapa do trabalho envolveu um estudo detalhado das diversas fases do processo de KDD: limpeza dos dados; seleção; codificação e transformação; redução de dimensionalidade; mineração; e pós-processamento. Na segunda etapa foram estudados os principais conceitos de Marketing e de DBM e a relação entre eles e o processo de KDD. Pesquisaram-se alguns dos tipos de problemas comuns na área e escolheram- se para análise dois que fossem suficientemente complexos e tivessem a possibilidade de se ter acesso a alguma empresa que fornecesse os dados e validasse a solução posteriormente. Os casos selecionados foram um de marketing direto e outro de segmentação de mercado. Na terceira etapa, foram estudados os métodos de Inteligência Computacional e Estatística usualmente empregados em tarefas de agrupamento e classificação de dados. Foram estudados: Redes Perceptron Multi-Camadas, Mapas Auto- Organizáveis, Fuzzy C-Means, K-means, sistemas Neuro-Fuzzy, Árvores de Decisão, métodos Hierárquicos de agrupamento, Regressão Logística, Fuções Discriminantes de Fisher, entre outros. Por fim, na última etapa, procurou-se integrar todos os métodos e técnicas estudados na solução de dois estudos de caso, propostos inicialmente na segunda etapa do trabalho. Uma vez proposta a solução para os estudos de caso, elas foram levadas aos especialistas em Marketing das empresas para serem validadas no âmbito do negócio. Os estudos de caso mostraram a grande utilidade e aplicabilidade dos métodos e técnicas estudadas em problemas de marketing direto e segmentação de mercado. Sem o emprego dos mesmos, a solução para muitos desses problemas tornar-se-ia extremamente imprecisa ou até mesmo inviável. Mostraram também a grande importância das fases iniciais de pré-processamento dos dados no processo de KDD. Muitos desafios persistem ainda na área de mineração de dados, como a dificuldade de modelar dados não lineares e de manipular quantidades muito grande de dados, o que garante um vasto campo para pesquisa nos próximos anos. / [en] The Data Mining field has received great attention lately, due to the increasing amount of data stored by companies and institutions. A great number of Data Mining methods have been proposed so far, which is good but sometimes leads to confusion. This dissertation investigates the performance of many different methods and techniques of Data Mining used to model and solve Marketing problems. The goal of this research was to look for and study some data mining methods, compare them, and try to integrate them to solve Marketing problems involving clustering and classification tasks. This research can be divided in four stages: a study of the process of Knowledge Discovery in Databases (KDD); a study about Marketing problems involving clustering and classification; a study of some methods and techniques of Statistics and Computational Intelligence that could be used to solve some of those problems; and case studies. On the first stage of the research, the different tasks (clustering, classification, modeling, etc) and phases (data cleansing, data selection, data transformation, Data Mining, etc) of a KDD process were studied in detail. The second stage involved a study of the main concepts of Marketing and Database Marketing and their relation to the KDD process. The most common types of problems in the field were studied and, among them, two were selected to be furthered analyzed as case studies. One case was related to Direct Marketing and the other to Market Segmentation. These two cases were chosen because they were complex enough and it was possible to find a company to provide data to the problem and access to their marketing department. On the third stage, many different methods for clustering and classification were studied and compared. Among those methods, there were: Multilayer Perceptrons, Self Organizing Maps, Fuzzy C-Means, K-Means, Neuro-Fuzzy systems, Decision Trees, Hierarquical Clustering Methods, Logistic Regression, Fisher`s Linear Discriminants, etc Finally, on the last stage, all the methods and techniques studied were put together to solve the two case studies proposed earlier. Once they were solved, their solutions were submitted to the Marketing Department of the company who provided the data, so that they could validate the results in the context of their business. The case studies were able to show the large potential of applicability of the methods and techniques studied on problems of Market Segmentation and Direct Marketing. Without employing those methods, it would be very hard or even impossible to solve those problems. The case studies also helped verify the very important role of the data pre-processing phase on the KDD process. Many challenges persist in the data mining field. One could mention, for example, the difficulty to model non-linear data and to manipulate larges amounts of data. These and many other challenges provide a vast field of research to be done in the next years. / [es] Debido a la cantidad cada vez mayor de datos almacenados por las instituiciones, el área de mineración de datos há ganado relevancia y varios métodos han sido propuestos para aumentar su aplicabilidad y desempeño. Esta disertación investiga el uso de diversos métodos y técnicas de mineración de datos en la modelación y solución de problemas de Marketing. EL objetivo del trabajo fue hacer un levantamiento de algunos métodos y técnicas de mineración, evaluar su desempeño e integrarlos en la solución de problemas de marketing que involucran tareas de agrupamiento y clasificación. EL trabajo consta de cuatro etapas principales: estudio sobre el proceso de descubrimiento de conocimientos en bancos de datos (KDD - Knowledge Discovery in Databases); estudio sobre Marketing y algunos problemas de Marketing de Banco de Datos (DBM - Database Marketing) que incluyen tareas de agrupamientoy clasificación; levantamiento y estudio de métodos y técnicas de Inteligencia Computacional y Estadística que pueden ser empleados en la solución de algunos problemas; y por último, estudios de casos. La primera etapa del trabajo contiene un estudio detallado de las diversas fases del proceso de KDD: limpeza de datos; selección; codificación y transformación; reducción de dimensionalidad; mineración; y posprocesamento. En la segunda etapa fueron estudados los principales conceptos de Marketing y de DBM y la relación entre ellos y el proceso de KDD. Algunos de los tipos de problemas comunes en la área fueron investigados, seleccionando dos de ellos, por ser suficientemente complejos y tener posibilidad de acceso a alguna empresa que suministrase los datos y evaluase posteriormente la solución. Los casos selecionados fueron uno de marketing directo y otro de segmentación de mercado. En la tercera etapa, se estudiaron los métodos de Inteligencia Computacional y Estadística que son empleados usualmente en tareas de agrupamiento y clasificación de datos. Éstos fueron: Redes Perceptron Multicamada, Mapas Autoorganizables, Fuzzy C-Means, K-means, sistemas Neuro- Fuzzy, Árboles de Decisión, métodos Jerárquicos de agrupamiento, Regresión Logística, Fuciones Discriminantes de Fisher, entre otros. En la última etapa, se integraron todos los métodos y técnicas estudiados en la solución de dos estudios de casos, propuestos inicialmente en la segunda etapa del trabajo. Una vez proposta la solución para el estudios de casos, éstas fueron evaluadas por los especialistas en Marketing de las empresas. Los estudios de casos mostraron la grande utilidad y aplicabilidad de los métodos y técnicas estudiadas en problemas de marketing directo y segmentación de mercado. Sin el empleo de dichos métodos, la solución para muchos de esos problemas sería extremadamente imprecisa o hasta incluso inviáble. Se comprobó también la gran importancia de las fases iniciales de preprocesamiento de datos en el proceso de KDD. Existen todavía muchos desafíos en el área de mineración de datos, como la dificuldad de modelar datos no lineales y de manipular cantidades muy grandes de datos, lo que garantiza un vasto campo de investigación
69

Uso de propriedades visuais-interativas na avaliação da qualidade de dados / Using visual-interactive properties in the data quality assessment

João Marcelo Borovina Josko 29 April 2016 (has links)
Os efeitos dos dados defeituosos sobre os resultados dos processos analíticos são notórios. Aprimorar a qualidade dos dados exige estabelecer alternativas a partir de vários métodos, técnicas e procedimentos disponíveis. O processo de Avaliação da Qualidade dos Dados - pAQD - provê relevantes insumos na definição da alternativa mais adequada por meio do mapeamento dos defeitos nos dados. Relevantes abordagens computacionais apoiam esse processo. Tais abordagens utilizam métodos quantitativos ou baseados em asserções que usualmente restringem o papel humano a interpretação dos seus resultados. Porém, o pAQD depende do conhecimento do contexto dos dados visto que é impossível confirmar ou refutar a presença de defeitos baseado exclusivamente nos dados. Logo, a supervisão humana é essencial para esse processo. Sistemas de visualização pertencem a uma classe de abordagens supervisionadas que podem tornar visíveis as estruturas dos defeitos nos dados. Apesar do considerável conhecimento sobre o projeto desses sistemas, pouco existe para o domínio da avaliação visual da qualidade dos dados. Isto posto, este trabalho apresenta duas contribuições. A primeira reporta uma taxonomia que descreve os defeitos relacionados aos critérios de qualidade da acuracidade, completude e consistência para dados estruturados e atemporais. Essa taxonomia seguiu uma metodologia que proporcionou a cobertura sistemática e a descrição aprimorada dos defeitos em relação ao estado-da-arte das taxonomias. A segunda contribuição reporta relacionamentos entre propriedades-defeitos que estabelecem que certas propriedades visuais-interativas são mais adequadas para a avaliação visual de certos defeitos em dadas resoluções de dados. Revelados por um estudo de caso múltiplo e exploratório, esses relacionamentos oferecem indicações que reduzem a subjetividade durante o projeto de sistemas de visualização de apoio a avaliação visual da qualidade dos dados. / The effects of poor data quality on the reliability of the outcomes of analytical processes are notorious. Improving data quality requires alternatives that combine procedures, methods, techniques and technologies. The Data Quality Assessment process - DQAp - provides relevant and practical inputs for choosing the most suitable alternative through a data defects mapping. Relevant computational approaches support this process. Such approaches apply quantitative or assertions-based methods that usually limit the human interpretation of their outcomes. However, the DQAp process strongly depends on data context knowledge since it is impossible to confirm or refute a defect based only on data. Hence, human supervision is essential throughout this process. Visualization systems belong to a class of supervised approaches that can make visible data defect structures. Despite their considerable design knowledge encodings, there is little support design to data quality visual assessment. Therefore, this work reports two contributions. The first reports a taxonomy that organizes a detailed description of defects on structured and timeless data related to the quality criteria of accuracy, completeness and consistency. This taxonomy followed a methodology which enabled a systematic coverage of data defects and an improved description of data defects in regard to state-of-art literature. The second contribution reports a set of property-defect relationships that establishes that certain visual and interactive properties are more suitable for visual assessment of certain data defects in a given data resolution. Revealed by an exploratory and multiple study case, these relationships provides implications that reduce the subjectivity in the visualization systems design for data quality visual assessment.
70

[en] A NOVEL SOLUTION TO EMPOWER NATURAL LANGUAGE INTERFACES TO DATABASES (NLIDB) TO HANDLE AGGREGATIONS / [pt] UMA NOVA SOLUÇÃO PARA CAPACITAR INTERFACES DE LINGUAGEM NATURAL PARA BANCOS DE DADOS (NLIDB) PARA LIDAR COM AGREGAÇÕES

ALEXANDRE FERREIRA NOVELLO 19 July 2021 (has links)
[pt] Perguntas e Respostas (Question Answering - QA) é um campo de estudo dedicado à construção de sistemas que respondem automaticamente a perguntas feitas em linguagem natural. A tradução de uma pergunta feita em linguagem natural em uma consulta estruturada (SQL ou SPARQL) em um banco de dados também é conhecida como Interface de Linguagem Natural para Bancos de Dados (Natural Language Interface to Database - NLIDB). Os sistemas NLIDB geralmente não lidam com agregações, que podem ter os seguintes elementos: funções de agregação (como contagem, soma, média, mínimo e máximo), uma cláusula de agrupamento (GROUP BY) e uma cláusula HAVING. No entanto, eles fornecem bons resultados para consultas normais. Esta dissertação aborda a criação de um módulo genérico, para ser utilizado em sistemas NLIDB, que permite a tais sistemas realizar consultas com agregações, desde que os resultados da consulta que o NLIDB retorna sejam, ou possam ser transformados, em um resultado no formato tabular. O trabalho cobre agregações com especificidades como ambiguidades, diferenças de escala de tempo, agregações em atributos múltiplos, o uso de adjetivos superlativos, reconhecimento básico de unidade de medida, agregações em atributos com nomes compostos e subconsultas com funções de agregação aninhadas em até dois níveis. / [en] Question Answering (QA) is a field of study dedicated to building systems that automatically answer questions asked in natural language. The translation of a question asked in natural language into a structured query (SQL or SPARQL) in a database is also known as Natural Language Interface to Database (NLIDB). NLIDB systems usually do not deal with aggregations, which can have the following elements: aggregation functions (as count, sum, average, minimum and maximum), a grouping clause (GROUP BY) and a having clause (HAVING). However, they deliver good results for normal queries. This dissertation addresses the creation of a generic module, to be used in NLIDB systems, that allows such systems to perform queries with aggregations, on the condition that the query results the NLIDB return are, or can be transformed into, a result set in the form of a table. The work covers aggregations with specificities such as ambiguities, timescale differences, aggregations in multiple attributes, the use of superlative adjectives, basic unit measure recognition, aggregations in attributes with compound names and subqueries with aggregation functions nested up to two levels.

Page generated in 0.0793 seconds