• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 133
  • 14
  • 1
  • Tagged with
  • 152
  • 152
  • 60
  • 41
  • 33
  • 30
  • 29
  • 24
  • 22
  • 18
  • 17
  • 17
  • 15
  • 15
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
101

Comunicação científica na área de Saúde Pública: perspectivas para a tomada de decisão em saúde baseada em conhecimento / Public health scientific communication: perspectives for knowledge based health decision making

Castro, Regina Célia Figueiredo 08 April 2003 (has links)
Objetivos. Reflexos das transformações sociais promovidas pela Sociedade do Conhecimento são percebidos no contexto da gestão em saúde no Brasil. Apresentam-se referencial teórico sobre essas mudanças, gestão do SUS, sistemas de informação em saúde, produção científica e uso da informação na gestão. Foi analisada a produção científica brasileira em saúde pública como fonte de apoio à tomada de decisão em saúde. Metodologia. Foram feitos estudo exploratório qualitativo e análise documental em três áreas: bases de dados bibliográficas disponíveis na Biblioteca Virtual em Saúde, agendas estaduais de saúde e sites das Secretarias Estaduais de Saúde. Resultados. Os principais resultados foram: as bases de dados LILACS e MEDLINE foram as fontes de apoio mais abrangentes para localizar produção brasileira publicada no país e no exterior, respectivamente; a produção científica brasileira destaca-se nessa área, correspondendo a 39 por cento dos registros da LILACS-SP; as principais instituições produtoras são universidades e organismos governamentais; a produção de saúde pública encontra-se distribuída em revistas de outras áreas da saúde; a internet, já utilizada pelo ministério e pelas secretarias de saúde, seria favorável para disseminação de conhecimento científico para a gestão em saúde. Conclusões e recomendações. A informação científica e técnica disponível poderia apoiar os processos de tomada de decisão, mas o caminho entre sua produção e uso não é linear e precisa ser estimulado. São apresentadas sugestões para promover integração e articulação entre pesquisa científica e decisão política. / Objectives. Social changes introduced by Knowledge Society are perceptible in the health management context in Brazil. Literature on these social changes, on National Health System - SUS legislation, on health information systems, on the health scientific production and on its use for decision making was reviewed. Brazilian public health scientific literature as support to health decision making was analyzed. Methods. Qualitative exploratory methods and document analysis were used to study bibliographic databases available at the Virtual Health Library, health agendas and sites of the State Secretaries of Health. Results. The main results were: LILACS and MEDLINE databases were the most comprehensive sources for searching Brazilian public health literature; 39 per cent of LILACS-SP records corresponds to Brazilian public health literature; universities and government institutions are the main producers of public health scientific literature; public health journal articles are published also in journals from other health fields; Internet, which is already being used by Ministry and State Secretaries of Health for communication, could be a favorable environment for dissemination of scientific information for health decision making. Conclusions and recommendations. Available health scientific and technical information could support health decision making processes but the channels between its production and use are not linear and need to be strengthened. Recommendations to improve relationship and interaction between health research and policy were presented.
102

A aprendizagem da busca bibliográfica pelo estudante de graduação em enfermagem / Learning concerning bibliographic search of nursing undergraduate students

Malerbo, Maria Bernadete 21 September 2011 (has links)
O advento da internet e sua constante evolução exigiu o desenvolvimento de sistemas de informação em saúde, permitindo aos alunos de enfermagem o acesso à informação mais amplo, rápido e eficaz, agregando qualidade às buscas bibliográficas. Apesar da evolução e dinâmica atualização desses recursos informacionais, além da sua disponibilização gratuita, alguns alunos ainda apresentam fragilidades quando se envolvem com a busca e recuperação dessa informação. O objetivo desse estudo qualitativo é conhecer e analisar como são realizadas as buscas bibliográficas quanto à elaboração das estratégias de busca, determinação dos descritores de assunto, uso de bases de dados bibliográficas, recuperação de documentos em texto completo e quais são as dificuldades e os avanços encontrados nesse processo por alunos de graduação em enfermagem, dos cursos de Bacharelado e Bacharelado e Licenciatura da Escola de Enfermagem de Ribeirão Preto-USP. Foram entrevistados 21 alunos desses cursos no mês de novembro de 2010. A partir da análise temática, foram configurados alguns temas: 1 - necessidades e práticas de busca da informação: dificuldades experimentadas pelos estudantes de enfermagem; 2 - a organização do ensino da busca bibliográfica e o papel do professor e 3 - o bibliotecário como educador. O Google destaca-se como principal recurso de busca da WEB privilegiado pelos estudantes, tendo em vista dificuldades de acesso às bases de dados bibliográficas, de domínio da língua inglesa e de recuperação de texto completo. Os alunos apontam a necessidade de orientações e apoio por parte dos professores, assim como destacam atividades educativas desenvolvidas pelo bibliotecário de modo pontual. Nesse contexto, faz-se necessário rever o ensino da busca bibliográfica, inserindo atividade educativa de modo mais integrado às disciplinas dos currículos dos cursos envolvidos, ao longo do processo de formação; reconstruir as práticas pedagógicas dessas atividades, a partir de referencial problematizador e fortalecer a parceria entre professor e bibliotecários. Este estudo também desperta reflexões sobre a formação e a prática profissional do bibliotecário, tendo em vista sua inserção mais significativa no apoio ao desenvolvimento dos cursos de graduação, no contexto da Universidade. / The advent of the Internet and its constant evolution demanded the development of health information systems, which has provided nursing students broad, fast and efficient access to information, adding quality to bibliographic searches. Despite the improved and dynamic actualization of these information resources and their free access, some students still experience difficulties when attempting to search and retrieve information. This qualitative study identifies and analyzes how these bibliographic searches are performed in terms of search strategies, choice of subject descriptors, use of bibliographic databases, recovery of full text documents and also investigates the difficulties faced and advancements achieved in this process by undergraduate nursing students from the Bachelor and Teaching Degree Programs at the University of São Paulo at Ribeirão Preto, College of Nursing. A total of 21 students from these programs were interviewed in November 2010. Some themes emerged from the thematic analysis: 1 - Needs and information-seeking practices: difficulties faced by nursing students; 2 - Organization of teaching bibliographic searches and the role of professors; and 3 - The librarian as an educator. Google stands out as the main search resource on the web used by students given the difficulties faced in accessing bibliographic databases, English-based databases, and in the recovery of full texts. Students point to the need to obtain guidance and support from professors and also stress one-time educational activities developed by the librarian. The need to review the teaching of bibliographic searching is identified in order to include educational activities in a more integrated manner with the courses from the involved programs over the educational process, reconstruct the pedagogical practices of such activities based on the problematizing framework, and strengthen the partnership between professors and librarians. This study also encourages reflecting on the education and professional practice of librarians toward a more significant participation in supporting the development of undergraduate programs in the university context.
103

"Visualizando a organização e o comportamento de estruturas métricas: aplicações em consultas por similaridade" / Visualizing the organization and behavior of metric access methods: Applications in similarity queries

Chino, Fábio Jun Takada 23 April 2004 (has links)
O uso da computação em uma variedade cada vez maior de aplicações fez com que os Sistemas de Gerenciamento de Bases de Dados (SGBD) passassem a ser utilizados para armazenar os mais diversos tipos de dados complexos, como imagens, sons e cadeias de DNA entre outros. Consultas baseadas em relações de ordem total ou igualdade não podem ser aplicadas ou tem aplicações limitadas quando executadas nestes conjuntos de dados. Logo, efetua-se consultas por similaridade baseadas no conteúdo de dados desses tipos. Se tais conjuntos de dados podem ser representados em um espaço métrico, é possível utilizar os Métodos de Acesso Métricos (MAM), como a Slim-Tree, a M-Tree e a DBM-Tree, para otimizar as consultas por similaridade. Porém, os MAM são muito difíceis de compreender e analisar devido à complexidade de suas estruturas. Esta dissertação apresenta um sistema de visualização que permite a inspeção visual da organização e do comportamento de MAM, provendo aos desenvolvedores e administradores de SGBD uma forma rápida e fácil para obter informações essenciais sobre estas estruturas que podem levar a melhorias no desempenho de consultas e outras operações. / The use of computers by an increasing variety of applications led the Database Management Systems (DBMS) to be used to store a wide range of complex data types, such as images, sounds, DNA chains, etc. Queries based on the total order relationship and/or equality can not be applied or have a limited range of applications when performed over these datasets. It is necessary to use similarity queries based on the contents of the data. If these datasets can be represented as metric spaces, it is possible to use the Metric Access Methods (MAM), such as the Slim-Tree, the M-Tree and the DBM-Tree, to optimize similarity queries. However, MAM are very hard to understand and analyze due to their complex structures. This work presents a visualization system that allows the visual inspection of the organization and the behavior of MAM. The usage of this system provides to MAM developers and database administrators, an easy and fast way to acquire information about key aspects of these structures, which can lead to improvements on the performance of queries and other operations.
104

Visualização como suporte à extração e exploração de regras de associação / Vusualization as support to the extraction and exploration of association rules

Yamamoto, Claudio Haruo 17 April 2009 (has links)
Desde a definção do problema de obtenção de regras de associação, vários algoritmos eficientes foram introduzidos para tratá-lo. Entretanto, ainda hoje o problema apresenta várias dificuldades práticas para os mineradores, como a determinação de limiares adequados de suporte mínimo e confiança mínima, a manipulação de grandes conjuntos de regras, e a compreensão de regras (especialmente aquelas contendo muitos itens). Para tratar estes problemas, pesquisadores têm investigado a aplicação de técnicas interativas, sumarização (de conjuntos de regras) e representações visuais. Entretanto, nenhuma abordagem na qual os usuários podem entender e controlar o processo por meio da interação com o algoritmo analítico ao longo de sua execução foi introduzida. Neste trabalho, é introduzida uma abordagem interativa para extração e exploração de regras de associação que insere o usuário no processo por meio de: execução interativa do Apriori ; seleção interativa de itemsets freqüentes; extração de regras baseada em itemsets e orientada por agrupamentos de itemsets similares; e exploração de regras aos pares. Para validar a abordagem, foram realizados diversos estudos, apoiados pelo Sistema \'I IND.2\' E, com o objetivo de: comparar a abordagem interativa, sob diversos aspectos, com uma abordagem convencional de obtenção de regras de associação; avaliar o efeito de variar alguns parâmetros do processo nos resultados finais; e mostrar a aplicação dos recursos oferecidos em situações reais e com usuários reais. Os resultados indicam que a abordagem apresentada é adequada, tanto em cenários exploratórios quanto em cenários em que há um direcionamento inicial para o processo, à execução de certas tarefas de extração de regras de associação, pois: provém recursos capazes de evitar execuções inteiras do algoritmo antes que os resultados sejam analisados; gera conjuntos de regras mais compactos; preserva a cobertura de itemsets; favorece a reformulação de tarefas ou a formulação de novas tarefas; e provê meios para comparação visual de regras, aumentando o poder de análise do minerador / Since the definition of the association rule mining problem, many efficient algorithms have been introduced to deal with it. However, the problem still presents many practical difficulties to the miners, such as the determination of suitable minimum support and minimum confidence thresholds, manipulation of large rule sets, and comprehension of rules (specially those containing many items). In order to deal with these problems, researchers have been investigating the application of interactive techniques, sumarization (of rule sets) and visual representations. Nonetheless, no approach in which users can understand and control the process through interaction with the analytical algorithm along its execution has been introduced. We introduce an interactive approach to extract and explore association rules that inserts the user into the process through: interactive execution of the Apriori ; interactive selection of frequent itemsets; itemset-based and cluster-oriented extraction of rules; and pairwise exploration of rules. To validate the approach, several studies have been conducted, supported by the \'I IND.2\' E System, aiming at: comparing the interactive approach, under several aspects, with a conventional approach to obtain association rules; evaluate the effect of different execution parameters in the final results; and illustrate its application in real situations and with real users. Results of these studies indicate that the approach is adequate, both in exploratory scenarios and in scenarios in which there is an initial guidance for the process, to the execution of certain association rule extraction tasks, because: it provides resources to avoid complete algorithm executions before results are analyzed; generates more compact rule sets for exploration; preserves rule diversity; favors the reformulation of tasks; and provides support for rule comparison, enhancing analysis capability for miners
105

Elaboração de indicadores de produção cientifica com base na análise cientométrica das dissertações e teses do IPEN / Construction of scientific production indicators based on scientometrics analysis of ipen dissertations and theses

Igami, Mery Piedad Zamudio 10 May 2011 (has links)
A importância da elaboração de indicadores está amplamente difundida na sociedade atual. Observa-se seu uso rotineiro nos mais diversos segmentos da sociedade. Na área científica essa prática também já está consolidada, corrobora esta afirmação o número de trabalhos registrados nas principais bases de dados; prevalecem, no entanto, os estudos quantitativos, os quais fazem uso de dados obtidos a partir de bases de dados internacionais. Diante dessa constatação o objetivo deste trabalho foi obter indicadores científicos a partir da análise das dissertações e teses produzidas por um programa de pós-graduação no período de 1977 até 2009. Foram obtidos três tipos de indicadores bidimensionais, numéricos temáticos e de produtividade, para tanto foram utilizadas técnicas de bibliometria avançada. As dissertações e teses foram categorizadas tematicamente utilizando a Subject Categories and Scope Descriptions e o Tesauro do International Nuclear Information System (INIS). Por meio da técnica de análise de clusters e de trajetória, as dissertações e teses foram agrupadas em cinco grupos temáticos demonstrando o comportamento passado e a tendência de crescimento de cada grupo. Para a extração dos dados sobre a produtividade das teses, em nível de artigos, foi utilizado o Currículo Lattes e a base local do IPEN. Especificamente para se identificarem os níveis de correlação entre os artigos e as teses, foi utilizada a técnica de coocorrência de palavras (co-word analysis) e no caso foram utilizadas as palavras-chave de ambos os itens de literatura. Os autores das teses foram consultados, por meio de um questionário, para validação dos dados. Obtiveram-se indicativos de que 55,9% dos artigos produzidos em um período de cinco anos antes e cinco anos depois da defesa da tese têm forte correlação com esta. Foi observado também que os artigos correlacionados têm sido publicados, em média, 1,63 (ano) antes da apresentação da tese. Foi demonstrado, que as bases de dados, quando bem estruturadas, são instrumentos multifuncionais com grande potencial para o uso em estudos dessa natureza. Observou-se que a qualidade dos indicadores está fortemente associada à qualidade dos dados obtidos das bases de dados. / Construction of Indicators plays an important role in the contemporaneous society. It could be observed their ordinary use by all the activities segments. In scientific area it is not different; such practice has already been consolidated; this statement could be corroborated by the innumerous papers published about this matter in the main databases; however, there is a prevalence of quantitative studies, which obtain data from the international databases, analyzing journal articles. Concerning this finding, the main objective of this study was to elaborate scientific indicators from a local institutional data base, using as a corpus of the study the dissertations and theses, produced by a graduate program in the period of 1977 to 2009.Three types of two-dimensional indicators were obtained by using bibliometric techniques: numerical, thematic and productivity. For dissertations and theses thematic characterization it was used the Subject categories and scope descriptions and the International Nuclear Information System Thesaurus (INIS). Through the statistical technique of clustering analysis, it was possible to classify them in five main groups, showing former performance and growth future trends of each group; for data extraction about theses productivity, regarding articles published; the Curriculo Lattes, and the local institutional database were used. Co-word analysis technique was used to establish a more precise correlation, between articles and theses, and for this purpose it was used the keywords from a controlled vocabulary. In order to validate the results, it was performed a survey, with the theses authors. Results obtained indicated that 55.9% of the articles published, between 5 years, before and after the thesis presentation, are strongly correlated to it. It was also observed that, correlated articles have been published, in an average of, 1, 63 year before the thesis presentation. Concerning databases, it was shown that they are valuable tools and could be used with multifunctional purposes, with a great potential to be used in bibliometric studies. It was also observed that the indicators reliability is strongly associated to the quality of data obtained from the databases.
106

Convergência temática entre produção científica e política nacional de pesquisa em saúde pública: estudo com base em análise de artigos de periódicos indexados / Thematic convergence between scientific and national policy research in public health: a study based on indexed journals analysis

Santos, Cibele Araujo Camargo Marques dos 16 April 2010 (has links)
O mapeamento da atividade científica é essencial para o desenvolvimento da pesquisa e definição de políticas. Na presente pesquisa, foi analisada a convergência entre a produção de artigos científicos da área da Saúde Pública e a Agenda Nacional de Prioridades de Pesquisa em Saúde (ANPPS) implementada pelo Ministério da Saúde em 2005. Nessa perspectiva, faz-se uma breve apresentação do campo científico da Saúde Pública, o histórico de sua constituição, suas principais linhas teóricas e epistemológicas, o contexto atual e suas relações interdisciplinares. A análise foi realizada pelo mapeamento temático de artigos indexados na base de dados LILACS (Literatura Latino-Americana e do Caribe em Ciências da Saúde), desenvolvida pela BIREME, com apoio da rede colaborativa da Biblioteca Virtual de Saúde. O estudo recorreu, metodologicamente, à combinação dos procedimentos de Organização da Informação com as técnicas propostas pelos Estudos métricos da Informação. O corpus da pesquisa foi constituído de 7603 registros de artigos selecionados de 37 títulos de periódicos indexados na base de dados LILACS. Os descritores dos artigos, publicados no período de 2003 e 2007, foram comparados com as 24 subagendas da ANPPS para obter indicadores sobre o grau de convergência ente produção científica nacional e política de pesquisa em saúde. Os resultados mostraram que a convergência é positiva, tendo destaque o tema DOENÇAS TRANSMISSÍVEIS, cuja produção é significativamente mais elevada do que a dos demais temas da ANPPS. Os temas EPIDEMIOLOGIA E PESQUISA CLÍNICA apresentam também elevada produção, revelando a predominância destas duas abordagens epistemológicas na área da saúde. As subagendas SAÚDE DA POPULAÇÃO NEGRA e SAÚDE DOS POVOS INDÍGENAS apresentaram crescimento após a implementação da agenda. As subagendas SISTEMAS E POLÍTICAS DE SAÚDE e SAÚDE, AMBIENTE, TRABALHO E BIOSSEGURANÇA destacaram-se, demonstrando que as pesquisas sobre a gestão da saúde e a questão ambiental são estratégicas na área da Saúde Pública. / The mapping of scientific activity is essential for the development of research and policy definition. In this study, we examined the convergence of scientific articles in the area of Public Health and the National Agenda on Health Research (ANPPS) implemented by the Ministry of Health in 2005. From this perspective, it is made a brief presentation of the scientific field of Public Health, the history of its constitution, its main theoretical and epistemological lines, the current context and their interdisciplinary relation. The analysis was carried out by the thematic mapping of articles indexed in LILACS database (Latin American and Caribbean Health Sciences Literature), developed by BIREME, with support from the collaborative Virtual Library This survey used, methodologically, the combination of procedures from Organization of Information with the techniques proposed by the Metric Studies of Information. The corpus of the research consisted of 7603 records of articles selected from 37 titles of journals indexed in LILACS database. The descriptors of the articles published between 2003 and 2007 were compared with the 24 sub-agendas ANPPS for obtain indicators on the degree of convergence between national scientific production and health policy research. The results showed that the convergence is positive, and highlight the theme COMMUNICABLE DISEASES, whose production is significantly higher than other themes of ANPPS. Topics like EPIDEMIOLOGY e CLINICAL RESEARCH also have high production, revealing the prevalence of these two epistemological approaches in health. The agendas BLACK POPULATION HEALTH and INDIGENOUS PEOPLES\' HEALTH grew after the implementation of the agenda. The sub-agendas SYSTEMS AND HEALTH POLICY e HEALTH, ENVIRONMENT, LABOR AND BIOSECURITY stood out, demonstrating that the research on the management of health and environmental issues are strategic in the area of Public Health.
107

Representação de modelos de dados orientados a objetos através de parametrização de abstrações / Representing object-oriented data model through abstraction instantiations

Biajiz, Mauro 03 September 1996 (has links)
Este trabalho apresenta um meta-modelo conceitual de dados para ser usado como ferramenta concetual para a construção de modelos de dados, obedecendo a determinados padrões. Ele é baseado em um metamodelo que permite a instanciação de modelos de dados. Para isso, identificaram-se as abstrações de dados fundamentais utilizadas em modelos de dados em geral: as abstrações de classificação, de associação e de generalização, e a partir delas foi construído um metamodelo que permite a representação de outros modelos de dados. O metamodelo modela os construtores semânticos de um determinado modelo de dados definindo diversas parametrizações das abstrações utilizadas nesse modelo, possivelmente em múltiplas ocorrêncas da mesma abstração num mesmo modelo. Considera-se uma ocorrência de parametrização como a identificação das restrições que envolvem uma abstração e a atribuição de valores a essas restrições, delimitando as possibilidades de cada restrição. Com esse conceito foi estabelecido um arcabouço conceitual que define uma estrutura precisa para cada construtor do metamodelo. A parametrização foi exemplificada pela aplicação ao Modelo Entidade-Relacionamento original, e na construção de um modelo orientado a objetos concebido para atender a necessidades bem especificadas, definidas a priori (atender às necessidades de aplicações de projeto e engenharia e aplicações científicas) que é denominado Modelo SIRIUS. / A set of conceptual constructions was developed to be used as a \"conceptual tool\" aiming the representation or construction of other data models. The result is a Data Meta-Model, which can be used as a reference standard for the construction of other data models. The Meta-model is based on the identification of the fundamental data abstractions used in the existing data models. It is shown that the fundamental abstractions are the classification, the association and the generalization ones. The Meta-model permits the definition of the semantic constructors of each data model the parameterization of the fundamental abstractions used in each constructor of the model. An abstraction is parameterized by collecting its set of restrictions and by setting each restriction with a particular value. Therefore, the same abstraction can generate several distinct abstraction instances. In the same way, several abstraction instances of distinct fundamental abstractions can be associated to build each each semantic constructor of the target data model. This process is exemplified using two case studies. First, it is used to represent the Entity-Relationship Model. Thereafter, it is used to construct a new data model, aiming at supporting the requirements of computer-aided engineering design and of scientific applications. The new data model is named SIRIUS, and incorporates the fundamental abstractions instantiated into semantic constructors tailored to the needs of those domains.
108

WSAgent: um agente baseado em Web Services para promover a interoperabilidade entre sistemas heterogêneos no domínio da saúde

Rheinheimer, Letícia Rafaela 21 December 2004 (has links)
Made available in DSpace on 2015-03-05T13:53:44Z (GMT). No. of bitstreams: 0 Previous issue date: 21 / Nenhuma / Após o advento da Internet, diversas estratégias de desenvolvimento de software foram modificadas para promover maior reuso e interoperabilidade. Design Patterns e Frameworks nos ajudam a criar software e design flexíveis. A idéia de compor aplicações para que trabalhem juntas é bastante atrativa. No entanto, no domínio da saúde, surgem diversos empecilhos para que se realize esta integração. O uso de tecnologias de Agentes em conjunto com Web Services nos permite pensar em uma solução que garanta interoperabilidade, reuso e flexibilidade entre ambientes heterogêneos. Este trabalho descreve a arquitetura de um Agente de Software, chamado WSAgent (que consiste de uma instância de um Framelet para o sub-domínio paciente, no domínio da saúde) e suas estratégias de colaboração e interoperabilidade. Este trabalho também apresenta um estudo de caso com implementação de um protótipo / After the Internet advent, several strategies about software development were changed to promote more reuse and interoperability. Design Patterns and Frameworks help us to create software and design flexible. The idea of glue applications to work together is very attractive. In the health domains, there are many drawbacks to address its goals. The use of agent technologies combined with Web Services allow us to think about the construction of a bind to grant interoperability, reuse and flexibility between heterogeneous environments. This work describes the architecture of a software agent called WSAgent – an instance of a Framelet of Patient subdomain in Health domain – and its strategies of collaborations and interoperability. This work also presents a case study with the implementation of a prototype
109

Estudo, avaliação e comparação de técnicas de detecção não supervisionada de outliers / Study, evaluation and comparison of unsupervised outlier detection techniques

Campos, Guilherme Oliveira 05 March 2015 (has links)
A área de detecção de outliers (ou detecção de anomalias) possui um papel fundamental na descoberta de padrões em dados que podem ser considerados excepcionais sob alguma perspectiva. Detectar tais padrões é relevante de maneira geral porque, em muitas aplicações de mineração de dados, tais padrões representam comportamentos extraordinários que merecem uma atenção especial. Uma importante distinção se dá entre as técnicas supervisionadas e não supervisionadas de detecção. O presente projeto enfoca as técnicas de detecção não supervisionadas. Existem dezenas de algoritmos desta categoria na literatura e novos algoritmos são propostos de tempos em tempos, porém cada um deles utiliza uma abordagem própria do que deve ser considerado um outlier ou não, que é um conceito subjetivo no contexto não supervisionado. Isso dificulta sensivelmente a escolha de um algoritmo em particular em uma dada aplicação prática. Embora seja de conhecimento comum que nenhum algoritmo de aprendizado de máquina pode ser superior a todos os demais em todos os cenários de aplicação, é uma questão relevante se o desempenho de certos algoritmos em geral tende a dominar o de determinados outros, ao menos em classes particulares de problemas. Neste projeto, propõe-se contribuir com o estudo, seleção e pré-processamento de bases de dados que sejam apropriadas para se juntarem a uma coleção de benchmarks para avaliação de algoritmos de detecção não supervisionada de outliers. Propõe-se ainda avaliar comparativamente o desempenho de métodos de detecção de outliers. Durante parte do meu trabalho de mestrado, tive a colaboração intelectual de Erich Schubert, Ira Assent, Barbora Micenková, Michael Houle e, principalmente, Joerg Sander e Arthur Zimek. A contribuição deles foi essencial para as análises dos resultados e a forma compacta de apresentá-los. / The outlier detection area has an essential role in discovering patterns in data that can be considered as exceptional in some perspective. Detect such patterns is important in general because, in many data mining applications, such patterns represent extraordinary behaviors that deserve special attention. An important distinction occurs between supervised and unsupervised detection techniques. This project focuses on the unsupervised detection techniques. There are dozens of algorithms in this category in literature and new algorithms are proposed from time to time, but each of them uses its own approach of what should be considered an outlier or not, which is a subjective concept in the unsupervised context. This considerably complicates the choice of a particular algorithm in a given practical application. While it is common knowledge that no machine learning algorithm can be superior to all others in all application scenarios, it is a relevant question if the performance of certain algorithms in general tends to dominate certain other, at least in particular classes of problems. In this project, proposes to contribute to the databases study, selection and pre-processing that are appropriate to join a benchmark collection for evaluating unsupervised outlier detection algorithms. It is also proposed to evaluate comparatively the performance of outlier detection methods. During part of my master thesis, I had the intellectual collaboration of Erich Schubert, Ira Assent, Barbora Micenková, Michael Houle and especially Joerg Sander and Arthur Zimek. Their contribution was essential for the analysis of the results and the compact way to present them.
110

Elaboração de indicadores de produção cientifica com base na análise cientométrica das dissertações e teses do IPEN / Construction of scientific production indicators based on scientometrics analysis of ipen dissertations and theses

Mery Piedad Zamudio Igami 10 May 2011 (has links)
A importância da elaboração de indicadores está amplamente difundida na sociedade atual. Observa-se seu uso rotineiro nos mais diversos segmentos da sociedade. Na área científica essa prática também já está consolidada, corrobora esta afirmação o número de trabalhos registrados nas principais bases de dados; prevalecem, no entanto, os estudos quantitativos, os quais fazem uso de dados obtidos a partir de bases de dados internacionais. Diante dessa constatação o objetivo deste trabalho foi obter indicadores científicos a partir da análise das dissertações e teses produzidas por um programa de pós-graduação no período de 1977 até 2009. Foram obtidos três tipos de indicadores bidimensionais, numéricos temáticos e de produtividade, para tanto foram utilizadas técnicas de bibliometria avançada. As dissertações e teses foram categorizadas tematicamente utilizando a Subject Categories and Scope Descriptions e o Tesauro do International Nuclear Information System (INIS). Por meio da técnica de análise de clusters e de trajetória, as dissertações e teses foram agrupadas em cinco grupos temáticos demonstrando o comportamento passado e a tendência de crescimento de cada grupo. Para a extração dos dados sobre a produtividade das teses, em nível de artigos, foi utilizado o Currículo Lattes e a base local do IPEN. Especificamente para se identificarem os níveis de correlação entre os artigos e as teses, foi utilizada a técnica de coocorrência de palavras (co-word analysis) e no caso foram utilizadas as palavras-chave de ambos os itens de literatura. Os autores das teses foram consultados, por meio de um questionário, para validação dos dados. Obtiveram-se indicativos de que 55,9% dos artigos produzidos em um período de cinco anos antes e cinco anos depois da defesa da tese têm forte correlação com esta. Foi observado também que os artigos correlacionados têm sido publicados, em média, 1,63 (ano) antes da apresentação da tese. Foi demonstrado, que as bases de dados, quando bem estruturadas, são instrumentos multifuncionais com grande potencial para o uso em estudos dessa natureza. Observou-se que a qualidade dos indicadores está fortemente associada à qualidade dos dados obtidos das bases de dados. / Construction of Indicators plays an important role in the contemporaneous society. It could be observed their ordinary use by all the activities segments. In scientific area it is not different; such practice has already been consolidated; this statement could be corroborated by the innumerous papers published about this matter in the main databases; however, there is a prevalence of quantitative studies, which obtain data from the international databases, analyzing journal articles. Concerning this finding, the main objective of this study was to elaborate scientific indicators from a local institutional data base, using as a corpus of the study the dissertations and theses, produced by a graduate program in the period of 1977 to 2009.Three types of two-dimensional indicators were obtained by using bibliometric techniques: numerical, thematic and productivity. For dissertations and theses thematic characterization it was used the Subject categories and scope descriptions and the International Nuclear Information System Thesaurus (INIS). Through the statistical technique of clustering analysis, it was possible to classify them in five main groups, showing former performance and growth future trends of each group; for data extraction about theses productivity, regarding articles published; the Curriculo Lattes, and the local institutional database were used. Co-word analysis technique was used to establish a more precise correlation, between articles and theses, and for this purpose it was used the keywords from a controlled vocabulary. In order to validate the results, it was performed a survey, with the theses authors. Results obtained indicated that 55.9% of the articles published, between 5 years, before and after the thesis presentation, are strongly correlated to it. It was also observed that, correlated articles have been published, in an average of, 1, 63 year before the thesis presentation. Concerning databases, it was shown that they are valuable tools and could be used with multifunctional purposes, with a great potential to be used in bibliometric studies. It was also observed that the indicators reliability is strongly associated to the quality of data obtained from the databases.

Page generated in 0.0604 seconds