Spelling suggestions: "subject:"plataforma latter."" "subject:"lataforma latter.""
1 |
DESCOBERTA DE CONHECIMENTO NA PLATAFORMA LATTES: UM ESTUDO DE CASO NO INSTITUTO FEDERAL DE GOIÁS. / KNOWLEDGE DISCOVERY IN LATTES PLATFORM: A CASE STUDY IN THE FEDERAL INSTITUTE OF GOIAS.Cavalcante, Renata de Souza Alves Paula 24 February 2014 (has links)
Made available in DSpace on 2016-08-10T10:40:21Z (GMT). No. of bitstreams: 1
RENATA DE SOUZA ALVES PAULA CAVALCANTE.pdf: 3920138 bytes, checksum: 5a8a21fa7b849ef942fb6113dc3f6635 (MD5)
Previous issue date: 2014-02-24 / Ao longo do tempo, percebeu-se que a velocidade do acúmulo de informações
era maior do que a velocidade de processamento e análise das mesmas. Não adianta
uma organização ter muita informação, se não souber dela extrair conhecimento útil. É
preciso que sejam feitas análises apuradas sobre os dados e descobrir quais são os
padrões de comportamentos existentes nos mesmos. Assim, uma organização poderá
realizar tomada de decisão de forma mais segura, baseada em fatos reais e não em
meras suposições, inclusive no âmbito da gestão de Ciência e Tecnologia. Este
trabalho teve como objetivo realizar um estudo de caso no Instituto Federal de Goiás
(IFG), aplicando o processo de Knowledge Discovery in Database (KDD), na tentativa
de identificar padrões que representem o perfil da produção científica dos docentes da
instituição. A maior parte dos dados analisados foram extraídos da Plataforma Lattes
(PL) e o período da pesquisa fixado no último triênio. Pretendeu-se obter
conhecimento sobre a produtividade dos docentes e provê-los à Pró-Reitoria de
Pesquisa e Pós-Graduação do IFG para auxiliar na sua gestão. A pesquisa aborda por
meio de um levantamento bibliográfico os conceitos sobre Gestão do Conhecimento
(GC), o processo de KDD, incluindo a Mineração de Dados (MD) com suas tarefas e
técnicas, a produção científica, a PL e o contexto atual do IFG. Dessa forma, entre os
resultados obtidos no trabalho, viu-se que a aplicação do KDD pode ser um poderoso
instrumento para a gestão das informações nas instituições de ensino.
|
2 |
AS concepções a respeito dos modelos CAPES-CNPq-LATTES: O caso da UFPB.FIGUEIREDO, Helton Diêgo Gaião de. 17 November 2017 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2017-11-17T14:53:08Z
No. of bitstreams: 1
Helton Diêgo Gaião de Figueiredo - Dissertação - 2016..pdf: 936761 bytes, checksum: 14bd66950391857c84d1b7de4a9feda1 (MD5) / Made available in DSpace on 2017-11-17T14:53:08Z (GMT). No. of bitstreams: 1
Helton Diêgo Gaião de Figueiredo - Dissertação - 2016..pdf: 936761 bytes, checksum: 14bd66950391857c84d1b7de4a9feda1 (MD5)
Previous issue date: 2016-02 / O presente trabalho teve como objetivo oferecer uma painel das concepções dos professores vinculados a programas de pós-graduação strictu sensu da UFPB em relação aos modelos CAPES-CNPq-Lattes e aos seus efeitos no cotidiano dos docentes-pesquisadores., a partir da realização de entrevistas com uma amostra intencional de docentes de programas das áreas das Ciências Humanas, Exatas e da Saúde, buscando elicitar dados sobre como estes indivíduos constroem suas falas/concepções, a partir dos subcampos considerados e seus habituses. Teve-se como inspirações teórica: (1) o debate sobre os modelos produtivista acadêmico, que aqui denominaremos de CAPES/CNPq-Lattes; e (2) as análises do habitus e do campo científico realizadas por Bourdieu. Nossa metodologia consistiu da realização de entrevistas semiestruturadas com uma amostra não aleatória de professores vinculados à pós-graduação de três cursos das áreas mencionadas da UFPB, selecionados dentre os que possuem atualmente conceitos entre 5 e 6. A análise das entrevistas foi complementada pela de alguns documentos (dados do site da instituição e dos respectivos programas de pós-graduação, do CNPq e CAPES. Dentre as principais conclusões, destacamos as seguintes: (1) nos subcampo das Ciências Humanas e da Saúde observou-se uma crítica contundente aos modelos de avaliação CAPES/CNPq/Lattes, havendo uma divisão entre os que aprovam e desaprovam o produtivismo acadêmico nele pressuposto (totalidade da amostra de Humanas e metade da de Saúde), e uma tendência a citar os efeitos negativos dos modelos de avaliação focalizados; (2) no subcampo da Exatas encontramos uma tendência a naturalizar as dinâmicas dos modelos aqui analisados bem como a de não serem apontados efeitos negativos dos mesmos. / This study aimed to identify and analyze the conceptions of CAPES models / CNPq-lattes and its effects on the daily lives of teachers, researchers, considering the teacher's view of the human sciences, exact and health linked to post-graduate studies programs I campus of the Federal University of Paraíba (UFPB), trying to understand how these individuals build their lines / designs from subfield considered and its habituses. It had as basic theoretical inspiration: (1) the debate on academic production-models, which we will call here the CAPES / CNPq-Lattes; and (2) the analysis of habitus and scientific field undertaken by Bourdieu. Our methodology consisted of carrying out semi-structured interviews with a non-random sample of teachers linked to graduate three courses of the mentioned areas UFPB .. Analysis of the interviews was complemented by some documents (site data of the institution and its programs . graduate, Lattes curricula, CNPq and CAPES, among others Among the main conclusions, we highlight the following: (1) the subfield of Human and Health Sciences there was a scathing criticism of the valuation models CAPES / CNPq / Lattes and there is a divide between those who approve and disapprove the academic productivism it presupposes (the totality of interviewed from Humanities area and half of those from the Health Sciencies area), and a tendency to cite the negative effects of focused evaluation models; (2) in the Exacts’ subfield we find a tendency to naturalize the dynamics of the models reviewed here as well as not being singled out negative effects thereof.
|
3 |
Caracterização e discussão da produção científica de uma instituição de ensino superior privadaVidotti, Maikon Venicius 25 February 2016 (has links)
Submitted by Izabel Franco (izabel-franco@ufscar.br) on 2016-10-03T18:27:49Z
No. of bitstreams: 1
DissMVV.pdf: 2718127 bytes, checksum: 18d42256c6c4eaa84c2dd493edefcbd3 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-10T17:24:34Z (GMT) No. of bitstreams: 1
DissMVV.pdf: 2718127 bytes, checksum: 18d42256c6c4eaa84c2dd493edefcbd3 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-10T17:25:10Z (GMT) No. of bitstreams: 1
DissMVV.pdf: 2718127 bytes, checksum: 18d42256c6c4eaa84c2dd493edefcbd3 (MD5) / Made available in DSpace on 2016-10-10T17:25:25Z (GMT). No. of bitstreams: 1
DissMVV.pdf: 2718127 bytes, checksum: 18d42256c6c4eaa84c2dd493edefcbd3 (MD5)
Previous issue date: 2016-02-25 / Não recebi financiamento / To analyze the scientific production of the professors of a private institution of higher
education, some variables can be identifyed and discussions can be developed. To this end it
is necessary to understand the professional profile of professors who work at the institution,
object of study, and the Lattes platform proves to be the most effective tool to collect
information about these professionals. The Lattes platform is the main scientific information
system in Brazil, integrating academic curricula of public and private institutions in a single
platform, allowing management of curricular information of institutions and researchers. But
the platform does not perform automated compilation of data from certain groups. Thus, it
was use the ScriptLattes tool, which synthesizes in simplified form potential indicators to
demonstrate the relationship not just a group of researchers, but different groups of interest. In
examining the Group of professors from the institution used as a case study in this work
(UNI_X), can be noted interesting indicators of professional as well as academic
characterization; at the same time the scientific literature produced by these professors,
whether in the institution itself or in other institutions, where vast majority owned or has bond
in graduate programs. Updating of curricula, as well as the correct completion of data on its
platform, are proving to be an important indicator as well as the correlation between the
published works and without mention of the institution in which these are employee. So we
tried to raise discussions on the topic, for better understanding and the deepening about the
problem. In this way, an analysis was performed of the professors of a top private institution,
through some indicators and, among them, the scientific production. This analysis enabled the
development of discussions on the importance of scientific production for private institutions,
because it is believed that most of these teachers do not mention the institution in scientific
works. In addition, some approaches have been raised through rankings and discussions of the
STS field, generating reflections on the subject. / Ao analisar as produções científicas dos docentes de uma instituição de ensino
superior privada, entende-se que diversos indicadores e discussões podem ser desenvolvidos.
Para tanto se faz necessário compreender o perfil profissional dos professores que atuam na
instituição, objeto de estudo, e a plataforma Lattes demonstra ser o local mais eficaz para
coletar informações a respeito destes profissionais. A plataforma é o principal sistema de
informação científica do Brasil, integrando currículos acadêmicos de instituições públicas e
privadas em uma única plataforma, permitindo gerir a informação curricular das instituições e
pesquisadores. Mas a respectiva plataforma não realiza de forma automatizada a compilação
de dados de determinados grupos, assim utilizou-se a ferramenta ScriptLattes, que sintetiza de
forma simplificada, indicadores de potencial, para demonstrar o relacionamento não de apenas
um grupo de pesquisadores, mas diversos grupos de interesse. Ao analisar o grupo de
professores da instituição utilizada como estudo de caso neste trabalho (UNI_X), pode-se
notar interessantes indicadores de caracterização profissional, bem como acadêmico; ao
mesmo tempo a produção científica produzida por estes docentes, seja na própria instituição,
seja em outras instituições, onde grande maioria possuiu ou possui vinculo em programas de
pós-graduação. A atualização dos currículos, bem como o correto preenchimento dos dados
na respectiva plataforma, demonstram ser um importante indicador, bem como a correlação
existente entre os trabalhos publicados e sem menção da instituição no qual estes docentes
possuem vínculo. Assim procurou-se levantar discussões sobre o tema, para melhor
compreensão e possibilitar o aprofundamento sobre a problemática. Desta forma, foi realizada
uma análise do quadro de docentes de uma instituição superior privada, através de alguns
indicadores e, entre eles, a produção científica. Esta análise possibilitou o desenvolvimento de
discussões sobre a importância da produção científica para instituições privadas, pois
acredita-se que grande parte destes docentes não mencionam a instituição que atuam. Além
disso, foram levantadas algumas abordagens através de rankings e discussões do campo CTS,
gerando reflexões sobre o tema.
|
4 |
Extração e consulta de informações do Currículo Lattes baseada em ontologias / Ontology-based Queries and Information Extraction from the Lattes CVGalego, Eduardo Ferreira 06 November 2013 (has links)
A Plataforma Lattes é uma excelente base de dados de pesquisadores para a sociedade brasileira, adotada pela maioria das instituições de fomento, universidades e institutos de pesquisa do País. Entretanto, é limitada quanto à exibição de dados sumarizados de um grupos de pessoas, como por exemplo um departamento de pesquisa ou os orientandos de um ou mais professores. Diversos projetos já foram desenvolvidos propondo soluções para este problema, alguns inclusive desenvolvendo ontologias a partir do domínio de pesquisa. Este trabalho tem por objetivo integrar todas as funcionalidades destas ferramentas em uma única solução, a SOS Lattes. Serão apresentados os resultados obtidos no desenvolvimento desta solução e como o uso de ontologias auxilia nas atividades de identificação de inconsistências de dados, consultas para construção de relatórios consolidados e regras de inferência para correlacionar múltiplas bases de dados. Além disto, procura-se por meio deste trabalho contribuir com a expansão e disseminação da área de Web Semântica, por meio da criação de uma ferramenta capaz de extrair dados de páginas Web e disponibilizar sua estrutura semântica. Os conhecimentos adquiridos durante a pesquisa poderão ser úteis ao desenvolvimento de novas ferramentas atuando em diferentes ambientes. / The Lattes Platform is an excellent database of researchers for the Brazilian society , adopted by most Brazilian funding agencies, universities and research institutes. However, it is limited as to displaying summarized data from a group of people, such as a research department or students supervised by one or more professor. Several projects have already been developed which propose solutions to this problem, including some developing ontologies from the research domain. This work aims to integrate all the functionality of these tools in a single solution, SOS Lattes. The results obtained in the development of this solution are presented as well as the use of ontologies to help identifying inconsistencies in the data, queries for building consolidated reports and rules of inference for correlating multiple databases. Also, this work intends to contribute to the expansion and dissemination of the Semantic Web, by creating a tool that can extract data from Web pages and provide their semantic structure. The knowledge gained during the study may be useful for the development of new tools operating in different environments.
|
5 |
Base referencial para o povoamento de repositórios institucionais: coleta automatizada de metadados da Plataforma LattesMatias, Mesailde Souza de Oliveira 14 August 2015 (has links)
Made available in DSpace on 2016-06-03T21:11:19Z (GMT). No. of bitstreams: 1
DissMSOM.pdf: 2216662 bytes, checksum: 491d51f338496c8de2f29f3447d09b5b (MD5)
Previous issue date: 2015-08-14 / Open institutional repositories (IR) have became a major instrument for providing open access
to global scientific production. In addition to providing scientific documents, IR can be used to fulfill institutional interests of the institution, such as promoting the storage of documentation,
preserving institutional memory and also bringing worldwide exposure to its production. The implementation of an IR, however, depends on a number of activities, where one of the major challenges is populating it with data. In order to find solutions to improve the process of populating an IR, the aim of this work was to develop a system to automatically extract metadata from the Lattes Platform, inserting this metadata in a reference database, regarded as an intermediate step for populating the IR. Besides easing the submission process, the reference base will be able to support effective marketing campaigns to foster the auto-archival of scientific works. Our approach consists of a qualitative research, developed through action research, within the Federal University of São Carlos – UFSCar. The achieved results comprised the development of a collection of automated solutions essential for gathering and handling metadata to be imported by DSpace. The solution here proposed can be implemented by any institution, with or without an IR, strongly contributing to maximize scientific communication by automating part of the process of implementing and maintaining institutional repositories. / Os repositórios institucionais abertos (RI) tornaram-se um dos principais instrumentos para o acesso aberto à produção científica global. Além da disponibilização de documentos científicos, os RI podem ser utilizados para os diversos interesses da instituição, promovendo armazenamento de suas documentações, preservação da memória institucional e também dando visibilidade mundial para sua produção. A implementação de um RI, no entanto, envolve uma série de ações, onde um dos grandes desafios é o seu povoamento. Visando contribuir para uma solução que minimize o esforço humano necessário para o povoamento do repositório, o objetivo geral deste trabalho foi desenvolver uma sistemática automatizada de extração de metadados provenientes da Plataforma Lattes realizando a inclusão dos dados em uma base referencial, considerada uma etapa intermediária no processo de povoamento do RI. Além de facilitar o processo de submissão, a base referencial poderá amparar efetivas políticas de divulgação e de incentivo ao autodepósito da produção científica. Trata-se de uma pesquisa de natureza qualitativa, desenvolvida por meio de pesquisa-ação, tendo como unidade-caso a Universidade Federal de São Carlos – UFSCar. Os resultados alcançados compreenderam o desenvolvimento de um conjunto de soluções automatizadas, necessárias à coleta, tratamento e importação dos metadados pela ferramenta DSpace. A solução de povoamento aqui proposta poderá ser implementada em qualquer outra instituição que possua ou não um RI,
contribuindo fortemente para a maximização da comunicação científica ao automatizar parte do processo de implementação e manutenção de repositórios institucionais.
|
6 |
Extração e consulta de informações do Currículo Lattes baseada em ontologias / Ontology-based Queries and Information Extraction from the Lattes CVEduardo Ferreira Galego 06 November 2013 (has links)
A Plataforma Lattes é uma excelente base de dados de pesquisadores para a sociedade brasileira, adotada pela maioria das instituições de fomento, universidades e institutos de pesquisa do País. Entretanto, é limitada quanto à exibição de dados sumarizados de um grupos de pessoas, como por exemplo um departamento de pesquisa ou os orientandos de um ou mais professores. Diversos projetos já foram desenvolvidos propondo soluções para este problema, alguns inclusive desenvolvendo ontologias a partir do domínio de pesquisa. Este trabalho tem por objetivo integrar todas as funcionalidades destas ferramentas em uma única solução, a SOS Lattes. Serão apresentados os resultados obtidos no desenvolvimento desta solução e como o uso de ontologias auxilia nas atividades de identificação de inconsistências de dados, consultas para construção de relatórios consolidados e regras de inferência para correlacionar múltiplas bases de dados. Além disto, procura-se por meio deste trabalho contribuir com a expansão e disseminação da área de Web Semântica, por meio da criação de uma ferramenta capaz de extrair dados de páginas Web e disponibilizar sua estrutura semântica. Os conhecimentos adquiridos durante a pesquisa poderão ser úteis ao desenvolvimento de novas ferramentas atuando em diferentes ambientes. / The Lattes Platform is an excellent database of researchers for the Brazilian society , adopted by most Brazilian funding agencies, universities and research institutes. However, it is limited as to displaying summarized data from a group of people, such as a research department or students supervised by one or more professor. Several projects have already been developed which propose solutions to this problem, including some developing ontologies from the research domain. This work aims to integrate all the functionality of these tools in a single solution, SOS Lattes. The results obtained in the development of this solution are presented as well as the use of ontologies to help identifying inconsistencies in the data, queries for building consolidated reports and rules of inference for correlating multiple databases. Also, this work intends to contribute to the expansion and dissemination of the Semantic Web, by creating a tool that can extract data from Web pages and provide their semantic structure. The knowledge gained during the study may be useful for the development of new tools operating in different environments.
|
7 |
Alfabetização científica-tecnológica-digital e a plataforma Lattes: quais as possibilidades?Nunes, Patrícia dos Santos 15 March 2006 (has links)
Made available in DSpace on 2015-03-04T19:56:49Z (GMT). No. of bitstreams: 0
Previous issue date: 15 / Nenhuma / Esta dissertação tem como objetivo problematizar a experiência pedagógica que envolveu alunos e alunas de uma Escola de Ensino Médio da rede pública estadual do Rio Grande do Sul, realizada durante o segundo semestre de 2006. A experiência teve como lócus o laboratório de Informática. O objetivo principal foi envolver os estudantes em atividades que utilizaram como recurso a Internet, mais especificamente, a Plataforma Lattes do CNPq, com vistas ao processo de alfabetização científica-tecnológica-digital dos mesmos, esta entendida como a possibilidade de realizar uma melhor leitura de mundo, através da linguagem da Ciência, aliada à capacidade de lidar com os artefatos tecnológicos, em especial a Informática, o que permite uma apropriação crítica dos códigos digitais. Apoiada em tal concepção, são analisados os enunciados dos alunos, dando o sentido da pesquisadora para os sentidos dados pelos mesmos à experiência pedagógica vivida. Para tanto, fez-se necessário investigar o universo que permeia a inter-rela
|
8 |
Inferência das áreas de atuação de pesquisadores / Inference of the area of expertise of researchersFonseca, Felipe Penhorate Carvalho da 30 January 2018 (has links)
Atualmente, existe uma grande gama de dados acadêmicos disponíveis na web. Com estas informações é possível realizar tarefas como descoberta de especialistas em uma dada área, identificação de potenciais bolsistas de produtividade, sugestão de colaboradores, entre outras diversas. Contudo, o sucesso destas tarefas depende da qualidade dos dados utilizados, pois dados incorretos ou incompletos tendem a prejudicar o desempenho dos algoritmos aplicados. Diversos repositórios de dados acadêmicos não contêm ou não exigem a informação explícita das áreas de atuação dos pesquisadores. Nos dados dos currículos Lattes essa informação existe, porém é inserida manualmente pelo pesquisador sem que haja nenhum tipo de validação (e potencialmente possui informações desatualizadas, faltantes ou mesmo incorretas). O presente trabalho utilizou técnicas de aprendizado de máquina na inferência das áreas de atuação de pesquisadores com base nos dados cadastrados na plataforma Lattes. Os títulos da produção científica foram utilizados como fonte de dados, sendo estes enriquecidos com informações semanticamente relacionadas presentes em outras bases, além de adotar representações diversas para o texto dos títulos e outras informações acadêmicas como orientações e projetos de pesquisa. Objetivou-se avaliar se o enriquecimento dos dados melhora o desempenho dos algoritmos de classificação testados, além de analisar a contribuição de fatores como métricas de redes sociais, idioma dos títulos e a própria estrutura hierárquica das áreas de atuação no desempenho dos algoritmos. A técnica proposta pode ser aplicada a diferentes dados acadêmicos (não sendo restrita a dados presentes na plataforma Lattes), mas os dados oriundos dessa plataforma foram utilizados para os testes e validações da solução proposta. Como resultado, identificou-se que a técnica utilizada para realizar o enriquecimento do texto não auxiliou na melhoria da precisão da inferência. Todavia, as métricas de redes sociais e representações numéricas melhoram a inferência quando comparadas com técnicas do estado da arte, assim como o uso da própria estrutura hierárquica de classes, que retornou os melhores resultados dentre os obtidos / Nowadays, there is a wide range of academic data available on the web. With this information, it is possible to solve tasks such as the discovery of specialists in a given area, identification of potential scholarship holders, suggestion of collaborators, among others. However, the success of these tasks depends on the quality of the data used, since incorrect or incomplete data tend to impair the performance of the applied algorithms. Several academic data repositories do not contain or do not require the explicit information of the researchers\' areas. In the data of the Lattes curricula, this information exists, but it is inserted manually by the researcher without any kind of validation (and potentially it is outdated, missing or even there is incorrect information). The present work utilized machine learning techniques in the inference of the researcher\'s areas based on the data registered in the Lattes platform. The titles of the scientific production were used as data source and they were enriched with semantically related information present in other bases, besides adopting other representations for the text of the titles and other academic information as orientations and research projects. The objective of this dissertation was to evaluate if the data enrichment improves the performance of the classification algorithms tested, as well as to analyze the contribution of factors such as social network metrics, the language of the titles and the hierarchical structure of the areas in the performance of the algorithms. The proposed technique can be applied to different academic data (not restricted to data present in the Lattes platform), but the data from this platform was used for the tests and validations of the proposed solution. As a result, it was identified that the technique used to perform the enrichment of the text did not improve the accuracy of the inference. However, social network metrics and numerical representations improved inference accuracy when compared to state-of-the-art techniques, as well as the use of the hierarchical structure of the classes, which returned the best results among the obtained
|
9 |
Inferência das áreas de atuação de pesquisadores / Inference of the area of expertise of researchersFelipe Penhorate Carvalho da Fonseca 30 January 2018 (has links)
Atualmente, existe uma grande gama de dados acadêmicos disponíveis na web. Com estas informações é possível realizar tarefas como descoberta de especialistas em uma dada área, identificação de potenciais bolsistas de produtividade, sugestão de colaboradores, entre outras diversas. Contudo, o sucesso destas tarefas depende da qualidade dos dados utilizados, pois dados incorretos ou incompletos tendem a prejudicar o desempenho dos algoritmos aplicados. Diversos repositórios de dados acadêmicos não contêm ou não exigem a informação explícita das áreas de atuação dos pesquisadores. Nos dados dos currículos Lattes essa informação existe, porém é inserida manualmente pelo pesquisador sem que haja nenhum tipo de validação (e potencialmente possui informações desatualizadas, faltantes ou mesmo incorretas). O presente trabalho utilizou técnicas de aprendizado de máquina na inferência das áreas de atuação de pesquisadores com base nos dados cadastrados na plataforma Lattes. Os títulos da produção científica foram utilizados como fonte de dados, sendo estes enriquecidos com informações semanticamente relacionadas presentes em outras bases, além de adotar representações diversas para o texto dos títulos e outras informações acadêmicas como orientações e projetos de pesquisa. Objetivou-se avaliar se o enriquecimento dos dados melhora o desempenho dos algoritmos de classificação testados, além de analisar a contribuição de fatores como métricas de redes sociais, idioma dos títulos e a própria estrutura hierárquica das áreas de atuação no desempenho dos algoritmos. A técnica proposta pode ser aplicada a diferentes dados acadêmicos (não sendo restrita a dados presentes na plataforma Lattes), mas os dados oriundos dessa plataforma foram utilizados para os testes e validações da solução proposta. Como resultado, identificou-se que a técnica utilizada para realizar o enriquecimento do texto não auxiliou na melhoria da precisão da inferência. Todavia, as métricas de redes sociais e representações numéricas melhoram a inferência quando comparadas com técnicas do estado da arte, assim como o uso da própria estrutura hierárquica de classes, que retornou os melhores resultados dentre os obtidos / Nowadays, there is a wide range of academic data available on the web. With this information, it is possible to solve tasks such as the discovery of specialists in a given area, identification of potential scholarship holders, suggestion of collaborators, among others. However, the success of these tasks depends on the quality of the data used, since incorrect or incomplete data tend to impair the performance of the applied algorithms. Several academic data repositories do not contain or do not require the explicit information of the researchers\' areas. In the data of the Lattes curricula, this information exists, but it is inserted manually by the researcher without any kind of validation (and potentially it is outdated, missing or even there is incorrect information). The present work utilized machine learning techniques in the inference of the researcher\'s areas based on the data registered in the Lattes platform. The titles of the scientific production were used as data source and they were enriched with semantically related information present in other bases, besides adopting other representations for the text of the titles and other academic information as orientations and research projects. The objective of this dissertation was to evaluate if the data enrichment improves the performance of the classification algorithms tested, as well as to analyze the contribution of factors such as social network metrics, the language of the titles and the hierarchical structure of the areas in the performance of the algorithms. The proposed technique can be applied to different academic data (not restricted to data present in the Lattes platform), but the data from this platform was used for the tests and validations of the proposed solution. As a result, it was identified that the technique used to perform the enrichment of the text did not improve the accuracy of the inference. However, social network metrics and numerical representations improved inference accuracy when compared to state-of-the-art techniques, as well as the use of the hierarchical structure of the classes, which returned the best results among the obtained
|
10 |
Organização da informação em sistemas eletrônicos abertos de Informação Científica & Tecnológica: Análise da Plataforma Lattes / Scientific and technological information organization in open systems: Lattes database analysisSilva, Fábio Mascarenhas e 15 January 2008 (has links)
Discussão, avaliação e apresentação de parâmetros para a organização da informação científica e tecnológica (ICT) brasileira em meio eletrônico, enfocando os problemas do acesso à informação em sistemas abertos, especificamente a Plataforma Lattes do Conselho Nacional de Pesquisa (CNPq). Para fundamentação teórico-conceitual da pesquisa fez-se um retrospecto da ICT brasileira a partir da evolução das suas políticas nacionais de Ciência e Tecnologia e, em seguida, analisaram-se criticamente os recursos relacionados à organização da informação. Um estudo exploratório é apresentado, desenvolvido a partir de currículos extraídos da Plataforma Lattes, para identificar se a natureza aberta do sistema compromete a consistência dos dados na recuperação da informação. A análise se deu em duas etapas: a primeira, a partir da lógica dos Arquivos Pessoais e, a segunda, observando-se as formas de preenchimento do sistema a partir de três categorias: campos com Autonomia Total, Autonomia Parcial, e Sem Autonomia. Conclui-se que há comprometimento da consistência na recuperação da informação em sistemas abertos. A partir da sistematização dos resultados, apresentam-se sugestões para aprimorar o sistema. / Discussion, assessment and presentation of parameters for organization of Brazilian Scientific and Technological Information (STI) on electronic means, focusing on the problems of access to information in open systems, specifically the Lattes Data Base of the Conselho Nacional de Pesquisa (CNPq). For the theoretical and conceptual well-grounding of this research, a retrospect of Brazilian STI was carried out from the evolution of its national Science and Technology politics, and then the resources related to the organization of information were critically analyzed. An explanatory study is presented, developed from CVs taken from the Lattes Data Base in order to identify if the open nature of the system puts the consistency of data at risk when information is retrieved. This analysis was carried out in two steps: the first one was done based on the logic of Personal Files, and the second one by observing the ways the system is fulfilled within three categories: fields with Total Autonomy, with Partial Autonomy and with No Autonomy. We conclude that consistency is at a risk when information is retrieved in open systems. From systemization of results we present suggestions to improve on the system.
|
Page generated in 0.0808 seconds