Global ETD Search

41	Usando aplicações ricas para internet na criação de um ambiente para visualização e edição de regras SWRL / Using rich Internet applications to create an environment for viewing and editing SWRL rules João Paulo Orlando 25 May 2012 (has links) A Web Semântica é uma maneira de explorar a associação de significados explícitos aos conteúdos de documentos presentes na Web, para que esses possam ser processados diretamente ou indiretamente por máquinas. Para possibilitar esse processamento, os computadores necessitam ter acesso a coleções estruturadas de informações e a conjuntos de regras de inferência sobre esses conteúdos. O SWRL permite a combinação de regras e termos de ontologias (definidos por OWL) para aumentar a expressividade de ambos. Entretanto, conforme um conjunto de regras cresce, ele torna-se de difícil compreensão e sujeito a erros, especialmente quando mantido por mais de uma pessoa. Para que o SWRL se torne um verdadeiro padrão web, deverá ter a capacidade de lidar com grandes conjuntos de regras. Para encontrar soluções para este problema, primeiramente, foi realizado um levantamento sobre sistemas de regras de negócios, descobrindo os principais recursos e interfaces utilizados por eles, e então, com as descobertas, propusemos técnicas que usam novas representações visuais em uma aplicação web. Elas permitem detecção de erro, identificação de regras similares, agrupamento, visualização de regras e o reuso de átomos para novas regras. Estas técnicas estão implementadas no SWRL Editor, um plug-in open-source para o Web-Protégé (um editor de ontologias baseado na web) que utiliza ferramentas de colaboração para permitir que grupos de usuários possam não só ver e editar regras, mas também comentar e discutir sobre elas. Foram realizadas duas avaliações do SWRL Editor. A primeira avaliação foi um estudo de caso para duas ontologias da área biomédica (uma área onde regras SWRL são muito usadas) e a segunda uma comparação com os únicos três editores de regras SWRL encontrados na literatura. Nessa comparação foi mostrando que ele implementa mais recursos encontrados em sistemas de regras em geral / The Semantic Web is a way to associate explicitly meaning to the content of web documents to allow them to be processed directly by machines. To allow this processing, computers need to have access to structured collections of information and sets of rules to reason about these content. The Semantic Web Rule Language (SWRL) allows the combination of rules and ontology terms, defined using the Web Ontology Language (OWL), to increase the expressiveness of both. However, as rule sets grow, they become difficult to understand and error prone, especially when used and maintained by more than one person. If SWRL is to become a true web standard, it has to be able to handle big rule sets. To find answers to this problem, we first surveyed business rule systems and found the key features and interfaces they used and then, based on our finds, we proposed techniques and tools that use new visual representations to edit rules in a web application. They allow error detection, rule similarity analysis, rule clustering visualization and atom reuse between rules. These tools are implemented in the SWRL Editor, an open source plug-in for Web-Protégé (a web-based ontology editor) that leverages Web-Protégés collaborative tools to allow groups of users to not only view and edit rules but also comment and discuss about them. We have done two evaluations of the SWRL Editor. The first one was a case study of two ontologies from the biomedical domain, the second was a comparison with the SWRL editors available in the literature, there are only three. In this comparison, it has been shown that the SWRL Editor implements more of the key resources found on general rule systems than the other three editors Anotação de dados Composição de regras Regras SWRL Visualização de regras Web semântica Data annotation Rule composition Rule visualization Semantic Web SWRL rules
42	Um esquema de anotação semântica para mapas conceituais Silva, Viviane Gomes da 31 August 2012 (has links) Made available in DSpace on 2015-04-11T14:02:45Z (GMT). No. of bitstreams: 1 viviane.pdf: 2545157 bytes, checksum: 9cfb739d47efc7aa223b76331116b898 (MD5) Previous issue date: 2012-08-31 / This work aimed at reuse of concept maps (CMs) through their interpretation according to a certain context. Looking for adapting a learning object (LO) database suitable to attend CM characteristics, a metadata for CM description was defined and named MOAFMC, a Portuguese acronym for Functional Learning Object Metadata Concept Maps . The MOAF-MC adapted database allows CMs information sharing through semantic annotation of the concepts in the map. / O objetivo deste trabalho é ampliar a reusabilidade de mapas conceituais (MCs) e promover seu entendimento de acordo com o contexto. Com vistas à adaptação de um repositório de objetos de aprendizagem (OAs) para atender as características dos MCs, foi definido um metadado que descreve as características de um MC, denominado Metadado de Objeto de Aprendizagem Funcional para Mapas Conceituais (MOAF-MC). O repositório adaptado com o MOAF-MC permite o compartilhamento de MCs, suas informações a partir de uma anotação semântica dos conceitos presentes no mapa. Mapas conceituais Objetos de aprendizagem Anotação semântica Concept maps Learning objects Semantic annotation
43	Anotação semântica de objetos de aprendizagem funcionais / Annotation semantics objects of functional learning Gomes, Sionise Rocha 26 August 2010 (has links) Made available in DSpace on 2015-04-11T14:03:14Z (GMT). No. of bitstreams: 1 DISSERTACAO Sionise Rocha Gomes.pdf: 2635969 bytes, checksum: 53a27b162d98559a66bcb69e5ea795a1 (MD5) Previous issue date: 2010-08-26 / Fundação de Amparo à Pesquisa do Estado do Amazonas / Media resources can be used and reused for supporting teaching and learning processes. Some of these resources are non-interactive like images, texts, videos and others enable interaction among entities, digital or not, as simulations, games and other applications. The latter are considered Functional Learning Objects (FLOs). To be reused, FLOs must be described in metadata representing both the technical and the educational aspects of the object. However, current metadata are limited in describing FLOs, especially with respect to share teaching experience in the use of the object. This limitation is caused by absence of elements and ambiguity in the vocabulary used for annotation, making it difficult to carry out context-oriented searches, and for professionals from the same domain to establish information exchange. In this context, this paper presents a metadata for description of FLOs, emphasizing different user experiences through integration of different domain ontologies. / Recursos de mídia podem ser usados e/ou reutilizados como materiais de apoio ao educador no processo de ensino e aprendizagem. Alguns desses materiais são inertes , como por exemplo, imagens, textos e vídeos, outros possibilitam interação entre entidades, sejam elas digitais ou não, como simulações, jogos e outras aplicações. Os recursos do segundo tipo são denominados Objetos de Aprendizagem Funcionais (OAFs). Para que possam ser reutilizados, OAFs precisam ser descritos em metadados, os quais representam tanto os aspectos técnicos do objeto, quanto os pedagógicos. Entretanto, os atuais metadados apresentam-se limitados na descrição de OAFs, principalmente no compartilhamento de experiência docente em relação ao uso do objeto. Essa limitação ocorre pela ausência de elementos e pela ambiguidade no vocabulário utilizado para anotação, dificultando a realização de buscas contextualizadas, e que profissionais do mesmo domínio estabeleçam uma troca comum de informações. Nesse contexto, este trabalho apresenta um metadado que possibilita a descrição de OAFs, enfatizando diferentes experiências de uso por meio da integração de diferentes ontologias de domínio. Objeto de Aprendizagem Funcional Metadados Anotação Semântica Ontologias Functional Learning Object Metadata Semantic Annotation Ontologies
44	Prospecção de marcadores microssatélites potenciais para o melhoramento genético de bovinos Costa, Marco André Paldês da 28 February 2012 (has links) Made available in DSpace on 2014-08-20T14:38:49Z (GMT). No. of bitstreams: 1 tese_marco_andre_paldes_da_costa.pdf: 3629797 bytes, checksum: cb9f7519cccc3939652d2f7422468afc (MD5) Previous issue date: 2012-02-28 / Cattle (Bos taurus) represent an important phylogenetic resource for understanding of evolutionary aspects and complex traits. On its genome, microsatellites repeats constituted the basis for genotyping in different studies as the genetic mapping. So, this study has by aim to describe the distribution of these sequences along of the taurine bovine genome, ascribing to them structural and functional annotation, besides supply a resource for that such information may assist future investigations on these regions. With a genomic coverage estimated at 0.8%, around 1.3 million loci were identified, of which 90.5% classified as perfect. Monomers occurred in greater number and frequency, followed by tetramers, dimers, trimers, pentamers and hexamers. However dimers and pentamers contributed in density more than tetramers. Regardless of the type of repetition, always the largest proportion of repetitive stretches distributed on IG, Introns and GPG regions. Nevertheless, density and frequency on PR and 5'UTR overcame IG. Through of these descriptors similarities could be observed between IG, Introns and 3'UTR, as too for PR and 5'UTR. Annotation for biological process, molecular function and cellular component were super-represented in genes harboring repetitive sequences. Using mapping references, as gene annotation, STS, SNPs and other repetitive elements already described, the Pampeano Animal Genetic Resources online platform provides an important resource for that the information gathered can to assist the planning of new approaches, in especial to obtaining molecular markers destinated to selection of traits of interest to the genetic improvement of the species. / Bovinos (Bos taurus) representam um importante recurso filogenético para compreensão de aspectos evolutivos e características complexas. Sobre seu genoma, repetições microssatélites constituíram a base para genotipagem em diferentes estudos, como o mapeamento genético. Assim, esse trabalho teve por objetivo descrever a distribuição destas sequências ao longo do genoma bovino taurino, atribuindo a elas anotação estrutural e funcional, além de disponibilizar um recurso para que tal informação possa auxiliar investigações futuras sobre tais regiões. Com uma cobertura genômica estimada em 0,8%, cerca de 1.3 milhões de loci foram identificados, dos quais 90,5% classificados como perfeitos. Monômeros ocorreram em maior número e frequência, seguidos por tetrâmeros, dímeros, trímeros, pentâmeros e hexâmeros. Contudo dímeros e pentâmeros contribuíram em densidade mais que tetrâmeros. Independente do tipo de repetição, sempre a maior proporção dos trechos repetitivos distribuíram-se sobre regiões IG, Introns e GPG. Apesar disso, densidade e frequência em 5 UTR e PR superaram IG. Através desses descritores semelhanças puderam ser evidenciadas entre IG, Introns e 3 UTR, como também para PR e 5 UTR. Anotações para processo biológico, função molecular e componente celular estavam super-representadas em genes abrigando sequências repetitivas. Utilizando referências de mapeamento, como anotação gênica, STS, SNPs e outros elementos repetitivos já descritos, a plataforma on-line Pampeano Animal Genetic Resources fornece um importante recurso para que a informação reunida possa auxiliar o planejamento de novas abordagens, em especial para obtenção de marcadores moleculares destinados a seleção de características de interesse ao melhoramento genético da espécie. Predição in silico Anotação genômica Seleção assistida SSR In silico prediction Genomic annotation Assisted selection CNPQ::CIENCIAS AGRARIAS::ZOOTECNIA
45	Uma arquitetura de personalização de conteúdo baseada em anotações do usuário / An architecture for content personalization based on peer-level annotations Marcelo Garcia Manzato 14 February 2011 (has links) A extração de metadados semânticos de vídeos digitais para uso em serviços de personalização é importante, já que o conteúdo é adaptado segundo as preferências de cada usuário. Entretanto, apesar de serem encontradas várias propostas na literatura, as técnicas de indexação automática são capazes de gerar informações semânticas apenas quando o domínio do conteúdo é restrito. Alternativamente, existem técnicas para a criação manual dessas informações por profissionais, contudo, são dispendiosas e suscetíveis a erros. Uma possível solução seria explorar anotações colaborativas dos usuários, mas tal estratégia provoca a perda de individualidade dos dados, impedindo a extração de preferências do indivíduo a partir da interação. Este trabalho tem como objetivo propor uma arquitetura de personalização que permite a indexação multimídia de modo irrestrito e barato, utilizando anotações colaborativas, mas mantendo-se a individualidade dos dados para complementar o perfil de interesses do usuário com conceitos relevantes. A multimodalidade de metadados e de preferências também é explorada na presente tese, fornecendo maior robustez na extração dessas informações, e obtendo-se uma maior carga semântica que traz benefícios às aplicações. Como prova de conceito, este trabalho apresenta dois serviços de personalização que exploram a arquitetura proposta, avaliando os resultados por meio de comparações com abordagens previamente propostas na literatura / The extraction of semantic information from digital video is important to be used on personalization services because the content is adapted according to each users preferences. However, although it is possible to find several approaches in the literature, automatic indexing techniques are able to generate semantic metadata only when the contents domain is restricted. Alternatively, this information can be created manually by professionals, but this activity is time-consuming and error-prone. A possible solution would be to explore collaborative users annotations, but such approach has the disadvantage of lacking the individuality of annotations, hampering the extraction of users preferences from the interaction. This work has the objective of proposing a generic personalization architecture that allows multimedia indexing procedures to be accomplished in a cheap and unrestricted way. Such architecture uses collaborative annotations, but keeps the individuality of the data in order to augment the users profile with relevant concepts. The multimodality of metadata and users preferences is also explored in this work, which provides robustness during the extraction of semantic information, bringing benefits to applications. This work also presents two personalization services that explore the proposed architecture, along with evaluations that compare the obtained results with previously proposed approaches Anotação do usuário Construção de perfil Indexação multimídia Personalização Recomendação Seleção de conteúdo Content selection Multimedia indexing Personalization Profile construction Recommendation User's annotation
46	Anotação automática semissupervisionada de papéis semânticos para o português do Brasil / Automatic semi-supervised semantic role labeling for Brazilian Portuguese Fernando Emilio Alva Manchego 22 January 2013 (has links) A anotac~ao de papeis sem^anticos (APS) e uma tarefa do processamento de lngua natural (PLN) que permite analisar parte do signicado das sentencas atraves da detecc~ao dos participantes dos eventos (e dos eventos em si) que est~ao sendo descritos nelas, o que e essencial para que os computadores possam usar efetivamente a informac~ao codicada no texto. A maior parte das pesquisas desenvolvidas em APS tem sido feita para textos em ingl^es, considerando as particularidades gramaticais e sem^anticas dessa lngua, o que impede que essas ferramentas e resultados sejam diretamente transportaveis para outras lnguas como o portugu^es. A maioria dos sistemas de APS atuais emprega metodos de aprendizado de maquina supervisionado e, portanto, precisa de um corpus grande de senten cas anotadas com papeis sem^anticos para aprender corretamente a tarefa. No caso do portugu^es do Brasil, um recurso lexical que prov^e este tipo de informac~ao foi recentemente disponibilizado: o PropBank.Br. Contudo, em comparac~ao com os corpora para outras lnguas como o ingl^es, o corpus fornecido por este projeto e pequeno e, portanto, n~ao permitiria que um classicador treinado supervisionadamente realizasse a tarefa de anotac~ao com alto desempenho. Para tratar esta diculdade, neste trabalho emprega-se uma abordagem semissupervisionada capaz de extrair informac~ao relevante tanto dos dados anotados disponveis como de dados n~ao anotados, tornando-a menos dependente do corpus de treinamento. Implementa-se o algoritmo self-training com modelos de regress~ ao logstica (ou maxima entropia) como classicador base, para anotar o corpus Bosque (a sec~ao correspondente ao CETENFolha) da Floresta Sinta(c)tica com as etiquetas do PropBank.Br. Ao algoritmo original se incorpora balanceamento e medidas de similaridade entre os argumentos de um verbo especco para melhorar o desempenho na tarefa de classicac~ao de argumentos. Usando um benchmark de avaliac~ao implementado neste trabalho, a abordagem semissupervisonada proposta obteve um desempenho estatisticamente comparavel ao de um classicador treinado supervisionadamente com uma maior quantidade de dados anotados (80,5 vs. 82,3 de \'F IND. 1\', p > 0, 01) / Semantic role labeling (SRL) is a natural language processing (NLP) task able to analyze part of the meaning of sentences through the detection of the events they describe and the participants involved, which is essential for computers to eectively understand the information coded in text. Most of the research carried out in SRL has been done for texts in English, considering the grammatical and semantic particularities of that language, which prevents those tools and results to be directly transported to other languages such as Portuguese. Most current SRL systems use supervised machine learning methods and require a big corpus of sentences annotated with semantic roles in order to learn how to perform the task properly. For Brazilian Portuguese, a lexical resource that provides this type of information has recently become available: PropBank.Br. However, in comparison with corpora for other languages such as English, the corpus provided by that project is small and it wouldn\'t allow a supervised classier to perform the labeling task with good performance. To deal with this problem, in this dissertation we use a semi-supervised approach capable of extracting relevant information both from annotated and non-annotated data available, making it less dependent on the training corpus. We implemented the self-training algorithm with logistic regression (or maximum entropy) models as base classier to label the corpus Bosque (section CETENFolha) from the Floresta Sintá(c)tica with the PropBank.Br semantic role tags. To the original algorithm, we incorporated balancing and similarity measures between verb-specic arguments so as to improve the performance of the system in the argument classication task. Using an evaluation benchmark implemented in this research project, the proposed semi-supervised approach has a statistical comparable performance as the one of a supervised classier trained with more annotated data (80,5 vs. 82,3 de \'F IND. 1\', p > 0, 01). Anotação de papéis semânticos Aprendizado semissupervisionado Processamento de língua natural Natural language processing Semantic role labeling Semi-supervised learning
47	GEOFIER: um sistema de anotação geográfica de textos com o uso de classificadores de aprendizagem de máquina. / GEOFIER: a geotagging system based on machine learning text classifiers. Maçan, Eduardo Marcel 13 August 2015 (has links) A anotação geográfica de documentos consiste na adoção de metadados para a identificação de nomes de locais e a posição de suas ocorrências no texto. Esta informação é útil, por exemplo, para mecanismos de busca. A partir dos topônimos mencionados no texto é possível identificar o contexto espacial em que o assunto do texto está inserido, o que permite agrupar documentos que se refiram a um mesmo contexto, atribuindo ao documento um escopo geográfico. Esta Dissertação de Mestrado apresenta um novo método, batizado de Geofier, para determinação do escopo geográfico de documentos. A novidade apresentada pelo Geofier é a possibilidade da identificação do escopo geográfico de um documento por meio de classificadores de aprendizagem de máquina treinados sem o uso de um gazetteer e sem premissas quanto à língua dos textos analisados. A Wikipédia foi utilizada como fonte de um conjunto de documentos anotados geograficamente para o treinamento de uma hierarquia de Classificadores Naive Bayes e Support Vector Machines (SVMs). Uma comparação de desempenho entre o Geofier e uma reimplementação do sistema Web-a-Where foi realizada em relação à determinação do escopo geográfico dos textos da Wikipédia. A hierarquia do Geofier foi treinada e avaliada de duas formas: usando topônimos do mesmo gazetteer que o Web-a-Where e usando n-gramas extraídos dos documentos de treinamento. Como resultado, o Geofier manteve desempenho superior ao obtido pela reimplementação do Web-a-Where. / Automatic text geotagging is the process by which mentions of place names and their positions in text are identified as metadata, allowing this information to be used by specialized applications, like Search Engines. It is possible to identify the geographic scope of a document by analysing the toponyms it mentions and then group documents by their geographic context, effectively adding a geographic scope to the documents. This dissertation presents a new method to identify the geographic scope of text, named Geofier. The novelty in Geofier is that it uses machine learning text classifiers, trained without the need of a gazetteer and without making assumptions regarding the language in which the documents are written. Wikipedia was used as the source for a geotagged text dataset in order to train a hierarchy of Naive Bayes and Support Vector Machine (SVM) classifiers. The Geofier hierarchy was then trained and evaluated, first using toponyms from the same gazetteer as Web-a-Where and then using n-grams extracted from the training samples as attributes. Geofier performed significantly better when compared to a Web-a-Where implementation. Anotação geográfica Aprendizagem computacional Automatic text classifiers Classificação automática de texto Gazetteers Gazetteers Geotagging Geotagging Hierarchy of text classifiers Hierarquias de classificadores de texto Inteligência artificial Mineração de dados Topônímia Toponym ambiguity
48	Uma nova abordagem para identificação da provável origem de genes exclusivos de bactérias / A new approach to identify the probable origin of bacteria exclusive genes Wagner, Priscilla Koch 26 March 2018 (has links) A comparação de genomas, genes ou até sequências de nucleotídeos não condificantes é uma importante tarefa na qual a bioinformática pode ser aplicada, uma vez que ela auxiliar em diversas atividades, por exemplo, análises filogenéticas. Análise filogenética, por sua vez, busca analisar a relação evolutiva de cada espécie, considerando suas características genéticas. Esses processos e as técnicas que os implementam se baseiam em sequências de nucleotídeos sequenciadas e armazenadas em bancos de dados de genomas públicos. Com análise filogenética também é possível identificar possíveis origens de um gene. Essa tarefa é de grande importância, pois auxilia na identificação da origem de genes patogênicos, podendo auxiliar no combate e prevenção do surgimento de doenças. Um problema potencial dessas sequências é a possibilidade de haver erros nas anotações (marcações de sequências como genes). Esses erros são pouco explorados por pesquisadores atualmente. Outro tema pouco explorado é a análise filogenética de genes exclusivos, que são genes que se manifestam em apenas uma espécie, considerando um grupo de espécies próximas. A identificação de genes exclusivos de alguma espécie pode servir para a correta identificação de, por exemplo, a espécie que causa uma doença, de forma a permitir o uso do tratamento mais específico e adequado. A importância da descoberta de filogenias de genes exclusivos e a dificuldade de garantir a consistência nas anotações genéticas motivaram este trabalho, que teve como objetivo implementar ferramentas para interpretar dados de comparação genética, identificando potenciais erros em anotação de genes exclusivos e criando estratégias para identificar a origem desses genes. As origens de genes exclusivos exploradas neste trabalho envolvem a possibilidade dos genes exclusivos terem derivado de outras famílias de genes do próprio organismo, ou, os genes exclusivos se diferenciaram muito dos genes ancestrais. Essas hipóteses, juntamente com a hipótese da existência de erros de anotação, foram exploradas em experimentos utilizando as ferramentas desenvolvidas. Os experimentos visaram a analisar a aplicabilidade da estratégia desenvolvida. Foram utilizados genomas de bactérias do gênero Xanthomonas, que contém um grande grupo de bactérias que causam doenças em plantas. Os resultados obtidos demonstram que existe uma quantidade considerável de potenciais erros de anotação nos genomas considerados, provando a hipótese de que a inconsistência nas anotações genômicas possui grande influência para a dificuldade na identificação de filogenias (tanto de genes exclusivos como para não exclusivos). Os resultados também demonstraram que boa parte dos genes exclusivos possivelmente se originaram de outras famílias de genes do próprio genoma. Ou ainda, que esses genes sofreram modificações em relação aos genes ancestrais, mas ainda possuem certas semelhanças com sequências de nucleotídeos que não codificam genes em outras espécies mais distantes. Por fim, a estratégia desenvolvida se mostrou útil na análise filogenética das bactérias estudadas, sendo este um forte indício de que a mesma abordagem pode ser utilizada para problemas similares com outras espécies de seres vivos / Comparison of genomes, genes or even non-coding nucleotide sequences is an important task in which bioinformatics can be applied, since it allows the application of phylogenetic analyses. Phylogenetic analysis, in its turn, seeks to analyze the evolutionary relation of each species, considering its genetic characteristics. These processes and the techniques that implement them are based on nucleotide sequences sequenced and stores in databases of public genomes. With phylogenetic analysis it is also possible to identify possible origins of a gene. This task has a great importance, because it allows the identification of the origin of pathogenic genes, which may help to combat or prevent deseases. A potencial problem of these sequences is the possibility of having annotation errors (sequences marking as genes). These errors are little explored by researchers nowadays. Another unexplored topic is the phylogenetic analysis of exclusive genes, which are genes thaht manifest in only one species, considering a group of nearby species. The identification of exclusive genes of a species may serve to correctly identify, for example, a desease, in order to allow the use of a more especific and appropriate treatment. The importance of discovering phylogenies of exclusive genes and the difficulty of guaranteeing the consistency of genetic annotations motivated this work, whose objective was to implement tools to interpret data of genetic comparison, identifying annotation errors in exclusive genes and creating strategies to identify the origin of these genes.The origins of exclusive genes explored in this work involve the possibility of the exclusive genes have derived of other gene families of the organism itself, or, the exclusive genes differed a lot from the ancestral genes. Theses hypotheses, with the hypotesis of the existance of annotation errors, were explored in experiments using the developed tools. The experiments aimed to analyse the applicability of the developed strategy. Genomes of bacteria of the genus Xanthomonas were used, which contains a large group of bacteria that cause diseases in plants. The results show that there is a considerable amount of annotation errors on the genomes, proving the hypothesis that the inconsistency in genomic annotations has a great influence on the difficulty in identifying phylogenies (both exclusive and non-exclusive genes). The results also show that much of exclusive genes possibly originated from other gene families of the genome itself. Furthermore, these genes may have sufferedmodifications in relation to the ancestral genes, but still have certain similarities with nucleotide sequences that don\'t encode genes in other more distant species. Finally, the strategy developed proved useful on phylogenetic analysis of the studied bacteria, which is a strong indication that the same approach can be used for similar problems with other species of living beings Análise filogenética Anotação de genes Bioinformática Bioinformatics Comparação de genes Exclusive genes Filogenia Gene comparison Genes annotation Genes exclusivos Genomic Genômica Phylogenetic analysis Phylogeny
49	Desenvolvimento da plataforma CaneRegNet para anotação funcional e análises do transcriptoma da cana-de-açúcar / Development of CaneRegNet platform for functional annotation and analysis of sugarcane transcriptome Nishiyama Junior, Milton Yutaka 13 April 2015 (has links) A identificação de genes alvos, vias de sinalização e vias metabólicas para melhoramento de cana-de-açúcar associados a características de interesse, ainda são pouco conhecidos e estudados. Alguns estudos do transcriptoma através de plataformas de microarranjo têm buscado identificar listas de genes, para experimentos tecido- específico ou submetidos a condições de estresse bióticos e abióticos. Estudos pontuais destes dados tem sido associados a vias metabólicas ou vias de sinalização já descritas na literatura, de forma a identificar alterações relacionadas a padrões de expressão gênica. Porém, estas relações em cana-de-açúcar são pouco conhecidas e estudadas. O estudo e entendimento de cana-de-açúcar por meio da diversidade genética e de sua adaptação ao ambiente é um grande desafio, principalmente pela ausência de um genoma sequenciado e por possuir um genoma complexo. Apresentamos nossos resultados para tentar superar tais limitações e desafios para estudos de expressão gênica. Foram desenvolvidas metodologias para anotação funcional do transcriptoma, centradas na transferência de anotação, identificação de vias metabólicas e enzimas pelo método de similaridade bi-direcional, predição de genes full-length, análises de ortologia e desenho de oligonucleotídeos para microarranjos customizados, resultando no ORFeoma de cana-de-açúcar, na identificação e classificação de famílias de fatores de transcrição e identificação de genes ortólogos entre gramíneas. Além disso, desenvolvemos uma plataforma para processamento e análise automatizada de experimentos por microarranjo, para armazenamento, recuperação e integração com a anotação funcional. Adicionalmente desenvolvemos e implementamos métodos para seleção de genes diferencialmente e significativamente expressos, e abordagens para análise de enriquecimento de categorias, e escores de atividade de vias metabólicas. De forma a integrar a anotação funcional do transcriptoma aos estudos por expressão gênica, desenvolvemos a plataforma CaneRegNet e uma interface para integração desta rede de dados biológicos e conhecimentos, composta por aplicativos para consulta e prospecção de dados por análises de agrupamento e correlação entre experimentos de microarranjo, possibilitando a geração de novas hipóteses e predições dentro da organização da regulação celular. / The identification of target genes, metabolic and signaling pathways associated with characteristics of interest to the sugarcane improvement are still poorly known and studied. Some transcritptome studies through microarray platforms has tried to identify lists of genes, for tissue-specific experiments or subjected to conditions of biotic and abiotic stress. In the literature specific studies of these data has already been associated with metabolic or signaling pathway, in order to identify changes in these tracks related to patterns of gene expression. However, these relations are still little know and generally defined slightly. The study and understanding of sugarcane by means of genetic diversity and its adaptation to the environment is a major challenge, mainly due to the absence of a sequenced genome and by your complex genome. We present our results to surpass this barrier e challenges for the study of gene expression. Methodologies were developed for the transcriptome functional annotation, focused on the annotation transfer, identification of metabolic pathways and enzymes by the bi- directional method; prediction of full-length genes; ortology analysis and probe design for customized microarrays, resulting in the sugarcane ORFeome, the identification and classification of transcription factor families and identification of ortholog genes between grasses. Besides that, we have developed a plataform for automated processing and analysis for microarray experiments, to store, retrieve and integration with the functional annotation. Additionally, we have developed and implemented methods for identification of differentially and significantly expressed genes, and approaches for over-represented analysis and functional class scoring (FCS). To integrate the functional annotation and the studies by gene expression profile, we have developed the CaneRegNet platform and an interface to integrate this network of biological data and knowledge, composed by searching and data mining tools for clustering and correlations between microarray experiments, enabling the generation of new hypothesis and predictions around the organization of cellular regulation. Anotação funcional Banco de dados Bioinformática Bioinformatics Data integration Data mining Database Functional annotation Integração de dados Microarray platform Plataforma de microarranjo Prospecção de dados Sugarcane transcriptome Transcriptoma cana-de- açúcar
50	Redações do ENEM: estudo dos desvios da norma padrão sob a perspectiva de corpos / ENEM essays: a study of deviations from the standard norm from a corpus perspective. Pinheiro, Gisele Montilha 27 March 2008 (has links) Desvios da norma padrão, comumente chamados de \"erros\", são fatos comuns na escrita dos aprendizes da variante culta de uma língua materna como o português brasileiro. Tratados como um \"mal a ser combatido\", eles são, na verdade, importantes indícios do processo de assimilação da escrita culta pelo falante nativo. Revelam qual a tendência da transformação que naturalmente ocorre numa língua, demonstrando, por exemplo, a obsolência das gramáticas tradicionais, que não aceitam determinadas construções já muito freqüentes. Mas seria possível detectar algum padrão desses desvios? Haveria desvios típicos de um determinado perfil de redatores? Essas indagações motivaram a presente investigação, que se baseou na concepção de que esses estudos são de natureza empírica, comprometidos com a noção de que a língua funciona tal como um sistema probabilístico, de onde é possível prever tendências, por exemplo, de mudança. Falamos, pois, de uma investigação à luz da Lingüística de Corpus. Composto de redações do Exame Nacional do Ensino Médio (ENEM), edição de 2002, cedidas pelo Instituto Nacional de Estudos e Pesquisas Educacionais (INEP) juntamente com determinados traços do perfil dos redatores, construímos um corpus que foi batizado de Corvo, e se ocupou de uma faixa específica de textos: a de pior desempenho no ENEM no quesito domínio da norma culta. Observamos, desse modo, textos em que, supostamente, há freqüência maior de desvios e maior variedade de tipos de desvios. Nossa metodologia de pesquisa apoiou-se no uso do revisor gramatical automático ReGra, bastante popular no país e que auxilia o usuário no uso correto do português culto padrão. Além disso, construímos um material próprio de detecção e classificação dos desvios gramaticais, aumentando a capacidade de tratamento automático dos textos. Assim, foi possível gerar uma versão do corpus anotada em desvios, i.e., os textos apresentam indicações de quando e qual tipo de desvios ocorrem. Como resultado temos um mapeamento do Corvo; ou seja, um panorama dos desvios típicos de um determinado tip o de perfil de redator. Constatamos a deficiência ortográfica como o traço típico do grupo de indivíduos investigado, mas, sobretudo, que a ortografia é motor para o pleno funcionamento de uma revisão gramatical automática. O revisor ReGra mostrou-se incapaz de processar satisfatoriamente textos desse tipo de redator, mas, ainda assim, comprovou que esses textos apresentam desvios gramaticais de tratamento complexo, cuja intervenção do revisor, se acontece, pouco altera na qualidade geral dos mesmos. Com respeito à tipologia de desvio, pudemos constatar a validade da tipologia aplicada na pesquisa, que advém do ReGra e, portanto, está à margem das discussões teóricas ortodoxas. De fato, há recorrência de tipos de desvios, e isso numa freqüência que nos autoriza admitir a fraca assimilação de certas regras gramaticais tomadas como básicas (p.ex., a pontuação, a concordância e a regência). Constatamos, com relação ao perfil de redatores, que textos com maior potencial para a revisão da escrita, i.e., aqueles que alteram significativamente a qualidade textual com interferências pontuais de revisão, são justamente os produzidos pelos concluintes do ensino médio e não pelos egressos. / Deviations from the standard norm, usually called \'mistakes\', are common events in writing pieces of language learners speakers of a native language such as Brazilian Portuguese. They are treated as \'an evil that must be fought\'. They are, in fact, important evidence of the acquisition process of writing in the standard norm by the native speaker. They reveal the transformation trend, which normally occurs in a language, showing, for instance, the obsolescence of traditional grammars that do not accept certain patterns, which are frequent nonetheless. However, is it possible to identify a pattern in these deviations? Are there common deviations among a certain profile of students? These are the questions motivating this study, which is based on the concept that these investigations are empirical in nature, and are marked by the notion that language operates as a probabilistic system, in which it is possible to forecast trends of change, for example. We are, therefore, speaking of an investigation in the light of Corpus Linguistics. We compiled a corpus of essays written during the National Middle Education Exam (ENEM) carried out in 2002. These essays were obtained with the National Institute for Research in Education (INEP) together with the profile of the students. The corpus was called Corvo, and it is made up of a certain bracket of texts: those having obtained the worst performance rate in the ENEM in the standard norm category. We observed, therefore, texts in which there are, allegedly, a greater frequency of deviations and a greater variety of kinds of deviations. The research methodology was supported by the electronic grammar checker - ReGra - which is very popular in the country, and helps the user in writing standard Portuguese correctly. In addition, we built a specific tool for identifying and classifying grammar deviations, thus, increasing the ability to treat the texts electronically. Therefore, it was possible to generate an annotated version of the corpus according to the deviations, i.e., the texts were annotated according to when and what kind of deviations they presented. As a result, we have a mapping of the Corvo; that is, a view of the common deviations of students belonging to a certain profile. We identified poor spelling as a common feature of the group, but, above all, that spelling is the engine enabling a full grammatical check to operate. The ReGra grammar checker was not able to satisfactorily process these kinds of texts, but, even so, it proved that these texts presented complex grammar deviations, and the intervention of the checker, when it is applied, little alters their overall quality. In regard to deviation typology, we identified the validity of the typology used in this study, which results from the ReGra and, therefore, lies in the outskirts of orthodox theoretical discussions. In fact, certain kinds of deviations reoccur at a frequency that enables us to admit a poor assimilation of certain grammatical rules considered basic (e.g., punctuation, agreement and use of prepositions). We found that in regard to the profile of the students, texts with a greater writing check potential, that is, a check that would significantly improve text quality through individual checking interferences, are te xts produced by students who finished middle education and not those produced by students who are finishing the course. Anotação de corpus Corpus annotation Corpus linguistics Desvios da norma -padrão Deviations from the standard norm Electronic grammar checker ENEM essays Lingüística de Corpus Redações do ENEM Revisão gramatical automática

Search results