Global ETD Search

1	Metodología, construcción y explotación de corpus anotados semántica y anafóricamente Navarro Colorado, Borja 03 September 2007 (has links) D.L. A 230-2008 Procesamiento del lenguaje natural Corpus anotado Semántica léxica Anáfora Resolución de la ambigüedad semántica Lenguajes y Sistemas Informáticos
2	O empalhador de passarinho, de Mário de Andrade: edição de texto fiel e anotado / The taxidermist finch, by Mário de Andrade: faithfull and annotated text edition Sá, Marina Damasceno de 20 September 2013 (has links) Esta dissertação de mestrado tem como objeto a edição de texto fiel e anotado de O empalhador de passarinho vigésimo volume das obras completas de Mário de Andrade (1893-1945), publicado pela Livraria Martins Editora em 1946, após sua morte. Apresentando o cotejo entre a edição princeps e as primeiras versões dos artigos em periódicos, esta Edição de texto fiel e anotado dO empalhador de passarinho de Mário de Andrade, inscrita no Programa de Pós-Graduação em Literatura Brasileira da FFLCH-USP, é resultado do projeto temático FAPESP/ IEB e FFLCH-USP, Estudo do processo de criação de Mário de Andrade nos manuscritos de seu arquivo, em sua correspondência, em sua marginália em suas leituras, coordenado, entre 2006-2011, pela Profa. Dra. Telê Ancona Lopez. A partir do confronto documental, realizou-se a confecção de notas que buscam compreender o arte-fazer, operado por Mário de Andrade, das críticas realizadas entre 1938 e 1944 em periódicos do Rio de Janeiro e de São Paulo e reunidas por ele n O empalhador de passarinho. / This dissertation focuses the faithful and annotated edition of The taxidermist finch, twentieth volume of the complete works by Mário de Andrade (1893-1945), published by Editora Martins Bookstore in 1946, after his death. Introducing the collation of work with texts in newspapers and magazines, this edition is enrolled in the Graduate Program in Brazilian Literature at FFLCH-USP, it is a result of the thematic project FAPESP/ IEB/FFLCH-USP Mário de Andrades creative process study: in the manuscripts of his file, his correspondence, in his marginalia in his readings, coordinated between 2006-2011, by professor Telê Ancona Lopez. By analyzing documentation, we sought to understand Mário de Andrades creative process of the critics made by him, from 1938 until 1944 in newspapers and magazines from Rio de Janeiro and São Paulo. Crítica literária Edição de texto fiel e anotado Editing Literary criticism Mário de Andrade Mário de Andrade O empalhador de passarinho The taxidermist finch
3	O empalhador de passarinho, de Mário de Andrade: edição de texto fiel e anotado / The taxidermist finch, by Mário de Andrade: faithfull and annotated text edition Marina Damasceno de Sá 20 September 2013 (has links) Esta dissertação de mestrado tem como objeto a edição de texto fiel e anotado de O empalhador de passarinho vigésimo volume das obras completas de Mário de Andrade (1893-1945), publicado pela Livraria Martins Editora em 1946, após sua morte. Apresentando o cotejo entre a edição princeps e as primeiras versões dos artigos em periódicos, esta Edição de texto fiel e anotado dO empalhador de passarinho de Mário de Andrade, inscrita no Programa de Pós-Graduação em Literatura Brasileira da FFLCH-USP, é resultado do projeto temático FAPESP/ IEB e FFLCH-USP, Estudo do processo de criação de Mário de Andrade nos manuscritos de seu arquivo, em sua correspondência, em sua marginália em suas leituras, coordenado, entre 2006-2011, pela Profa. Dra. Telê Ancona Lopez. A partir do confronto documental, realizou-se a confecção de notas que buscam compreender o arte-fazer, operado por Mário de Andrade, das críticas realizadas entre 1938 e 1944 em periódicos do Rio de Janeiro e de São Paulo e reunidas por ele n O empalhador de passarinho. / This dissertation focuses the faithful and annotated edition of The taxidermist finch, twentieth volume of the complete works by Mário de Andrade (1893-1945), published by Editora Martins Bookstore in 1946, after his death. Introducing the collation of work with texts in newspapers and magazines, this edition is enrolled in the Graduate Program in Brazilian Literature at FFLCH-USP, it is a result of the thematic project FAPESP/ IEB/FFLCH-USP Mário de Andrades creative process study: in the manuscripts of his file, his correspondence, in his marginalia in his readings, coordinated between 2006-2011, by professor Telê Ancona Lopez. By analyzing documentation, we sought to understand Mário de Andrades creative process of the critics made by him, from 1938 until 1944 in newspapers and magazines from Rio de Janeiro and São Paulo. Crítica literária Edição de texto fiel e anotado Mário de Andrade O empalhador de passarinho Editing Literary criticism Mário de Andrade The taxidermist finch
4	eDictor: da plataforma para a nuvem / eDictor: from platform to the cloud Veronesi, Luiz Henrique Lima 04 February 2015 (has links) Neste trabalho, apresentamos uma nova proposta para edição de textos que fazem parte de um corpus eletrônico. Partindo do histórico de desenvolvimento do corpus Tycho Brahe e da ferramenta eDictor, propõe-se a análise de todo o processo de trabalho de criação de um corpus para obter uma forma de organização da informação mais concisa e sem redundâncias, através do uso de um único repositório de informações contendo os dados textuais e morfossintáticos do texto. Esta forma foi atingida através da criação de uma estrutura de dados baseada em unidades mínimas chamadas tokens e blocos de unidades chamados chunks. A relação entre os tokens e os chunks, da forma como considerada neste trabalho, é capaz de guardar a informação de como o texto é estruturado em sua visualização (página, parágrafos, sentenças) e na sua estrutura sintática em árvores. A base de análise é composta por todos os arquivos pertencentes ao catálogo de textos do corpus Tycho Brahe. Através desta análise, foi possível chegar a elementos genéricos que se relacionam, desconstruindo o texto e criando uma relação de pontos de início e fim relativos às palavras (tokens) e não seguindo sua forma linear. A introdução do conceito de orientação a objetos possibilitou a criação de uma relação entre unidades ainda menores que o token, os split tokens que também são tokens, pois herdam as características do elemento mais significativo, o token. O intuito neste trabalho foi buscar uma forma com o menor número possível de atributos buscando diminuir a necessidade de se criar atributos específicos demais ou genéricos de menos. Na busca deste equilíbrio, foi verificada a necessidade de se criar um atributo específico para o chunk sintático, um atributo de nível que indica a distância de um nó da árvore para o nó raiz. Organizada a informação, o acesso a ela se torna mais simples e parte-se para definição da interface do usuário. A tecnologia web disponível permite que elementos sejam posicionados na tela reproduzindo a visualização que ocorre no livro e também permite que haja uma independência entre um e outro elemento. Esta independência é o que permite que a informação trafegue entre o computador do usuário e a central de processamento na nuvem sem que o usuário perceba. O processamento ocorre em background, utilizando tecnologias assíncronas. A semelhança entre as tecnologias html e xml introduziu uma necessidade de adaptação da informação para apresentação ao usuário. A solução apresentada neste trabalho é pensada de forma a atribuir aos tokens informações que indiquem que eles fazem parte de um chunk. Assim, não seriam as palavras que pertencem a uma sentença, mas cada palavra que possuiria um pedaço de informação que a faz pertencente à sentença. Esta forma de se pensar muda a maneira como a informação é exibida. / In this work, we present a new proposal for text edition organized under an electronic corpus. Starting from Tycho Brahe corpus development history and the eDictor tool, we propose to analyze the whole work process of corpus creation in order to obtain a more concise and less redudant way of organizing information by using a single source repository for textual and morphosyntactic data. This single source repository was achieved by the creation of a data structure based on minimal significative units called tokens and grouping units named chunks. The relationship between tokens and chunks, in the way considered on this work, allows storage of information about how the text is organized visually (pages, paragraphs, sentences) and on how they are organized syntactically as represented by syntactic trees. All files referred to the Tycho Brahe corpus catalog were used as base for analysis. That way, it was possible to achieve generic elements that relate to each other in a manner that the text is deconstructed by using relative pointers to each token in the text instead of following the usual linear form. The introduction of oriented-object conception made the creation of relationship among even smaller units possible, they are the split tokens, but split tokens are also tokens, as they inherit characteristics from the most significative element (the token). The aim here was being attributeless avoiding the necessity of too specific or too vague attributes. Looking for that balance, it was verified the necessity of creating a level attribute for syntactic data that indicates the distance of a tree node to its root node. After information is organized, access to it become simpler and then focus is turned to user-interface definition. Available web technology allows the use of elements that may be positioned on the screen reproducing the way the text is viewed within a book and it also allows each element to be indepedent of each other. This independence is what allows information to travel between user computer and central processing unit at the cloud without user perception. Processing occurs in background using asynchronous technology. Resemblance between html and xml introduced a necessity of adaption to present the information to the user. The adopted solution in this work realizes that tokens must contain the information about the chunk to which they belong. So this is not a point of view where words belong to sentences, but that each word have a piece of information that make them belong to the sentence. This subtile change of behavioring changes the way information is displayed. Annotated corpus Arquitetura web Computational linguistics Corpus anotado Corpus eletrônico Corpus linguistics Edição filológica digital Electronic corpus Linguística computacional Linguística de corpus Philological digital edition Web architecture
5	eDictor: da plataforma para a nuvem / eDictor: from platform to the cloud Luiz Henrique Lima Veronesi 04 February 2015 (has links) Neste trabalho, apresentamos uma nova proposta para edição de textos que fazem parte de um corpus eletrônico. Partindo do histórico de desenvolvimento do corpus Tycho Brahe e da ferramenta eDictor, propõe-se a análise de todo o processo de trabalho de criação de um corpus para obter uma forma de organização da informação mais concisa e sem redundâncias, através do uso de um único repositório de informações contendo os dados textuais e morfossintáticos do texto. Esta forma foi atingida através da criação de uma estrutura de dados baseada em unidades mínimas chamadas tokens e blocos de unidades chamados chunks. A relação entre os tokens e os chunks, da forma como considerada neste trabalho, é capaz de guardar a informação de como o texto é estruturado em sua visualização (página, parágrafos, sentenças) e na sua estrutura sintática em árvores. A base de análise é composta por todos os arquivos pertencentes ao catálogo de textos do corpus Tycho Brahe. Através desta análise, foi possível chegar a elementos genéricos que se relacionam, desconstruindo o texto e criando uma relação de pontos de início e fim relativos às palavras (tokens) e não seguindo sua forma linear. A introdução do conceito de orientação a objetos possibilitou a criação de uma relação entre unidades ainda menores que o token, os split tokens que também são tokens, pois herdam as características do elemento mais significativo, o token. O intuito neste trabalho foi buscar uma forma com o menor número possível de atributos buscando diminuir a necessidade de se criar atributos específicos demais ou genéricos de menos. Na busca deste equilíbrio, foi verificada a necessidade de se criar um atributo específico para o chunk sintático, um atributo de nível que indica a distância de um nó da árvore para o nó raiz. Organizada a informação, o acesso a ela se torna mais simples e parte-se para definição da interface do usuário. A tecnologia web disponível permite que elementos sejam posicionados na tela reproduzindo a visualização que ocorre no livro e também permite que haja uma independência entre um e outro elemento. Esta independência é o que permite que a informação trafegue entre o computador do usuário e a central de processamento na nuvem sem que o usuário perceba. O processamento ocorre em background, utilizando tecnologias assíncronas. A semelhança entre as tecnologias html e xml introduziu uma necessidade de adaptação da informação para apresentação ao usuário. A solução apresentada neste trabalho é pensada de forma a atribuir aos tokens informações que indiquem que eles fazem parte de um chunk. Assim, não seriam as palavras que pertencem a uma sentença, mas cada palavra que possuiria um pedaço de informação que a faz pertencente à sentença. Esta forma de se pensar muda a maneira como a informação é exibida. / In this work, we present a new proposal for text edition organized under an electronic corpus. Starting from Tycho Brahe corpus development history and the eDictor tool, we propose to analyze the whole work process of corpus creation in order to obtain a more concise and less redudant way of organizing information by using a single source repository for textual and morphosyntactic data. This single source repository was achieved by the creation of a data structure based on minimal significative units called tokens and grouping units named chunks. The relationship between tokens and chunks, in the way considered on this work, allows storage of information about how the text is organized visually (pages, paragraphs, sentences) and on how they are organized syntactically as represented by syntactic trees. All files referred to the Tycho Brahe corpus catalog were used as base for analysis. That way, it was possible to achieve generic elements that relate to each other in a manner that the text is deconstructed by using relative pointers to each token in the text instead of following the usual linear form. The introduction of oriented-object conception made the creation of relationship among even smaller units possible, they are the split tokens, but split tokens are also tokens, as they inherit characteristics from the most significative element (the token). The aim here was being attributeless avoiding the necessity of too specific or too vague attributes. Looking for that balance, it was verified the necessity of creating a level attribute for syntactic data that indicates the distance of a tree node to its root node. After information is organized, access to it become simpler and then focus is turned to user-interface definition. Available web technology allows the use of elements that may be positioned on the screen reproducing the way the text is viewed within a book and it also allows each element to be indepedent of each other. This independence is what allows information to travel between user computer and central processing unit at the cloud without user perception. Processing occurs in background using asynchronous technology. Resemblance between html and xml introduced a necessity of adaption to present the information to the user. The adopted solution in this work realizes that tokens must contain the information about the chunk to which they belong. So this is not a point of view where words belong to sentences, but that each word have a piece of information that make them belong to the sentence. This subtile change of behavioring changes the way information is displayed. Arquitetura web Corpus anotado Corpus eletrônico Edição filológica digital Linguística computacional Linguística de corpus Annotated corpus Computational linguistics Corpus linguistics Electronic corpus Philological digital edition Web architecture

1

Page generated in 0.0495 seconds