Global ETD Search

11	Entre coleções e arquivos : Pedro de Angelis e a produção de conjuntos documentais (Buenos Aires, 1835-1852) Schell, Deise Cristina January 2018 (has links) Esta tese analisa a trajetória de Pedro de Angelis como um erudito interessado em reunir documentos sobre o passado e o presente da região do Rio da Prata e a história da formação de suas coleções e de seus arquivos durante e por dentro do segundo governo de Juan Manuel de Rosas. De Angelis foi um italiano que chegou a Buenos Aires em 1827 e foi um dos principais escritores públicos do rosismo. Entre 1835 e 1852, ao tempo em que se aproximava do governador, tornando-se, inclusive, archivero do Archivo General de la Província de Buenos Aires, ele se empenhou em colecionar papeis para si e também publicá-los em edições impressas, produzindo uma série de conjuntos documentais. A “Colección de obras y documentos relativos a la historia antigua y moderna de las Províncias del Río de la Plata” editada de 1835 a 1839, sua obra mais conhecida, foi um deles. Tendo sido dedicada a Rosas, a Colección é analisada neste trabalho como um arquivo formatado pelo erudito sobre o passado da Confederação Argentina. Através dos documentos que nela reuniu, De Angelis promoveu o discurso do regime para o qual trabalhava. O mesmo foi feito pelo italiano em outro conjunto documental que conformou entre 1843 e 1851, o “Archivo Americano y Espíritu de la Prensa del Mundo”. Com o Archivo Americano, Pedro de Angelis coletava e levava a público aquelas que considerava fontes sobre o presente. Construía, assim, um acervo sobre o tempo vivido que seria lido pelos seus coetâneos e pelos sujeitos no futuro, contrapondo-se aos escritos dos opositores de Juan Manuel de Rosas, como a Geração de 1837. Por fim, estuda-se como a personagem formou, graças ao “comércio da história” que ocorria no Prata, a sua própria coleção particular de documentos e obras, acumulada desde meados de 1830 até 1852 em sua biblioteca, e como ela se tornou um fundo da Biblioteca Nacional do Império Brasileiro a partir de 1853. Em tempos de Rosas e de dicotomia discursiva entre civilização e barbárie, De Angelis acabou, com suas coleções e seus arquivos, por construir uma dada memória para o governo bonaerense, que não tinha o investimento na guarda e na organização de documentos ou a promoção da escrita da história local como prioridades. Mais do que isso, seus conjuntos documentais acabaram por auxiliar na constituição de si como um erudito preocupado com a preservação de papeis e com a produção de conhecimento. / This work analyzes the trajectory of Pedro de Angelis, a scholar interested in collecting documents about the past and the present of the region of Rio de la Plata, and the history of the formation of his collections and archives during and within Juan Manuel de Rosas' second governorship. De Angelis was an Italian who arrived in Buenos Aires in 1827 and was one of the leading public writers of Rosism. He endeavored to gather documents to his own collection and also to publish them in printed editions, which produced a series of documentary sets between 1835 and 1852, while he increasingly approached the governor and even became the archivist of the Archivo General de la Provincia de Buenos Aires. The “Colección de obras y documentos relativos a la historia antigua y moderna de las Províncias del Río de la Plata” edited from 1835 to 1839, his best-known work, was one of these documentary sets. We analyze the “Colección”, which he dedicated to Rosas, as an archive that the scholar formatted about the past of the Argentine Confederation. De Angelis sustained and promoted the discourse of the regime he worked for through the documents he gathered in the "Colección" and in another documentary set that he collected between 1843 and 1851, the “Archivo Americano y Espíritu de la Prensa del Mundo.” With the “Archivo Americano,” Pedro de Angelis collected and brought to the public those documents he considered sources of the present. He thus constructed an archive of his living time to counteract Juan Manuel de Rosas’ opponents, such as the 1837 generation, for his contemporaries and subjects of the future to read. Finally, we study how he formed his own particular collection of documents and works, which he accumulated from mid-1830's until 1852 in his library, thanks to the "commerce of history" that occurred in the Platine region, and how it has become a National Library of the Brazilian Empire's fond in 1853. In a context of discursive dichotomy between civilization and barbarism, De Angelis used his collections and archives to construct a given memory for the Buenos Aires government, which did not consider the investment in custody and organization of documents or the promotion of local history writing as priorities. Moreover, his documentary assemblages eventually helped to establish himself as a scholar concerned with document preservation and knowledge production. Angelis, Pedro de, 1784-1854 Rosas, Juan Manuel de Biblioteca Nacional (Brasil) Arquivo Coleção particular Documentos históricos Buenos Aires (Argentina) Pedro de Angelis Argentina Juan Manuel de Rosas Archive Collection
12	Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX Pereira, Juliana Wolf 01 July 2014 (has links) Made available in DSpace on 2016-06-02T19:06:12Z (GMT). No. of bitstreams: 1 5898.pdf: 11774674 bytes, checksum: 3cc87530008d9b42c105781f8a1068a3 (MD5) Previous issue date: 2014-07-01 / Financiadora de Estudos e Projetos / This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation. / Esta dissertação apresenta uma abordagem de anotação semântica automática em documentos históricos do século XIX que discutem a constituição da língua pátria, a Língua Portuguesa no Brasil. O objetivo e gerar um conjunto de documentos semanticamente anotados em acordo com uma ontologia de domínio. Para prover essa ontologia de domínio, foi construída a Ontologia Instrumento Linguístico que apoiou o processo para a realização da anotação semântica automática. Os resultados obtidos com a anotação foram analisados em comparação com o Gold Standard e apresentaram alto grau de coincidência, entre 0.86 e 1.00 para a medida F1-Score. Além disso, foi possível localizar novos documentos sobre o domínio discutido em uma amostra das Revistas Brazileiras. Esses resultados comprovam a eficácia da abordagem de anotação semântica automática. Processamento de textos (Computação) Extração de relações semânticas Ontologia Documentos históricos Mineração de textos Semantic annotation Ontology-based information extraction Ontology Historical documents Text mining Natural language processing
13	Some Contributions to Interactive Machine Translation and to the Applications of Machine Translation for Historical Documents Domingo Ballester, Miguel 28 February 2022 (has links) [ES] Los documentos históricos son una parte importante de nuestra herencia cultural. Sin embargo, debido a la barrera idiomática inherente en el lenguaje humano y a las propiedades lingüísticas de estos documentos, su accesibilidad está principalmente restringida a los académicos. Por un lado, el lenguaje humano evoluciona con el paso del tiempo. Por otro lado, las convenciones ortográficas no se crearon hasta hace poco y, por tanto, la ortografía cambia según el período temporal y el autor. Por estas razones, el trabajo de los académicos es necesario para que los no expertos puedan obtener una comprensión básica de un documento determinado. En esta tesis abordamos dos tareas relacionadas con el procesamiento de documentos históricos. La primera tarea es la modernización del lenguaje que, a fin de hacer que los documentos históricos estén más accesibles para los no expertos, tiene como objetivo reescribir un documento utilizando la versión moderna del idioma original del documento. La segunda tarea es la normalización ortográfica. Las propiedades lingüísticas de los documentos históricos mencionadas con anterioridad suponen un desafío adicional para la aplicación efectiva del procesado del lenguaje natural en estos documentos. Por lo tanto, esta tarea tiene como objetivo adaptar la ortografía de un documento a los estándares modernos a fin de lograr una consistencia ortográfica. Ambas tareas las afrontamos desde una perspectiva de traducción automática, considerando el idioma original de un documento como el idioma fuente, y su homólogo moderno/normalizado como el idioma objetivo. Proponemos varios enfoques basados en la traducción automática estadística y neuronal, y llevamos a cabo una amplia experimentación que ratifica el potencial de nuestras contribuciones -en donde los enfoques estadísticos arrojan resultados iguales o mejores que los enfoques neuronales para la mayoría de los casos-. En el caso de la tarea de modernización del lenguaje, esta experimentación incluye una evaluación humana realizada con la ayuda de académicos y un estudio con usuarios que verifica que nuestras propuestas pueden ayudar a los no expertos a obtener una comprensión básica de un documento histórico sin la intervención de un académico. Como ocurre con cualquier problema de traducción automática, nuestras aplicaciones no están libres de errores. Por lo tanto, para obtener modernizaciones/normalizaciones perfectas, un académico debe supervisar y corregir los errores. Este es un procedimiento común en la industria de la traducción. La metodología de traducción automática interactiva tiene como objetivo reducir el esfuerzo necesario para obtener traducciones de alta calidad uniendo al agente humano y al sistema de traducción en un proceso de corrección cooperativo. Sin embargo,la mayoría de los protocolos interactivos siguen una estrategia de izquierda a derecha. En esta tesis desarrollamos un nuevo protocolo interactivo que rompe con esta barrera de izquierda a derecha. Hemos evaluado este nuevo protocolo en un entorno de traducción automática, obteniendo grandes reducciones del esfuerzo humano. Finalmente, dado que este marco interactivo es de aplicación general a cualquier problema de traducción, lo hemos aplicado -nuestro nuevo protocolo junto con uno de los protocolos clásicos de izquierda a derecha- a la modernización del lenguaje y a la normalización ortográfica. Al igual que en traducción automática, el marco interactivo logra disminuir el esfuerzo requerido para corregir los resultados de un sistema automático. / [CA] Els documents històrics són una part important de la nostra herència cultural. No obstant això, degut a la barrera idiomàtica inherent en el llenguatge humà i a les propietats lingüístiques d'aquests documents, la seua accessibilitat està principalment restringida als acadèmics. D'una banda, el llenguatge humà evoluciona amb el pas del temps. D'altra banda, les convencions ortogràfiques no es van crear fins fa poc i, per tant, l'ortografia canvia segons el període temporal i l'autor. Per aquestes raons, el treball dels acadèmics és necessari perquè els no experts puguen obtindre una comprensió bàsica d'un document determinat. En aquesta tesi abordem dues tasques relacionades amb el processament de documents històrics. La primera tasca és la modernització del llenguatge que, a fi de fer que els documents històrics estiguen més accessibles per als no experts, té per objectiu reescriure un document utilitzant la versió moderna de l'idioma original del document. La segona tasca és la normalització ortogràfica. Les propietats lingüístiques dels documents històrics mencionades amb anterioritat suposen un desafiament addicional per a l'aplicació efectiva del processat del llenguatge natural en aquests documents. Per tant, aquesta tasca té per objectiu adaptar l'ortografia d'un document als estàndards moderns a fi d'aconseguir una consistència ortogràfica. Dues tasques les afrontem des d'una perspectiva de traducció automàtica, considerant l'idioma original d'un document com a l'idioma font, i el seu homòleg modern/normalitzat com a l'idioma objectiu. Proposem diversos enfocaments basats en la traducció automàtica estadística i neuronal, i portem a terme una àmplia experimentació que ratifica el potencial de les nostres contribucions -on els enfocaments estadístics obtenen resultats iguals o millors que els enfocaments neuronals per a la majoria dels casos-. En el cas de la tasca de modernització del llenguatge, aquesta experimentació inclou una avaluació humana realitzada amb l'ajuda d'acadèmics i un estudi amb usuaris que verifica que les nostres propostes poden ajudar als no experts a obtindre una comprensió bàsica d'un document històric sense la intervenció d'un acadèmic. Com ocurreix amb qualsevol problema de traducció automàtica, les nostres aplicacions no estan lliures d'errades. Per tant, per obtindre modernitzacions/normalitzacions perfectes, un acadèmic ha de supervisar i corregir les errades. Aquest és un procediment comú en la indústria de la traducció. La metodologia de traducció automàtica interactiva té per objectiu reduir l'esforç necessari per obtindre traduccions d'alta qualitat unint a l'agent humà i al sistema de traducció en un procés de correcció cooperatiu. Tot i això, la majoria dels protocols interactius segueixen una estratègia d'esquerra a dreta. En aquesta tesi desenvolupem un nou protocol interactiu que trenca amb aquesta barrera d'esquerra a dreta. Hem avaluat aquest nou protocol en un entorn de traducció automàtica, obtenint grans reduccions de l'esforç humà. Finalment, atès que aquest marc interactiu és d'aplicació general a qualsevol problema de traducció, l'hem aplicat -el nostre nou protocol junt amb un dels protocols clàssics d'esquerra a dreta- a la modernització del llenguatge i a la normalitzaciò ortogràfica. De la mateixa manera que en traducció automàtica, el marc interactiu aconsegueix disminuir l'esforç requerit per corregir els resultats d'un sistema automàtic. / [EN] Historical documents are an important part of our cultural heritage. However,due to the language barrier inherent in human language and the linguistic properties of these documents, their accessibility is mostly limited to scholars. On the one hand, human language evolves with the passage of time. On the other hand, spelling conventions were not created until recently and, thus, orthography changes depending on the time period and author. For these reasons, the work of scholars is needed for non-experts to gain a basic understanding of a given document. In this thesis, we tackle two tasks related with the processing of historical documents. The first task is language modernization which, in order to make historical documents more accessible to non-experts, aims to rewrite a document using the modern version of the document's original language. The second task is spelling normalization. The aforementioned linguistic properties of historical documents suppose an additional challenge for the effective natural language processing of these documents. Thus, this task aims to adapt a document's spelling to modern standards in order to achieve an orthography consistency. We affront both task from a machine translation perspective, considering a document's original language as the source language, and its modern/normalized counterpart as the target language. We propose several approaches based on statistical and neural machine translation, and carry out a wide experimentation that shows the potential of our contributions¿with the statistical approaches yielding equal or better results than the neural approaches in most of the cases. For the language modernization task, this experimentation includes a human evaluation conducted with the help of scholars and a user study that verifies that our proposals are able to help non-experts to gain a basic understanding of a historical document without the intervention of a scholar. As with any machine translation problem, our applications are not error-free. Thus, to obtain perfect modernizations/normalizations, a scholar needs to supervise and correct the errors. This is a common procedure in the translation industry. The interactive machine translation framework aims to reduce the effort needed for obtaining high quality translations by embedding the human agent and the translation system into a cooperative correction process. However, most interactive protocols follow a left-to-right strategy. In this thesis, we developed a new interactive protocol that breaks this left-to-right barrier. We evaluated this new protocol in a machine translation environment, obtaining large reductions of the human effort. Finally, since this interactive framework is of general application to any translation problem, we applied it¿our new protocol together with one of the classic left-to-right protocols¿to language modernization and spelling normalization. As with machine translation, the interactive framework diminished the effort required for correcting the outputs of an automatic system. / The research leading to this thesis has been partially funded by Ministerio de Economía y Competitividad (MINECO) under projects SmartWays (grant agreement RTC-2014-1466-4), CoMUN-HaT (grant agreement TIN2015-70924-C2-1-R) and MISMISFAKEnHATE (grant agreement PGC2018-096212-B-C31); Generalitat Valenciana under projects ALMAMATER (grant agreement PROMETEOII/2014/030) and DeepPattern (grant agreement PROMETEO/2019/121); the European Union through Programa Operativo del Fondo Europeo de Desarrollo Regional (FEDER) from Comunitat Valenciana (2014–2020) under project Sistemas de frabricación inteligentes para la indústria 4.0 (grant agreement ID-IFEDER/2018/025); and the PRHLT research center under the research line Machine Learning Applications. / Domingo Ballester, M. (2022). Some Contributions to Interactive Machine Translation and to the Applications of Machine Translation for Historical Documents [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/181231 / TESIS Traducción automática estadística Traducción automática Traducción automática neuronal Traducción automática interactiva Documentos históricos Normalización ortográfica Modernización lingüística Machine translation Statistical machine translation Neural machine translation Interactive machine translation Historical documents Spelling normalization Language modernization LENGUAJES Y SISTEMAS INFORMATICOS

Page generated in 0.0806 seconds