Return to search

Um processo para a geração de recursos lingüísticos aplicáveis em ferramentas de auxílio à escrita científica.

Made available in DSpace on 2016-06-02T20:24:59Z (GMT). No. of bitstreams: 1
DissVSM.pdf: 4419849 bytes, checksum: a1cef53968c5829a753427d39a957525 (MD5)
Previous issue date: 2007-03-29 / Financiadora de Estudos e Projetos / Within the context of academic research, English is the lingua franca for various
scientific disciplines. It is also widely acknowledged that producing an acceptable academic
text is anything but a simple and easy task. This is particularly more acute if the author is a
novice researcher and English is not his/her first language. One possible solution to minimize
this difficulty is the use of writing tools to assist novice researchers during different stages of
the writing process. This could involve, for instance, quick and easy access to a collection of
authentic linguistic resources extracted from published scientific papers. AMADEUS
(Amiable Article Development for User Support) and SciPo (Scientific Portuguese) are good
examples of this type of writing tools. AMADEUS is a resource which was designed to help
non-native English users write academic texts. It focuses on the fields of Physics and
Computer Science specifically. SciPo is a Web critiquing system for writing theses in
Portuguese and focuses on the discipline of Computer Science. A variation of Scipo is SciPo-
Farmácia, which is a web-based tool to assist non-native speakers of English in writing
scientific papers in the field of Pharmaceutical Sciences.
The main purpose of this dissertation is to elaborate a semi-automatic process to
generate the necessary English linguistic resources required by supporting writing tools, such
as the ones mentioned above. The primary aim is to enable researchers from various
disciplines to develop their own aiding writing tool, customized to his/her specific field, with
no need to refer to linguists, computer scientists and/or academic writing specialists for help.
The semi-automatic process proposed here has been designed to include the knowledge which
would be provided by these specialists. The main methodology adopted in this research
derives from the discipline of Corpus Linguistics (we have used both corpus-based and
corpus-driven approaches). This choice relies on the assumption that the success of such tools
is strongly related to the corpus from which users collect well-written text extracts so that
they can be recycled and reused in the text being produced. The semi-automatic process was
evaluated in two ways: i) clearness and completeness of the manuals describing the linguistic
resources and ii) quality of the linguistic resources generated and estimated time for
developing all the necessary linguistic resources. For measuring the quality of the two
evaluation stages, we have used the statistical system Kappa. The results ranged from k=0.72
e k=1.0. These figures can be interpreted as a good understanding of the tasks described in the
manuals evaluated. The present research proves relevant in a number of aspects. It opens up
the possibility of generating a computational tool to assist non-native English speakers in
writing academic texts in any experimental field, by using the knowledge from the semiautomatic
process only. It also promotes the use of supporting writing tools as didactic
resource for teaching-learning scientific English and the use of metrics to evaluate rhetorical
structure models. Last but not least, it produces a rhetorically annotated corpus which may be
used for teaching-learning purposes or in natural language processing. / No ambiente acadêmico atual, a língua inglesa foi escolhida como a lingua franca da
ciência nas mais variadas áreas do conhecimento. No entanto, sabe-se que a tarefa de
produção de um texto científico adequado, no caso o artigo científico, não é fácil,
principalmente se o escritor é iniciante nessa atividade e sua língua materna não é o inglês.
Uma alternativa para esse problema é a utilização de ferramentas computacionais que apóiam
as diferentes etapas do processo de escrita de um texto científico, cuja base seja formada por
material lingüístico autêntico coletado de artigos científicos publicados e indexados de forma
a facilitar seu rápido acesso. Dentre essas ferramentas, destacamos três em especial: o
AMADEUS (Amiable Article Development for User Support), que apóia a escrita de artigos
científicos em inglês nas áreas de Física e Computação, o SciPo, inspirado no AMADEUS,
mas que apóia a escrita de teses e dissertações em português na área de Ciências da
Computação e o SciPo-Farmácia, que dá suporte à escrita de artigos científicos em inglês na
área de Ciências Farmacêuticas. O objetivo principal deste projeto de pesquisa foi formalizar
um processo para a construção de recursos lingüísticos em inglês a serem usados em
ferramentas de suporte à escrita científica semelhantes ao SciPo-Farmácia. A principal
metodologia utilizada derivou da Lingüística de Corpus (usamos tanto a abordagem dirigida
por córpus quanto baseada em córpus), pois a eficácia das ferramentas citadas, conforme
experiências relatadas por seus desenvolvedores, está fortemente ligada ao fato de possuírem
um córpus com textos da área de pesquisa do pesquisador-escritor, a partir do qual reutilizamse
trechos bem-escritos na escrita de um novo artigo. A avaliação do processo aqui proposto
se deu em dois momentos: i) na avaliação da clareza e da completude dos manuais de
construção de recursos lingüísticos, e ii) na avaliação da qualidade dos recursos lingüísticos
produzidos e elaboração de uma estimativa do tempo gasto na construção dos recursos
lingüísticos descritos por esses módulos. A estatística Kappa foi escolhida para medir a
qualidade do material produzido nas duas etapas, a qual indicou valores entre k=0.72 e k=1,0.
Esses bons resultados podem ser atribuídos ao entendimento do conteúdo dos manuais
utilizados na avaliação das tarefas contidas no processo proposto. Dentre as contribuições
desta pesquisa podemos citar: a possibilidade de construção de recursos lingüísticos para
gerar uma ferramenta de suporte à escrita científica em inglês para várias áreas que possuem a
pesquisa experimental como foco, utilizando apenas as informações contidas no processo
proposto; o auxilio na divulgação, via Web, de ferramentas computacionais de suporte à
escrita enquanto recurso didático a ser utilizado no ensino-aprendizado de inglês científico; a
divulgação de métricas para avaliação de modelos de estruturas esquemáticas propostas; e
disponibilização de córpus anotados em nível retórico para serem usados em ferramentas de
processamento de língua natural ou ensino.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/5647
Date29 March 2007
CreatorsMarquiafável, Vanessa Silva
ContributorsAluisio, Sandra Maria
PublisherUniversidade Federal de São Carlos, Programa de Pós-graduação em Linguística, UFSCar, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.003 seconds