1 |
[en] THE IMPACT OF STRUCTURAL ATTRIBUTES TO IDENTIFY TABLES AND LISTS IN HTML DOCUMENTS / [pt] O IMPACTO DE ATRIBUTOS ESTRUTURAIS NA IDENTIFICAÇÃO DE TABELAS E LISTAS EM DOCUMENTOS HTMLIAM VITA JABOUR 11 April 2011 (has links)
[pt] A segmentação de documentos HTML tem sido essencial para as tarefas
de extração de informações, como mostram vários estudos na área. Nesta dissertação
investigamos a relação entre o documento HTML e sua representação
visual, mostrando como esta ligação ajuda na abordagem estrutural para a
identificação de segmentos. Também investigamos como utilizar algoritmos de
distância de edição em árvores para encontrar padrões na árvore DOM, tornando
possível resolver duas tarefas de identificação de segmentos. A primeira
tarefa é a identificação de tabelas genuínas, aonde foi obtido 90,40% de F1
utilizando o corpus fornecido por (Wang e Hu, 2002). Mostramos através de
um estudo experimental que este resultado é competitivo com os melhores resultados
da área. A segunda tarefa que consideramos é a identificação de listas
de produtos em sites de comércio eletrônico, nessa obtivemos 94,95% de F1
utilizando um corpus com 1114 documentos HTML, criado a partir de 8 sites.
Concluímos que os algoritmos de similaridade estrutural ajudam na resolução
de ambas às tarefas e acreditamos que possam ajudar na identificação de outros
tipos de segmentos. / [en] The segmentation of HTML documents has been essential to information
extraction tasks, as showed by several works in this area. This paper studies
the link between an HTML document and its visual representation to show
how it helps segments identification using a structural approach. For this, we
investigate how tree edit distance algorithms can find structural similarities
in a DOM tree, using two tasks to execute our experiments. The first one is
the identification of genuine tables where we obtained a 90.40% F1 score using
the corpus provided by (Wang e Hu, 2002). We show through an experimental
study that this result is competitive with the best results in the area. The
second task studied is the identification of product listings in e-commerce sites.
Here we get a 94.95% F1 score using a corpus with 1114 HTML documents
from 8 distinct sites. We conclude that algorithms to calculate trees similarity
provide competitive results for both tasks, making them also good candidates
to identify other types of segments.
|
2 |
[en] MULTIMODALITY IN BIOLOGY TEXTBOOKS / [pt] A MULTIMODALIDADE EM LIVROS DE BIOLOGIAPATRICIA ALMEIDA DE REZENDE 23 December 2004 (has links)
[pt] Os livros didáticos modernos constituem-se num objeto de
estudo valioso
para o lingüista por serem elaborados a partir de múltiplas
modalidades semióticas
e porque, em geral, são gêneros disciplina-específicos.
Entretanto, no que tange à
disciplina de Biologia, ainda há poucos estudos que
exploram a interação entre as
modalidades verbal e visual nos livros de Ensino Médio e,
até o momento,
nenhum trabalho de natureza contrastiva foi realizado no
Brasil sobre esse
aspecto. Na presente análise, investigam-se os tipos de
representação visual e o
modo de estabelecimento da relação entre figuras e o texto
verbal associado em
dois livros didáticos de Biologia do Ensino Médio, um
brasileiro e outro norteamericano.
Este estudo baseia-se principalmente nos pressupostos
teóricos de
Kress e van Leeuwen (1996, 2001) e inspira-se nos trabalhos
de Myers (1997) e
Nascimento (2002). Implícita nesses pressupostos está a
abordagem sistêmicofuncional
de Halliday e Hasan (1976) e de Halliday (1994). Os
resultados desta
pesquisa revelam que, dentre outros mecanismos, a coesão
lexical exerce
importante papel na interação entre o componente verbal das
figuras, o texto
principal e as legendas em ambos os livros analisados.
Dentre as diferenças
encontradas nos dois livros, destacam-se as representações
visuais distintas
referentes a um mesmo tópico, o modo de referenciação às
figuras no texto, a
função das legendas e a proporção de utilização de termos
técnicos na coesão
intermodal. Esses resultados mostram que existem variações
no gênero livro
didático de Biologia quanto ao modo de utilização dos
mecanismos de interação
entre figuras e texto verbal, que podem estar relacionadas
com os propósitos dos
autores. Isso pode ter importantes implicações para o
ensino da Biologia e de
Inglês para fins específicos, pois auxilia na
conscientização de educadores e
alunos sobre a necessidade de se levar em consideração os
meios de interação
entre as linguagens visual e verbal na interpretação e
produção dos textos
multimodais próprios de cada comunidade discursiva. / [en] Modern textbooks are valuable as a research object in
applied linguistics
because they usually present their content through multiple
semiotic modalities
and because in general they are discipline-specific genres.
However, concerning
the discipline of Biology, there are still few studies that
exploit the interaction
between verbal and visual languages in highschool textbooks
and, up to the
moment, no contrastive works on this topic have been
published in Brazil. For
this reason, the goal of the present study is to
investigate the types of visual
representations and the strategies that establish the
interaction between pictures
and verbal text used in two highschool-level Biology
textbooks, a Brazilian and a
North-American one. This study is based mainly on Kress and
van Leeuwen s
(1996, 2001) theory of multimodality and is inspired in
Myers (1997) and
Nascimento s (2002) previous works. This theoretical basis
presupposes Halliday
and Hasan s (1976) and Halliday s (1997) systemic-
functional approach to text.
The results of this investigation reveal that, among other
mechanisms, lexical
cohesion has an important role in the interaction between
the verbal element in
images and the verbal language of the corresponding texts
and captions in both
books. Among the differences found between these two books,
there are the
different visual representations concerning the same topic,
the way pictures are
referred to in the text, the role of the captions and the
proportion of technical
terms used in intermodal cohesion. These results show that
there are intrageneric
variations in the use of such resources that are probably
due to the authors
purposes. The findings may have important implications for
the teaching of
Biology and of English for specific purposes. They may
enhance the awareness
of educators and students about the need of taking the
interaction between visual
and verbal languages into consideration for the appropriate
interpretation of texts
and for the production of multimodal texts specific to each
discursive community.
|
3 |
[en] A GRAPH-MINING BASED METHOD FOR SEGMENTATION AND COUNTING OF LOCAL MAXIMUM CLUSTERS IN DIGITAL IMAGES / [pt] UM MÉTODO BASEADO EM MINERAÇÃO DE GRAFOS PARA SEGMENTAÇÃO E CONTAGEM DE CLUSTERS DE MÁXIMOS LOCAIS EM IMAGENS DIGITAISGEISA MARTINS FAUSTINO 19 August 2011 (has links)
[pt] Uma imagem monocromática pode ser interpretada como uma superfície topológica e desta forma objetos de interesse podem aparecer como picos (sharp mountains), domos (smooth hills) ou vales (V- or U-shaped). Um domo geralmente contém vários pontos de máximo locais em seu topo. Logo, fica bem caracterizado por um cluster de máximos locais. Segmentar individualmente objetos em imagens onde estes aparecem parcialmente sobrepostos ou fortemente agrupados é um problema que métodos clássicos de segmentação podem não solucionar adequadamente. Outro problema é contar objetos idênticos em imagens perviamente segmentada. Esta tarefa, quando executada manualmente, devido ao cansaço visual exige um grande esforço humano. É tediosa, demorada, além de gerar resultados subjetivos. O presente trabalho propõe um novo método para segmentação e contagem de clusters de máximos locais em uma imagem digital através uma abordagem baseada em grafos. Utilizando a informação de luminância, a imagem é representada por um grafo de adjacências e um algoritmo de mineração é utilizado para segmentar os clusters. Por fim, de acordo com características da imagem, um algoritmo de clusterização pode ser incorporado ao processo para melhorar o resultado final. A contagem dos objetos é um resultado direto do algoritmo de mineração e de clusterização, quando este último é aplicado. O método proposto é tolerante a variações no tamanho e forma dos objetos e é facilmente parametrizado para lidar com diferentes grupos de imagens provenientes de objetos distintos. Testes executados em uma base de dados com 262 imagens, composta de imagens de objetos reais (grupo 1) e de células tronco embrionárias em imagens de microscopia fluorescente (grupo 2), atestam a eficiência e qualidade do método desenvolvido no que diz respeito a segmentação e a contagem. Os resultados gerados para as imagens do grupo 1 foram validados pela autora e os do grupo 2 pelos biólogos do Instituto de Ciências Biomédicas da Universidade Federal do Rio de Janeiro. Para estas imagens foram obtidas uma F-measuare média de 85,33% e 90,88%, respectivamente. Por fim, um estudo comparativo com o algoritmo clássico de watershed foi realizado. Este alcançou uma F-measuare média de 74.02% e 78,28% para os grupos 1 e 2, respectivamente, contra 85,33% e 91,60% obtido pelo método proposto. / [en] A grayscale image can be viewed as a topological surface and this way, objects
of interests may appear as peaks (sharp mountains), domes (smooth hills) or
valleys (V- or U-shaped). Generally, the dome top presents more than one local
maximum. Thus, it can be characterized by a local maximum cluster. Segmenting
objects individually in images where they appear partially or totally fused is
a problem which frequently may not be solved by a watershed segmentation
or a basic morphological processing of images. Other issue is counting similar
objects in images segmented beforehand. Counting them manually is a tedious
and time-consuming task, and its subjective nature can lead to a wide variation
in the results. This work presents a new method for segmenting and counting
of local maximum clusters in digital images through a graph-based approach.
Using the luminance information, the image is represented by a region adjacency
graph and a graph-mining algorithm is applied to segment the clusters. Finally,
according to image characteristics, a graph-clustering algorithm can be added
to the process to improve the final result. The object counting step is a direct
result from the mining algorithm and the clustering algorithm, when the latter
is applied. The proposed method is tolerant to variations in object size and
shape and can easily be parameterized to handle different image groups resulting
from distinct objects. Tests made on a database with 262 images, composed of
photographs of objects (group 1) and embryonic stem cells under fluorescence
microscopy images (group 2), attest the effectiveness and quality of the proposed
method as for segmentation and counting purpose. The images form group 1
processed by our method were checked by the author and those ones from group
2 by the specialists from the Institute of Biomedical Sciences at UFRJ. For these
images we obtained an average F-measure of 85.33% and 90.88%, respectively.
Finally, a comparative study with the widely used watershed algorithm was done.
The watershed achieved an average F-measure of 74.02% e 78.28% for groups 1
and 2, respectively, against 85.33% e 91.60% obtained by our method.
|
4 |
[pt] DESENHANDO O PROCESSO: UMA PRÁTICA PEDAGÓGICA PARA O EXERCÍCIO DA REFLEXÃO CRÍTICA SOBRE PROJETO DE DESIGN / [en] DRAWING THE PROCESS: AN EDUCATIONAL PRACTICE TO DEVELOP CRITICAL THINKING ON DESIGNNINA ATALLA PIETROLUONGO O VIEIRA 22 July 2021 (has links)
[pt] Esta pesquisa, de cunho exploratório, teve por objetivo o desenvolvimento de uma
atividade pedagógica voltada para o ensino de projeto de Design. A pesquisa surge da
constatação da importância do conteúdo de metodologia de projeto, enquanto conteúdo
estruturante da prática empírica de projeto, e da necessidade do estímulo à reflexão
crítica sobre processos de projeto no curso de Design da PUC-Rio. Para responder a
essas questões, uma atividade pedagógica de desenho de processo de projeto foi
desenvolvida e testada com dois alunos em duas diferentes disciplinas de Projeto do
curso de Design da PUC-Rio – DSG 1030 Anteprojeto e DSG 1032 Projeto Final de
Comunicação Visual. A investigação foi fundamentada por autores, que tratavam dos
processos cognitivos da aprendizagem e também sobre o fluxo cognitivo da reflexão-naação,
noção-chave desta pesquisa. A atividade revelou-se uma rica ferramenta didática
de estímulo ao pensamento crítico sobre a prática de projeto em Design, na medida em
que facilitou um exercício de auto análise e deu aos alunos as condições didáticas para
que situassem e organizassem suas experiências empíricas de projeto durante a
formação. / [en] This exploratory research aimed to develop a pedagogical tool oriented to teaching of
design projects. The research arises from the importance of design methodology, as a
structuring content of the empirical design practice, and from the need to encourage
critical reasoning on design processes observed in PUC-Rio s design graduation course.
To deal with these questions, a drawing exercise – in which the student s task was to
draw the process of their design project – was developed and tested with two students in
two different disciplines from the Design course at PUC-Rio. The investigation was
supported by authors, who dealt with the cognitive processes of learning and also on the
cognitive flow of reflection-in-action, a key notion of this research. The activity proved to
be a rich educational tool to stimulate critical thinking about the practice of design, as it
facilitated an exercise of self-analysis and gave students the pedagogical conditions to
recognize and organize their empirical experiences during the course.
|
Page generated in 0.0357 seconds