Spelling suggestions: "subject:"4digital 1mages"" "subject:"4digital demages""
101 |
Embodying comics: reinventing comics and animation for a digital performanceSamanci, Ozge 02 July 2009 (has links)
In the digital era, the comics medium has been transported from print to computer screen, and thus its evolution takes place in digital performances based on full-body interaction technologies. The major implication of this process is that the conventions of comics will be merging with those of performance, film, and animation. In a comics story implemented with full-body interaction technologies, representational space shifts from two to three dimensions. Physical elements can now easily be combined with virtual ones. The participants' contribution to the experience now includes a larger set of kinesthetic choices. Earlier media offer the readers the opportunity to read the story with their eyes, turn pages, and click a mouse. Instead of one or perhaps two readers of print and screen-based comics, a digital performance can be experienced by a group of viewers positioned in space in various ways. By utilizing the tools of computer vision, the projection of a participant can be made the main character of the comics story. Consequently, the comics and animation frame changes when moved to digital performance spaces. The frame becomes embodied, nested, elastic, and dynamic. The first two qualities relate to the physicality of the medium, where performers and viewers are simultaneously present in both the real and fictional spaces. The second two qualities relate to the procedurality of the medium and the potential for computational manipulation within the frame based on changing relationships across space (distance) and time (story).
|
102 |
Aplicações de imagens digitais e análise multivariada para classificação e determinação de parâmetros de qualidade em plumas de algodãoGonçalves, Maria Ivanda Silva 31 August 2015 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2016-05-11T12:40:39Z
No. of bitstreams: 1
arquivo total.pdf: 6105657 bytes, checksum: 8404a0fcb54e3893c95fdfb017f0ac96 (MD5) / Made available in DSpace on 2016-05-11T12:40:39Z (GMT). No. of bitstreams: 1
arquivo total.pdf: 6105657 bytes, checksum: 8404a0fcb54e3893c95fdfb017f0ac96 (MD5)
Previous issue date: 2015-08-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / In recent years, commercial cotton lint have been developed with better quality, presenting different characteristics, but with similar coloring. This can be a problem because these samples is identified, large-scale, performed by a visual inspection, which is a very subjective method and error prone. Another way available for classification of samples is the use of HVI system (High Volume Instruments) to determine physical quality parameters. However, this apparatus has a high cost when compared to digital imaging technique, furthermore has the need for adequate infrastructure and a trained analyst for analysis procedure. This work proposes the development of a novel analytical method based on the use of digital image and multivariate analysis to (1) naturally colored cotton plumes classification according to the type of cultivar and (2) simultaneous determination of degree of yellowness (+b), reflectance (Rd) and wax content (WAX). The acquisition of digital images of cotton lints was carried out through a webcam and histograms containing distributions in levels of colors in standard RGB (red-green-blue), grayscale and HSV system (hue-saturation-value) they were obtained. In the classification of samples, models based discriminant analysis by partial least squares (PLS-DA) and linear discriminant analysis (LDA) with variable selection by the successive projections algorithm (SPA) or stepwise (SW) were evaluated. For the determination of the parameters +b, Rd and WAX, PLS models and multiple linear regression (MLR) with variable selection by the SPA were developed and compared. The best classification results were obtained with LDA / SW model with a correct classification rate (TCC) of 96% for the test group using the HSV combination. As the calibration methods, satisfactory prediction results were obtained for both models (PLS and MLR-SPA) with values of RMSEP near repeatability of the reference method. Furthermore, no systematic error was observed and there were no significant differences between the predicted values and reference, according to a paired t-test at 95% confidence. As advantages of the method is simple, low cost, does not use reagent, does not destroy the sample and realizes analysis at short time intervals. / Nos últimos anos, plumas de algodão comerciais têm-se desenvolvido com melhor qualidade, apresentando características diferentes, mas com coloração similar. Isto pode ser um problema porque a identificação destas amostras é, em larga escala, realizada por meio de uma inspeção visual, que é um método subjetivo e sujeito a erros. Outra forma disponível para classificação dessas amostras consiste no uso do sistema HVI (High Volume Instruments) na determinação de parâmetros físicos de qualidade. Contudo, tal equipamento apresenta um alto custo, se comparado a técnica de imagens digitais, além do mais tem-se a necessidade de uma infraestrutura adequada e de um analista treinado para o procedimento de análise. Este trabalho propõe o desenvolvimento de uma nova metodologia analítica baseada na utilização de imagens digitais e análise multivariada para (1) classificação de plumas de algodão naturalmente colorido de acordo com o tipo de cultivar e (2) determinação simultânea de grau de amarelamento (+b), reflectância (Rd) e teor de cera (WAX). A aquisição das imagens digitais das plumas de algodão foi realizada por meio de uma webcam e foram obtidos os histogramas contendo as distribuições nos níveis de cores no padrão RGB (vermelho-verde-azul), escala de cinza e o sistema HSV (matiz-saturação-valor). Na classificação das amostras, modelos baseados na análise discriminante pelos mínimos quadrados parciais (PLS-DA) e análise discriminante linear (LDA) com seleção de variáveis pelo algoritmo das projeções sucessivas (SPA) ou pelo stepwise (SW) foram avaliados. Para a determinação dos parâmetros de +b, Rd e WAX, modelos PLS e regressão linear múltipla (MLR) com seleção de variáveis pelo SPA foram desenvolvidos e comparados. Os melhores resultados de classificação foram obtidos com o modelo LDA/SW, com uma taxa de classificação correta (TCC) de 96% para o conjunto de teste utilizando a combinação HSV. Quanto aos métodos de calibração, resultados de previsão satisfatórios foram obtidos para ambos os modelos (PLS e MLR-SPA), com valores de RMSEP próximos à repetitividade do método de referência. Além disso, nenhum erro sistemático foi observado e não foram encontradas diferenças significativas entre os valores previstos e de referência, de acordo com um teste t-pareado ao nível de confiança de 95%. Como vantagens o método é simples, de baixo custo, não utiliza reagente, não destrói a amostra e realiza análise em curtos intervalos de tempo.
|
103 |
Um analisador fluxo-batelada baseado em imagem digital para determinação de Al(III) e Cr(VI) em águas / A digital Image-Based Flow-Batch Analyzer for Al(III) and Cr(VI) Determination in WatersAndrade, Stéfani Iury Evangelista de 09 March 2012 (has links)
Made available in DSpace on 2015-05-14T13:21:11Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 3039736 bytes, checksum: b5085a1b7abd18466b736a0a3c3e8de7 (MD5)
Previous issue date: 2012-03-09 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study proposes a digital image-based flow-batch analyzer (DIB-FBA) for the determination of Al(III) and Cr(VI) in waters. The proposed DIB-FBA uses a webcam with CCD sensor for acquisition of the images generated according to the RGB (Red-Green-Blue) colour system. The method for determination of Al(III) is based on reaction of this ion with quercetin and cetyltrimethylammonium bromide, yielding a yellow complex with maximum absorption at 428 nm. Chromium(VI) determination is accomplished by reaction of this ion with 1,5-diphenylcarbazide, whose product is a violet complex with maximum absorption at 548 nm. All calibration solutions were prepared in-line, and all analytical processes completed by simply changing the operational parameters in the DIB-FBA control software. The linear response ranges from 10 to 600 μg L−1 for Al (III) and from 10 to 300 μg L−1 for Cr (VI). Linear models for analytical curves were validated using ANOVA, F-test for lack of fit and residual plots. The limits of detection and sampling rates were estimated as 3,97 μg L−1 and 137 h−1, for Al(III) and 3,40 μg L−1 and 134 h−1, for Cr(VI), respectively. DIB-FBA performance was compared with the reference methods for determination of both analytes, and no statistically significant difference was observed between results by applying the paired t-test at a 95% confidence level. / Esse estudo propõe um analisador fluxo-batelada baseado em imagem digital (DIB-FBA) para determinação de Al(III) e Cr(VI) em águas. O DIB-FBA utiliza uma webcam com sensor CCD para a aquisição das imagens geradas de acordo com o sistema de cor RGB (Red-Green-Blue). O método para a determinação de Al(III) baseia-se na reação com quercetina e o brometo de cetiltrimetilamônio, produzindo um complexo amarelo com máximo de absorção em 428 nm. A determinação de cromo é baseada na reação do íon Cr(VI) com 1,5-difenilcarbazida, cujo o produto é um complexo de coloração violeta com máximo de absorção em 548 nm. Todas as soluções de calibração foram preparadas in-line e todos os processos analíticos foram realizados simplesmente mudando os parâmetros operacionais do aplicativo de controle do DIB-FBA. A resposta linear para o Al(III) se estende de 10 a 600 μg L−1 e para o Cr(VI) de 10 a 300 μg L−1. Os modelos lineares das curvas analíticas foram validados por intermédio de ANOVA, teste F para falta de ajuste e da análise gráfica dos resíduos deixados pelos modelos. Os limites de detecção e as frequências analíticas foram estimadas como sendo, respectivamente, 3,97 μg L−1 e 137 h−1, para o Al(III) e 3,40 μg L−1 e 134 h−1, para o Cr(VI). Os resultados da aplicação do DIB-FBA foram comparados com os obtidos empregando os respectivos métodos de referência. Constatou-se que não existe nenhuma diferença estatisticamente significativa entre os resultados, aplicando o teste t-pareado ao nível de confiança de 95%.
|
104 |
Determinação quimiluminescente de ferro em óleos baseado em pontos quânticos de CdTe usando um sistema fluxo-batelada com extração em fase única e imagens digitaisLima, Marcelo Batista de 25 April 2014 (has links)
Made available in DSpace on 2015-05-14T13:21:34Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 4173293 bytes, checksum: b97bdde9738a247557cc099fc80a29af (MD5)
Previous issue date: 2014-04-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / In this work, a novel chemiluminescence method using flow-batch analysis for the determination of iron in viscous samples (edible oil, lubricating oil and biodiesel) employing cadmium telluride quantum dots (CdTe QDs) with detection by digital images from webcam was developed. The analytical method proposed a novel strategy includes a pretreatment of the sample that constitutes on-line availability of total iron by acid extraction in one step. In the automatic pre-treatment, a new strategy was developed for chemiluminescent emission, whereby the available analyte was oxidized to Fe(III) in the presence of dichromate ions and reduced to Fe(II) by direct oxidation of CdTe QDs, allowing promote chemiluminescent emission of these nanocrystals. The influence of the size and concentration QDs in this system was estimated revealing a higher sensitivity and selectivity for the small crystals obtained (1.65 nm). Concerning the flow-batch analysis a new mixing chamber was developed in polytetrafluoroethylene (PTFE) provided with quartz windows in order to allow luminescent probes online. A novel management program the automatic system was developed enabling rapid acquisition and efficient handling of digital images without the need to use another program to tratamendo the information obtained. For the construction of the analytical curve-based mathematical model in the RGB color values was used, therefore, considered the norm of vectors in response. The limit of detection and relative standard deviation were calculated to be 0.66 μg mL 1 and < 1.5 % (n = 3), respectively. The analysis of interfering was successful for the major ions present in solution, revealing significant percentage interference (≤ 5 %). The precision of the method was evaluated by recovery test (97.5 to 103.3 %). The robustness of the method was evaluated by intra- and inter- day comparison of the results obtained and using the reference method with detection by atomic absorption graphite furnace at a 95% level of statistical confidence. Finally, the system showed quite satisfactory analytical frequency (43 h 1) and considerably reducing the consumption of chemicals. Thus, it is demonstrated appreciably the viability of new chemiluminescent method, thus allowing the development of new analytical strategies employing potentially useful quantum dots, automation and digital images. / Neste trabalho de pesquisa foi desenvolvido um novo método quimiluminescente em fluxo-batelada para determinação de ferro total em matrizes viscosas (óleo comestível, óleo lubrificante e biodiesel) empregando pontos quânticos de telureto de cádmio (PQs de CdTe) com detecção por imagens digitais via webcam. O método analítico proposto inclui uma nova estratégia de pré-tratamento da amostra que consiste na disponibilização on-line do ferro total por meio de extração ácida em fase única. Além do pré-tratamento automático, uma nova estratégia para emissão quimiluminescente foi desenvolvida, através da qual todo o analito disponível foi oxidado para Fe(III) na presença de íons dicromato e reduzido para Fe(II) mediante o processo de oxidação direta dos PQs de CdTe, o que permitiu promover a emissão quimiluminescente desses nanocristais. A influência do tamanho e concentração dos PQs nesse sistema foi avaliada revelando uma maior sensibilidade e seletividade para os cristais obtidos de menor dimensão (1,65 nm). Concernente ao sistema automático fluxo-batelada uma nova câmara de mistura foi desenvolvida em politetrafluoretileno (PTFE) provida de janelas de quartzo com o objetivo de permitir detecções luminescentes on-line. Um novo programa de gerenciamento do sistema automático foi desenvolvido permitindo uma rápida aquisição e eficiente tratamento das imagens digitais, sem a necessidade de empregar qualquer outro programa para o tratamento da informação obtida. Para a construção da curva analítica foi utilizado um modelo matemático baseado nos valores de cor RGB, sendo assim, considerada a norma dos vetores como resposta. O limite de detecção e o desvio padrão relativo foram calculados em 0,66 μg L 1 e < 1,5 % (n = 3), respectivamente. A análise de interferentes foi realizada com êxito para os principais íons presentes em solução, não revelando interferência percentual significativa (≤ 5%). A exatidão do método foi avaliada através do teste de recuperação (97,5 103,3 %). A robustez do método foi avaliada por comparação intra- e inter-dia dos resultados obtidos e empregando o método de referência com detecção por absorção atômica em forno de grafite em um nível de 95% de confiança estatística. Por fim, o sistema apresentou frequência analítica bastante satisfatória (43 h 1) e redução considerável do consumo de produtos químicos. Desta forma, é demonstrado de modo apreciável a viabilidade do novo método quimiluminescente, permitindo assim, o desenvolvimento de novas estratégias analíticas potencialmente úteis empregando pontos quânticos, automação e imagens digitais.
|
105 |
Novas estratégias para classificação simultânea do tipo e origem geográfica de chás / New strategies for simultaneous classification of both the variety and geographical origin of teasDiniz, Paulo Henrique Gonçalves Dias 21 June 2013 (has links)
Made available in DSpace on 2015-05-14T13:21:38Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 6875549 bytes, checksum: 3697064e0b5c3d3ac90181f954575bc7 (MD5)
Previous issue date: 2013-06-21 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Tea has an economic and cultural importance, not only for producers and
consumers, but also for a scientific interest. The organoleptic quality of the Camellia
sinensis infusion depends on the nature and amount of several secondary
metabolites (such as polyphenols, caffeine, amino acids, etc.), which can be directly
related to the geographical origin of the tea plants. These components are the basis
of the economic value of teas and its beneficial effects on human health. Therefore,
there is a growing consumer s interest in high quality teas with a distinct geographical
identity. In last decades, the analytical methods employing modern instrumental
techniques have become more sensitive, reliable and fast. However, these
techniques have advantages and limitations for the application in the analyses of the
tea quality and their geographic origins. Thus, a combination of different techniques
could be more useful than relying on a single method. Following these principles, we
propose three new strategies for simultaneous classification of teas according to both
the type (green and black) and geographic origin (Argentina, Brazil and Sri Lanka).
The proposed methodologies employ the use of (1) digital images, (2) NIR
spectroscopy, and (3) chemical composition (moisture, ash, caffeine, total
polyphenols, fluoride and fifteen metals (Na, Mg, Al, P, K, Ca, Cr, Mn, Fe, Co, Ni, Cu,
Zn, Cd and Pb) in both tea leaves and infusions). A correct classification of all tea
samples (100% of correct classification) was always obtained using the Linear
Discriminant Analysis associated with the variable selection technique taken by the
Successive Projections Algorithm. Soft Independent Modeling of Class Analogy
(SIMCA) and Partial Least Squares Discriminant Analysis (PLS-DA) were also used.
The proposed strategies might be useful for the development of legislation for the
quality control of teas in Brazil, which is still lacking / O chá tem uma importância econômica e cultural, não só para produtores e
consumidores, mas também por um interesse científico. A qualidade organoléptica
da infusão da Camellia sinensis depende da natureza e da quantidade de vários
metabólitos secundários (tais como polifenóis, cafeína, aminoácidos, etc.), os quais
podem ser relacionados diretamente com a origem geográfica das plantas. Estes
componentes são a base do valor econômico do chá e de seus efeitos benéficos
sobre a saúde humana. Por isso, há um crescente interesse dos consumidores por
chás de alta qualidade com uma clara identidade geográfica. Durante as últimas
décadas, as metodologias analíticas que empregam técnicas instrumentais
modernas tornaram-se mais sensíveis, confiáveis e rápidas. Entretanto, tais técnicas
têm vantagens e limitações para a aplicação da análise da qualidade do chá e de
suas origens geográficas. Assim, uma combinação de diferentes técnicas analíticas
pode ser mais útil do que depender de um único método. Seguindo estes preceitos,
nós propusemos três novas estratégias para a classificação simultânea de chás de
acordo com o tipo (verde e preto) e a origem geográfica (Argentina, Brasil e Sri
Lanka). As metodologias propostas empregam o uso de (1) imagens digitais, (2)
espectroscopia NIR e (3) composição química (umidade, cinza total, cafeína,
polifenóis totais, fluoreto e quinze metais (Na, Mg, Al, P, K, Ca, Cr, Mn, Fe, Co, Ni,
Cu, Zn, Cd e Pb) nas folhas e infusões dos chás). Uma classificação correta de
todas as amostras de chás (100% de acerto) foi sempre obtida utilizando Análise
Discriminante Linear associada à técnica de seleção de variáveis feita pelo Algoritmo
das Projeções Sucessivas (SPA-LDA). Modelagem Independente e Flexível por
Analogia de Classe (SIMCA) e Análise Discriminante por Mínimos Quadrados
Parciais (PLS-DA) também foram utilizadas. Tais estratégias podem ser úteis para a
elaboração de normas para o controle de qualidade de chás no Brasil, que ainda é
inexistente
|
106 |
Determinação da acidez total de vinhos tintos empregando titulações baseadas em imagens digitais / Determination of Total Acidity in Red Wines Employing Digital Image-Based TitrationsTôrres, Adamastor Rodrigues 19 March 2010 (has links)
Made available in DSpace on 2015-05-14T13:21:45Z (GMT). No. of bitstreams: 1
parte1.pdf: 2505729 bytes, checksum: e872a92484e063cf1f264ba7b16d9e2e (MD5)
Previous issue date: 2010-03-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work proposes the use of digital images captured by a Webcam for
determination of total acidity in red wines by means of an acid-base titration without
using an external indicator. Digital images present the colour of the emergent
radiation, which is complementary to the radiation absorbed by molecules of
anthocyanines presents in wines. Each image, generated according to RGB system,
yields a matrix of the values of the R, G and B components whose averages define a
the colour value obtained as: 2R ⋅2G ⋅2B. This value was adopted as analytical
response to build titrations curves based on digital images (DIB). For a more precise
localization of the end point, titrations curves were generated on the basis of the
second derivative values of the analytical response. Anthocyanines present different
colours according to medium pH and, from the variation of the colour values of the
images obtained during the titration of the red wines, the end point could be detected
with precision. The official method recommends the use of potenciometric titration for
determination of total acidity in red wines. This method requires a dilution of the
sample before the titration that must be carried out until a fixed value of pH (8.2
8.4). In order to illustrate the feasibility of the proposed method titrations involving the
determination of total acidity in ten red wines samples were carried out. Results were
compared to the ones obtained by potenciometric titration used as reference method.
No statistic difference has been observed between the results by applying the paired
t-test at 95% confidence level. The proposed method yielded results with a better
precision than the official method. These advantageous characteristics are attributed
to the trivariate nature of the measures associated to digital images. / Neste trabalho, propõe-se o uso de imagens digitais, capturadas com uma
Webcam, para determinação da acidez total de vinhos tintos por meio de titulação
ácido-base sem a utilização de indicador externo. As imagens digitais apresentam a
cor da radiação emergente que é complementar à da radiação absorvida por
moléculas de antocianinas presentes nos vinhos. Cada imagem, gerada de acordo
com o sistema vermelho-verde-azul (RGB), fornece uma matriz de valores dos
componentes R, G e B cujas médias definem o valor de cor obtido como:
2R ⋅2G ⋅2B. Esse valor foi adotado como resposta analítica para a construção das
curvas de titulação baseadas em imagens digitais (DIB). Para a localização mais
precisa do ponto final, foram geradas as curvas de titulação com base nos valores
da segunda derivada da resposta analítica. As antocianinas apresentam diferentes
cores de acordo com o pH do meio e, a partir das variações do valor de cor das
imagens obtidas durante a titulação dos vinhos tintos, o ponto final pôde ser
detectado com precisão. O método oficial recomenda o uso da titulação
potenciométrica para a determinação da acidez total de vinhos tintos. Este método
requer diluição da amostra antes da titulação que deve ser efetuada até um valor
fixo de pH (8,2-8,4). A fim de ilustrar a viabilidade do método proposto, foram
realizadas titulações envolvendo a determinação da acidez total em dez amostras de
vinhos tintos. Os resultados foram comparados com os obtidos pela titulação
potenciométrica usada como método de referência. Constatou-se que não há
diferença sistemática estatisticamente significativa entre os resultados, aplicando-se
o teste t emparelhado ao nível de 95% de confiança. O método proposto produziu
resultados com uma precisão melhor que a do método oficial. Essas características
vantajosas da titulação DIB são atribuídas à natureza trivariada das medidas
associadas às imagens digitais.
|
107 |
Searching for people through textual and visual attributes = Busca de pessoas a partir de atributos visuais e textuais / Busca de pessoas a partir de atributos visuais e textuaisFabián Arteaga, Junior John, 1987- 24 August 2018 (has links)
Orientador: Anderson de Rezende Rocha / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-24T07:58:15Z (GMT). No. of bitstreams: 1
FabianArteaga_JuniorJohn_M.pdf: 5046344 bytes, checksum: 42a497d56da6118f1f860730ea66f81d (MD5)
Previous issue date: 2013 / Resumo: Utilizar características pessoais para procurar pessoas é fundamental em diversas áreas de aplicação e nos últimos anos tem atraído uma atenção crescente por parte da comunidade científica com aplicações no campo da forense digital e vigilância tais como: localização de suspeitos ou de pessoas desaparecidas em espaços públicos. Neste trabalho, objetivamos utilizar atributos visuais descritíveis (por exemplo, homens brancos com bochechas em destaque usando óculos e com franja) como rótulos nas imagens para descrever sua aparência e, dessa forma, realizar buscas visuais por conteúdo sem depender de anotações nas imagens durante os testes. Para isso, criamos representações robustas para imagens de faces baseadas em dicionários visuais, vinculando as propriedades visuais das imagens aos atributos descritíveis. Primeiro, propomos duas abordagens de caracterização das imagens, uma de escala única e outra de múltiplas escalas para resolver consultas simples (somente um atributo). Em ambos os métodos, obtemos as características de baixo nível das imagens utilizando amostragens esparsas ou densas. Em seguida, selecionamos as características de maior repetibilidade para a criação de representações de médio nível baseadas em dicionários visuais. Posteriormente, treinamos classificadores binários para cada atributo visual os quais atribuem, para cada imagem, uma pontuação de decisão utilizada para obter sua classificação. Também propomos diferentes formas de fusão para o método de descrição de múltiplas escalas. Para consultas mais complexas (mais de dois atributos), avaliamos três abordagens presentes na literatura para combinar ordens (rankings): produto de probabilidades, rank aggregation e rank position. Além disso, propomos uma extensão do método de combinação baseado em rank aggregation para levar em conta informações complementares produzidas pelos diferentes métodos. Consideramos quinze classificadores de atributos e, consequentemente, seus negativos, permitindo, teoricamente, 32 768 diferentes consultas combinadas. Os experimentos mostram que a abordagem de descrição em múltiplas escalas melhora a precisão de recuperação para a maior parte dos atributos em comparação com outros métodos. Finalmente, para consultas mais complexas, a abordagem de descrição em múltiplas escalas em conjunto com versão estendida do rank aggregation melhoram a precisão em comparação com outros métodos de fusão como o produto de probabilidades e o rank positionUtilizar características pessoais para procurar pessoas é fundamental em diversas áreas de aplicação e nos últimos anos tem atraído uma atenção crescente por parte da comunidade científica com aplicações no campo da forense digital e vigilância tais como: localização de suspeitos ou de pessoas desaparecidas em espaços públicos. Neste trabalho, objetivamos utilizar atributos visuais descritíveis (por exemplo, homens brancos com bochechas em destaque usando óculos e com franja) como rótulos nas imagens para descrever sua aparência e, dessa forma, realizar buscas visuais por conteúdo sem depender de anotações nas imagens durante os testes. Para isso, criamos representações robustas para imagens de faces baseadas em dicionários visuais, vinculando as propriedades visuais das imagens aos atributos descritíveis. Primeiro, propomos duas abordagens de caracterização das imagens, uma de escala única e outra de múltiplas escalas para resolver consultas simples (somente um atributo). Em ambos os métodos, obtemos as características de baixo nível das imagens utilizando amostragens esparsas ou densas. Em seguida, selecionamos as características de maior repetibilidade para a criação de representações de médio nível baseadas em dicionários visuais. Posteriormente, treinamos classificadores binários para cada atributo visual os quais atribuem, para cada imagem, uma pontuação de decisão utilizada para obter sua classificação. Também propomos diferentes formas de fusão para o método de descrição de múltiplas escalas. Para consultas mais complexas (mais de dois atributos), avaliamos três abordagens presentes na literatura para combinar ordens (rankings): produto de probabilidades, rank aggregation e rank position. Além disso, propomos uma extensão do método de combinação baseado em rank aggregation para levar em conta informações complementares produzidas pelos diferentes métodos. Consideramos quinze classificadores de atributos e, consequentemente, seus negativos, permitindo, teoricamente, 32 768 diferentes consultas combinadas. Os experimentos mostram que a abordagem de descrição em múltiplas escalas melhora a precisão de recuperação para a maior parte dos atributos em comparação com outros métodos. Finalmente, para consultas mais complexas, a abordagem de descrição em múltiplas escalas em conjunto com versão estendida do rank aggregation melhoram a precisão em comparação com outros métodos de fusão como o produto de probabilidades e o rank position / Abstract: Using personal traits for searching people is paramount in several application areas and has attracted an ever-growing attention from the scientific community over the past years. Some practical applications in the realm of digital forensics and surveillance include locating a suspect or finding missing people in a public space. In this work, we aim at assigning describable visual attributes (e.g., white chubby male wearing glasses and with bangs) as labels to images to describe their appearance and performing visual searches without relying on image annotations during testing. For that, we create mid-level image representations for face images based on visual dictionaries linking visual properties in the images to describable attributes. First, we propose one single-level and one multilevel approaches to solve simple queries (queries containing only one attribute). For both methods, the first step consists of obtaining image low-level features either using a sparse or a dense-sampling scheme. The characterization is followed by the visual dictionary creation step in which we assess both a random selection and a clustering algorithm for selecting the most important features collected in the first stage. Such features then feed 2-class classifiers for the describable visual attributes of interest which assign to each image a decision score used to obtain its ranking. As the multi-level image characterization involves combining the answers of different levels, we also propose some fusion methods in this regard. For more complex queries (2+ attributes), we use three state-of-the-art approaches for combining the rankings: product of probabilities, rank aggregation and rank position. We also extend upon the rank aggregation method in order to take advantage of complementary information produced by the different characterization schemes. We have considered fifteen attribute classifiers and, consequently, their direct counterparts theoretically allowing 32 768 different combined queries (the actual number is smaller since some attributes are contradictory or mutually exclusive). Experimental results show that the multilevel approach improves retrieval precision for most of the attributes in comparison with other methods. Finally, for combined attributes, the multilevel characterization approach along with the modified rank aggregation scheme boosts the precision performance when compared to other methods such as product of probabilities and rank position / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
108 |
Digitization and Digital Preservation of P.Herc. 817Bischoff, Marissa Anne 14 December 2023 (has links) (PDF)
The large cache of scrolls from Herculaneum were opened to scholars in spite of and because of the destruction of the volcano and damaging unfurling techniques. The fragments inherited have been studied closely by scholars. Digitization and technological work on the Herculaneum papyri, including the important infrared imaging completed by BYU in the early 2000s, and the 3-D imaging and inchoate virtual unwrapping technology by EduceLab, have amplified and aided scholarship on the scrolls and will continue to do so. P.Herc. 817 is a unique Latin text within the collection that has been heavily studied by scholars due to its fascinating subject matter on the Battle of Actium and Cleopatra and its readability. This fragment serves as a case study to demonstrate the value of each set of digital images in transcription and interpretation research, which suggests at the value of the varying digital images for other Herculaneum fragments. I closely compare digital surrogates of P.Herc. 817 including the early 2000s infrared images, 1960's era negatives, and recent 3-D images with the original artifacts as seen at the Biblioteca Nazionale in July 2023. This autopsy of versions of P.Herc. 817 substantiates the need for scholars to use all available digital images in concert with the original papyri when doing scholarly work. It also reinforces the need for digital stewardship and preservation of each distinct image set. Finally, a hypothetical case study is offered to show the loss to scholarship if the digital images and originals were lost and solely secondary sources remained. Each image set offers value and captures a moment in time of the papyri. As technology continues to progress and excitingly unlocks unseen papyri, care needs to be taken to safeguard and digitally preserve the new along with the older data sets.
|
109 |
Inconsciente fotográfico e intersubjetividad digital. Propuesta artística para desacelerar el tiempo y recuperar la miradaFernández Arias, Jorge Luis Osiris 24 March 2022 (has links)
[ES] Con base en los conceptos de Pathosformel, inconsciente fotográfico y e-imagen, y por medio de una
propuesta artística, este proyecto de investigación cuestiona qué efectos ejerce el inconsciente
fotográfico sobre la manera de fotografiar, cómo esto se ha potencializado con las redes sociales y sus
consecuencias o efectos en la construcción de la subjetividad. Al final, se muestra cómo las fotografías
personales en redes sociales están basadas en esquemas predeterminados de representación, por lo que
los usuarios sólo efectúan variaciones inconscientes sobre estructuras predeterminadas de
representación. Así mismo, se reflexiona sobre los efectos de las redes sociales en nuestra sensibilidad
hacia las fotografías. El resultado de la investigación es un cuerpo de obra que parte de la estética
antivisual para proponer estrategias para recuperar la mirada y desacelerar el tiempo. La propuesta
teórica es discutir cómo la e-imagen ha sido el catalizador y propagador de los efectos escópicos del
inconsciente fotográfico. Contra la mirada contagiada y contra la ceguera parcial posterior a la catálisis
escópica, este proyecto de investigación-creación plantea una revisión pormenorizada de la circulación
y transmisión de fotografías en las redes sociales, para terminar con la presentación de un proyecto
personal de producción artística, el cual parte del concepto de antivisualidad y de estrategias artísticas
derivadas del arte contemporáneo post- internet. / [CA] Amb base en els conceptes de *Pathosformel, inconscient fotogràfic i i-imatge, i per mitjà d'una
proposta artística, aquest projecte d'investigació qüestiona quins efectes exerceix l'inconscient
fotogràfic sobre la manera de fotografiar, com això s'ha *potencializado amb les xarxes socials
i les seues conseqüències o efectes en la construcció de la subjectivitat. Al final, es mostra com
les fotografies personals en xarxes socials estan basades en esquemes predeterminats de
representació, per la qual cosa els usuaris només efectuen variacions inconscients sobre
estructures predeterminades de representació. Així mateix, es reflexiona sobre els efectes de
les xarxes socials en la nostra sensibilitat cap a les fotografies. El resultat de la investigació és
un cos d'obra que parteix de l'estètica antivisual per a proposar estratègies per a recuperar la
mirada i desaccelerar el temps. La proposta teòrica és discutir com la i-imatge ha sigut el
catalitzador i propagador dels efectes *escópicos de l'inconscient fotogràfic. Contra la mirada
contagiada i contra la ceguesa parcial posterior a la catàlisi *escópica, aquest projecte
d'investigació-creació planteja una revisió detallada de la circulació i transmissió de fotografies
en les xarxes socials, per a acabar amb la presentació d'un projecte personal de producció
artística, el qual part del concepte d'antivisualitat i d'estratègies artístiques derivades de l'art
contemporani post- internet / [EN] Based on the concepts of Pathosformel, photographic unconscious and e-image, and through
an artistic proposal, this research project questions what effects the photographic unconscious
exerts on the way of photographing, how this has been potentiated with social networks and its
consequences or effects in the construction of subjectivity. In the end, it is shown how personal
photographs in social networks are based on predetermined representation schemes, so that
users only make unconscious variations on predetermined representation structures. Likewise,
it reflects on the effects of social networks on our sensitivity to photographs. The result of the
research is a body of work that starts from anti-visual aesthetics to propose strategies to recover
the gaze and slow downtime. The theoretical proposal is to discuss how the e-image has been
the catalyst and propagator of the scopic effects of the photographic unconscious. Against the
contagious gaze and against partial blindness after scopic catalysis, this research-creation
project proposes a detailed review of the circulation and transmission of photographs on social
networks, to end with the presentation of a personal project of artistic production, which starts
from the concept of anti-visuality and artistic strategies derived from contemporary postinternet art / Fernández Arias, JLO. (2022). Inconsciente fotográfico e intersubjetividad digital. Propuesta artística para desacelerar el tiempo y recuperar la mirada [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/181593
|
110 |
Methods for Text Segmentation from Scene ImagesKumar, Deepak January 2014 (has links) (PDF)
Recognition of text from camera-captured scene/born-digital images help in the development of aids for the blind, unmanned navigation systems and spam filters. However, text in such images is not confined to any page layout, and its location within in the image is random in nature. In addition, motion blur, non-uniform illumination, skew, occlusion and scale-based degradations increase the complexity in locating and recognizing the text in a scene/born-digital image.
Text localization and segmentation techniques are proposed for the born-digital image data set. The proposed OTCYMIST technique won the first place and placed in the third position for its performance on the text segmentation task in ICDAR 2011 and ICDAR 2013 robust reading competitions for born-digital image data set, respectively. Here, Otsu’s binarization and Canny edge detection are separately carried out on the three colour planes of the image. Connected components (CC’s) obtained from the segmented image are pruned based on thresholds applied on their area and aspect ratio. CC’s with sufficient edge pixels are retained. The centroids of the individual CC’s are used as nodes of a graph. A minimum spanning tree is built using these nodes of the graph. Long edges are broken from the minimum spanning tree of the graph. Pairwise height ratio is used to remove likely non-text components. CC’s are grouped based on their proximity in the horizontal direction to generate bounding boxes (BB’s) of text strings. Overlapping BB’s are removed using an overlap area threshold. Non-overlapping and minimally overlapping BB’s are used for text segmentation. These BB’s are split vertically to localize text at the word level.
A word cropped from a document image can easily be recognized using a traditional optical character recognition (OCR) engine. However, recognizing a word, obtained by manually cropping a scene/born-digital image, is not trivial. Existing OCR engines do not handle these kinds of scene word images effectively. Our intention is to first segment the word image and then pass it to the existing OCR engines for recognition. In two aspects, it is advantageous: it avoids building a character classifier from scratch and reduces the word recognition task to a word segmentation task. Here, we propose two bottom-up approaches for the task of word segmentation. These approaches choose different features at the initial stage of segmentation.
Power-law transform (PLT) was applied to the pixels of the gray scale born-digital images to non-linearly modify the histogram. The recognition rate achieved on born-digital word images is 82.9%, which is 20% more than the top performing entry (61.5%) in ICDAR 2011 robust reading competition. In addition, we explored applying PLT to the colour planes such as red, green, blue, intensity and lightness plane by varying the gamma value. We call this technique as Nonlinear enhancement and selection of plane (NESP) for optimal segmentation, which is an improvement over PLT. NESP chooses a particular plane with a proper gamma value based on Fisher discrimination factor. The recognition rate is 72.8% for scene images of ICDAR 2011 robust reading competition, which is 30% higher than the best entry (41.2%). The recognition rate is 81.7% and 65.9% for born-digital and scene images of ICDAR 2013 robust reading competition, respectively, using NESP.
Another technique, midline analysis and propagation of segmentation (MAPS), has also been proposed. Here, the middle row pixels of the gray scale image are first segmented and the statistics of the segmented pixels are used to assign text and non-text labels to the rest of the image pixels using min-cut method. Gaussian model is fitted on the middle row segmented pixels before the assignment of other pixels. In MAPS, we assume the middle row pixels are least affected by any of the degradations. This assumption is validated by the good word recognition rate of 71.7% on ICDAR 2011 robust reading competition for scene images. The recognition rate is 83.8% and 66.0% for born-digital and scene images of ICDAR 2013 robust reading competition, respectively, using MAPS. The best reported results for ICDAR 2003 word images is 61.1% using custom lexicons containing the list of test words. On the other hand, NESP and MAPS achieve 66.2% and 64.5% for ICDAR 2003 word images without using any lexicon. By using similar custom lexicon, the recognition rates for ICDAR 2003 word images go up to 74.9% and 74.2% for NESP and MAPS methods, respectively.
In place of passing an image segmented by a method, manually segmented word image is submitted to an OCR engine for benchmarking maximum possible recognition rate for each database. The recognition rates of the proposed methods and the benchmark results are reported on the seven publicly available word image data sets and compared with these of reported results in the literature.
Since no good Kannada OCR is available, a classifier is designed to recognize Kannada characters and words from Chars74k data set and our own image collection, respectively. Discrete cosine transform (DCT) and block DCT are used as features to train separate classifiers. Kannada words are segmented using the same techniques (MAPS and NESP) and further segmented into groups of components, since a Kannada character may be represented by a single component or a group of components in an image. The recognition rate on Kannada words is reported for different features with and without the use of a lexicon. The obtained recognition performance for Kannada character recognition (11.4%) is three times the best performance (3.5%) reported in the literature.
|
Page generated in 0.0586 seconds