Global ETD Search

41	Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias / Categorization methods for predictor variables in binary regression models Diego Mattozo Bernardes da Silva 13 June 2017 (has links) Modelos de regressão para variáveis resposta binárias são muito comuns em diversas áreas do conhecimento. O modelo mais utilizado nessas situações é o modelo de regressão logística, que assume que o logito da probabilidade de ocorrência de um dos valores da variável resposta é uma função linear das variáveis preditoras. Quando essa suposição não é razoável, algumas possíveis alternativas são: realizar transformação das variáveis preditoras e/ou inserir termos quadráticos ou cúbicos no modelo. O problema dessa abordagem é que ela dificulta bastante a interpretação dos parâmetros do modelo e, em algumas áreas, é fundamental que eles sejam interpretáveis. Assim, uma abordagem muitas vezes utilizada é a categorização das variáveis preditoras quantitativas do modelo. Sendo assim, este trabalho tem como objetivo propor duas novas classes de métodos de categorização de variáveis contínuas em modelos de regressão para variáveis resposta binárias. A primeira classe de métodos é univariada e busca maximizar a associação entre a variável resposta e a covariável categorizada utilizando medidas de associação para variáveis qualitativas. Já a classe de métodos multivariada tenta incorporar a estrutura de dependência entre as covariáveis do modelo através da categorização conjunta de todas as variáveis preditoras. Para avaliar o desempenho, aplicamos as classes de métodos propostas e quatro métodos de categorização existentes em 3 bases de dados relacionadas à área de risco de crédito e a dois cenários de dados simulados. Os resultados nas bases reais sugerem que a classe univariada proposta têm um desempenho superior aos métodos existentes quando comparamos o poder preditivo do modelo de regressão logística. Já os resultados nas bases de dados simuladas sugerem que ambas as classes propostas possuem um desempenho superior aos métodos existentes. Em relação ao desempenho computacional, o método multivariado mostrou-se inferior e o univariado é superior aos métodos existentes. / Regression models for binary response variables are very common in several areas of knowledge. The most used model in these situations is the logistic regression model, which assumes that the logit of the probability of a certain event is a linear function of the predictors variables. When this assumption is not reasonable, it is common to make some changes in the model, such as: transformation of predictor variables and/or add quadratic or cubic terms to the model. The problem with this approach is that it hinders parameter interpretation, and in some areas it is fundamental to interpret the parameters. Thus, a common approach is to categorize the quantitative covariates. This work aims to propose two new classes of categorization methods for continuous variables in binary regression models. The first class of methods is univariate and seeks to maximize the association between the response variable and the categorized covariate using measures of association for qualitative variables. The second class of methods is multivariate and incorporates the predictor variables correlation structure through the joint categorization of all covariates. To evaluate the performance, we applied the proposed methods and four existing categorization methods in 3 credit scoring databases and in two simulated cenarios. The results in the real databases suggest that the proposed univariate class of categorization methods performs better than the existing methods when we compare the predictive power of the logistic regression model. The results in the simulated databases suggest that both proposed classes perform better than the existing methods. Regarding computational performance, the multivariate method is inferior and the univariate method is superior to the existing methods. Categorização de variáveis preditoras Regressão Risco de crédito Categorization of predictor variables Credit scoring Regression
42	A influência da categorização pelo sotaque na discriminação / The influence of categorization by accent on discrimination Souza, Luana Elayne Cunha de 12 September 2014 (has links) Made available in DSpace on 2015-05-14T13:16:31Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 1176317 bytes, checksum: 23bb6112fe0fe9f5c008e95103bb29db (MD5) Previous issue date: 2014-09-12 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work aims to investigate the role played by accent on the relationship between categorization and discrimination and the psychological mechanism underlying this relation. To this end, three main hypotheses were formulated that guide the execution of four empirical studies. In a scenario of decision-making in recruitment and selection for hiring an employee, four studies were conducted in Portugal. We manipulated candidate s accent, which was Portuguese accent or Brazilian immigrant accent. Then, the participants indicated which applicant should be hired (discrimination measure). Study 1 aims to test the hypothesis that the influence of the categorization of a target by his accent (national vs. immigrant) on discrimination is moderated by prejudice. Seventy-two university students participated in this study (Mage = 21.8, SD = 4.27; 34 male and 37 female), they were randomly allocated to one of two conditions (Portuguese accent vs. Brazilian accent) of a between-subjects unifactorial design. The results showed that the influence of categorization of the target by accent on discrimination is moderated by prejudice, b = .51, t (67) = 2.67, p ˂ .05, η2p = .31, and occur only in more prejudiced participants. Study 2 intended to replicate the previous one and test the hypothesis that the previous tested path is mediated by assessment of candidate s accent, because we believe that the assessment of accent triggers a process of perceives the outgroup member s accent as worst. One hundred and twenty-nine university students participated in this study (Mage = 23.7, SD = 4.83; 60 male and 64 female), they were randomly allocated to one of two conditions, Portuguese accent vs. Brazilian accent. The results reinforce the evidence that categorization of a target assessed by his accent triggers discrimination against this target, and also showed that the influence of categorization by accent on discrimination is mediated by individuals perception of the quality of accent (Z = 2.46, p ˂ .05). Study 3 intended to replicate the previous ones by using a within-subject design and test the alternative hypothesis that the influence of targets categorization on discrimination is due to using stereotypical information. One hundred and five university students participated in this study (Mage = 24.1, SD = 4.37; 58 male and 47 female). The results corroborated our predictions that the influence of categorization by accent on discrimination is moderated by prejudice and mediated only by assessment of accent (Z = 1.98, p ˂ .05). Study 4 seeks to test the hypothesis that the mediation occur because the accent s quality assessment acts as a legitimizing factor of discrimination. Subjects were 27 female and 12 male university students (Mage = 20.5, SD = 3.67), randomly allocated to one of two conditions (justification without mentioned accent vs. justification based on candidate s accent) in a unifactorial between-subjects design. The results showed that the participants judge as more legitimate the condition in it was justified based on accent (M = 4.30, SD = 1.31) than in the other condition (M = 3.25, SD = 1.18), t(35) = -2.54, p ˂ .05. In this sense, the results supports our hypothesis that accent can be legitimate as an argument to justify discrimination. Hence, the implications of these results should be considered as the first step to analyze the role of accent on discrimination. / Esta tese teve como objetivo principal investigar o papel desencadeado pelo sotaque na relação entre categorização e discriminação, bem como especificar o mecanismo psicológico que explica este processo. Para tanto, foram formuladas três hipóteses principais que norteiam a execução de quatro estudos empíricos. Em um cenário de tomada de decisão para contratação de um funcionário foram realizados quatro estudos em Portugal. O sotaque do candidato à vaga foi manipulado, podendo ser o sotaque português ou o sotaque de imigrante brasileiro. Os participantes eram solicitados a informar qual candidato deveria ser contratado (medida de discriminação). O Estudo 1 testou a hipótese de que a influência da categorização de um alvo ativada pelo seu sotaque (nacional vs. imigrante) na discriminação é moderada pelo preconceito. Participaram 71 estudantes universitários com idade média de 21,8 anos (DP = 4,27; 34 homens e 37 mulheres), que foram randomicamente alocados em uma de duas condições experimentais (sotaque de imigrante brasileiro vs. sotaque português). Os resultados indicaram que a relação entre a categorização pelo sotaque e a discriminação é moderada pelo preconceito (b = 0,51, t (67) = 2,67, p ˂ 0,05, η2p = 0,31), de modo que apenas em participantes preconceituosos a categorização pelo sotaque leva à discriminação do imigrante brasileiro. O Estudo 2 buscou replicar o estudo anterior e testar a hipótese de que a relação proposta na hipótese 1 é mediada pela avaliação do sotaque do candidato, pois a avaliação do sotaque desencadeia um processo de perceber o sotaque do membro do grupo externo como pior. Contou-se com a participação de 124 estudantes universitários com idade média de 23,7 anos (DP = 4,83; 60 homens e 64 mulheres), aleatoriamente alocados em uma de duas condições, sotaque português vs. sotaque de imigrante brasileiro. Como previsto, os resultados indicaram que o preconceito modera a influência da categorização pelo sotaque na discriminação. Ademais, os resultados suportam a mediação da avaliação do sotaque nesta relação (Z = 2,46, p ˂ 0,05), corroborando a segunda hipótese. O Estudo 3 buscou replicar o estudo anterior, desta vez, com um delineamento dentre participantes, e testar a hipótese alternativa de que a influência da categorização na discriminação é mediada pelo uso da informação estereotípica. Contou-se com a participação de 105 estudantes universitários com idade média de 24,1 anos (DP = 4,37; 48 homens e 47 mulheres). Como previsto, os resultados indicaram que o preconceito modera a influência da categorização pelo sotaque na discriminação e que apenas a avaliação do sotaque medeia esta relação (Z = 1,98, p ˂ 0,05). O Estudo 4 buscou testar a hipótese de que a mediação ocorre porque a avaliação da qualidade do sotaque atua como um fator legitimador da discriminação. Contou-se com a participação de 39 estudantes universitários com idade média de 20,5 anos (DP = 3,67; 12 homens e 27 mulheres), aleatoriamente alocados em uma de duas condições (sem ou com a justificação pelo sotaque), em um design unifatorial entre participantes. Como previsto, os resultados indicaram que os participantes julgaram como mais legítima a condição em que a justificação ocorre pelo sotaque (M = 4,30, DP = 1,31) do que a outra condição (M = 3,25, DP = 1,18), t(35) = -2,54, p ˂ 0,05. Neste sentido, os resultados desse estudo suportam a hipótese de que o sotaque pode ser legítimo como um argumento para justificar a discriminação. Destarte, as implicações destes resultados devem ser consideradas como o primeiro passo para analisar o papel do sotaque na discriminação. Sotaque Categorização Social Preconceito Discriminação Accent Social categorization Prejudice Discrimination CIENCIAS HUMANAS::PSICOLOGIA
43	O livro de travesseiro : questões de autoria, tradução e adaptação / The pillow book : authorship, translation, and adaptation Cunha, Andrei dos Santos January 2016 (has links) OLivro de Travesseiro (Makura no Sôshi), de Sei Shônagon, escrito entre o fim do século X e o início do XI, possui hoje inegável status canônico no contexto da literatura japonesa. Ao mesmo tempo, é o texto japonês mais traduzido do mundo, ocupando lugar estável na lista de títulos que são considerados como pertencentes à Weltliteratur, com uma adaptação cinematográfica (O Livro de Cabeceira, de Peter Greenaway, 1996) e duas versões para o português do Brasil (2008 e 2013). A posteridade tratou as enumerações presentes no texto como tópicos poéticos, ou mesmo, contemporaneamente, como poesia - principalmente em tradução. As listas revelam uma atitude lúdica com relação à linguagem e àquilo que Foucault chamava de "categorias do pensamento" Nesse sentido, o texto de Sei Shônagon pode ser posto em diálogo com o olhar de estranheza em relação à categorização racionalista, que é a premissa de As Palavras e as Coisas (Michel Foucault, 1966) e com a obra de Jorge Luis Borges. A obra de Sei Shônagon mobiliza diversas camadas de conceitos problemáticos ao mesmo tempo. Por outro lado, nenhuma dessas categorias se aplica a O Livro de Travesseiro sem provocar, por sua vez, desestabilizações conceituais. A questão da autoria feminina e de sua relação com a figura do pai e com a cultura do patriarcado reaparece em O Livro de Cabeceira, na trajetória de liberação pela escrita da personagem principal do filme. Essas possíveis leituras dos textos propostos contribuem para a problematização de questões relacionadas à autoria, ao conhecimento, à tradução e à adaptação. / The Pillow Book (Makura no Sõshi) of Sei Shônagon, written between the end of the tenth and the beginning of the eleventh century, has attained undeniable canonical status in the context o f Japanese Literature. lt also is the most translated ]a panes e text in the world, and occupies a stable place in the list of works that are considered as belonging to the realm of Weltliteratur. It has been adapted to the screen outside Japan (The Pillow Book by Peter Greenaway, 1996) and translated twice to Brazilian Portuguese (in 2008 and 2013). Later generations of readers have treated the text's enumerations as catalogues of poetic topics or even, since the beginning of the twentieth century, and especially in translation, as poetry. The lists show a playful approach to language and to what Foucault has called the "categories of thought". In this sense, Sei Shõnagon's reuvre can be read in resonance with Foucault's Les Mots et les Choses (1966) and its attempt to defamiliarize rational categorization, a conceptual device which can also be found in the work ofJorge Luis Borges. Sei Shõnagon's work simultaneously mobilizes severallayers of problematíc concepts. On the other hand, none of these categories applies to lhe Pillow Book without engendering further conceptual destabilization. The issues of female authorship and woman authors' relationships with their fathers in a patriarchal culture reappear in the film, in the main character's journey towards liberation through writing. Those possible readings of the proposed texts contribute to the problematization of issues related to authorship, knowledge, translation and adaptation. Literatura japonesa Orientalismo Categorização Categorization Female authorship Weltliteratur Orientalism Borges, Jorge Luis Foucault, Michel
44	A informatividade da música eletrônica / The informativeness of electronic music Jade Augusto de Macedo Gola Fernandes 08 October 2015 (has links) Essa pesquisa faz um recorte da música eletrônica através de suas linguagens, práticas documentárias e processos informativos, estudados a partir de contextos socioculturais, para observar sua constituição como um gênero musical popular. A informatividade da música eletrônica foi compreendida em seus complexos de relações terminológicas e conjecturas diversas, ilustrando e identificando interrelações, propriedades estéticoformais, categorizações e características discursivas e linguísticas. Conceitos da Ciência da Informação e das humanidades foram utilizados para analisar como esse gênero irresoluto e fragmentado por muitas definições, processos anticategóricos e conflitos de distinção cultural, acaba por definir-se como um campo de intensa materialidade informativa e histórica, que segue tendo na ideia de \"música eletrônica\" seu universo simultaneamente amplo e circunscrito. Objetos, fenômenos, o devir musical, categorias e as linguagens dessa música foram estudados sob os vértices da informatividade, como proposta por Bernd Frohmann, conceito processual que surge a partir da ideia dos documentos como definidores e reveladores de contextos, problemáticas e discursos. Essa pesquisa conclui como a informatividade da música eletrônica logra documentá-la como tal: um gênero musical histórico, institucionalizado e documentado, coeso e problematizado por preponderantes aspectos informativos, referenciais e de categorização - um fenômeno da Cultura e da Informação. / This research outlines electronic music through its languages, documentary practices, informative processes and their sociocultural contexts, to observe its constituion as a popular music genre. The informativenesse of electronic music is seen from its complexes of terminology relations and several conjectures, that illustrate and identify interrelations, aesthetic and formal properties, categorizations, discursive and linguistic characteristics. Concepts from Information Science and other humanities have been used to analyze how this irresolute musical genre, fragmented by anti-categorical and cultural distinction conflits, ends up being defined as a field of intense informative and historical materiality. This music still relies this wide and also circumscribed universe on the idea of \"electronic music\". Objectos, phenomena, the music becoming, categories and languages of this music have been studied under the informativeness theorical vertices, as proposed by Bernd Frohmann, a procedural concept that arises from the ideia of documents as defining elements of contexts, discourses and problems. This research concludes how informativeness manages to document electronic music as such: a historical, institutionalized and documented musical genre, cohesive and also very problematized by its preponderant informative, referential and categorical aspects - a Cultural and Informative phenomenon. Categorização Musical Informatividade Interculturalidade Música e Informação Música Eletrônica Electronic Music Informativeness Interculturality Music and Information Musical Categorization
45	Uma proposta para o gerenciamento ágil de projetos baseada em sua complexidade Ebert, Cassiano 31 January 2009 (has links) Made available in DSpace on 2014-06-12T15:57:19Z (GMT). No. of bitstreams: 2 arquivo3180_1.pdf: 1274624 bytes, checksum: 22a1e73262bf6b16b2d6ecd1c8325d47 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Petróleo Brasileiro S.A. / A área de tecnologia da informação (TI) vem sofrendo transformações em ritmo cada vez mais acelerado nas últimas décadas. Isso pode ser comprovado pela importância que ela tem assumido nas organizações, deixando de ser apenas o antigo setor de centro de processamento de dados para ser um parceiro estratégico das áreas de negócio, contribuindo fortemente para o alcance das metas e resultados corporativos. Desta maneira, a área de tecnologia da informação precisou se estruturar por processos e muitas vezes obter um selo de garantia que atestasse a qualidade dos seus produtos e serviços, selo esse que muitas vezes tem sido representado pela certificação ISO 9001:2000 dos seus sistemas de gestão da qualidade. Além disso, a grande maioria dos produtos e serviços da área são planejados e realizados através da execução de projetos, sejam eles do setor de desenvolvimento de software, infraestrutura ou atendimento de TI. E esses projetos têm, ao longo do tempo, sido conduzidos através de metodologias totalmente baseadas no PMBOK® (PMI, 2004). Contudo, ao utilizar essas metodologias em ambientes certificados ISO 9001:2000 fica difícil gerar resultados rápidos e que agreguem valor para as áreas clientes da TI. Isso se deve a natureza complexa e instável dos projetos dessa área. Baseado neste cenário o presente trabalho busca apresentar uma abordagem que combine os conceitos das metodologias ágeis de gerenciamento de projetos, tais como: Agile Project Management, Agile Project Management Framework e Scrum; com as técnicas e práticas, já consagradas, do PMBOK® (PMI, 2004) de maneira que se obtenha um modelo híbrido de gestão de projetos e que não vá de encontro aos princípios da ISO 9001:2000. Para tanto, também foi necessário criar um modelo de categorização de projetos de TI para determinar sua complexidade e a partir disso identificar quais técnicas e práticas da abordagem devem ser utilizadas em cada projeto. Ao final é conduzido um estudo de caso para avaliar a abordagem proposta Gerenciamento de Projeto de TI ISO 9001:2000 Gerenciamento Ágil de Projetos de TI Categorização de projetos de TI PMBOK®.
46	Mapas auto-organizáveis probabilísticos para categorização de lugares baseada em objetos SILVA JÚNIOR, Marcondes Ricarte da 30 August 2016 (has links) Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-08-31T12:45:41Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação - Marcondes Ricarte - Biblioteca Central.pdf: 3319680 bytes, checksum: 77eec2a6b32ef702f943780f9e487924 (MD5) / Made available in DSpace on 2017-08-31T12:45:41Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Dissertação - Marcondes Ricarte - Biblioteca Central.pdf: 3319680 bytes, checksum: 77eec2a6b32ef702f943780f9e487924 (MD5) Previous issue date: 2016-08-30 / CAPES / Os robôs móveis estão cada vez mais inclusos na sociedade moderna podendo se locomover usando “coordenadas cartográﬁcas”. No entanto, com o intuito de aperfeiçoar a interação homem-robô e a navegação das máquinas nos ambientes, os robôs podem dispor da habilidade de criar um Mapa Semântico realizando Categorização dos Lugares. Este é o nome da área de estudo que busca replicar a habilidade humana de aprender, identiﬁcar e inferir os rótulos conceituais dos lugares através de sensores, em geral, câmeras. Esta pesquisa busca realizar a Categorização de Lugares baseada em objetos existentes no ambiente. Os objetos são importantes descritores de informação para ambientes fechados. Desse modo as imagens podem ser representadas por um vetor de frequência de objetos contidos naquele lugar. No entanto, a quantidade de todos possíveis tipos de objetos existentes é alta e os lugares possuem poucos destes, fazendo com que a representação vetorial de um lugar através de objetos contidos nele seja esparsa. Os métodos propostos por este trabalho possuem duas etapas: Redutor de Dimensionalidade e Categorizador. A primeira se baseia em conceitos de Compressão de Sinais, de Aprendizagem Profunda e Mapas Auto-Organizáveis (SOMs), a ﬁm de realizar o pré-processamento dos dados de frequência de objetos para a redução da dimensionalidade e minimização da esparsidade dos dados. Para segunda etapa foi proposto o uso de múltiplos Mapas Auto-Organizáveis Probabilísticos (PSOMs). Os experimentos foram realizados para os métodos propostos por esse trabalho e comparados com o Filtro Bayesiano, existente na literatura para solução desse problema. Os experimentos foram realizados com quatro diferentes bases de dados que variam em ordem crescente de quantidade de amostras e categorias. As taxas de acerto dos métodos propostos demonstraram ser superiores à literatura quando o número de categorias das bases de dados é alta. Os resultados para o Filtro Bayesiano degeneram para as bases com maiores quantidade de categorias, enquanto para os métodos propostos por essa pesquisa as taxas de acerto caem mais lentamente. / Mobile Robots are currently included in modern society routine in which they may move around often using "cartographic coordinates". However, in order to improve human-robot interaction and navigation of the robots in the environment, they can have the ability to create a Semantic Map by Categorization of Places. The computing area of study that searches to replicate the human ability to learn, identify and infer conceptual labels for places through sensor data, in general, cameras is the Place Categorization. These methods aim to categorize places based on existing objects in the environment which constitute important information descriptors for indoors. Thus, each image can be represented by the frequency of the objects present in a particular place. However, the number of all possible types of objects is high and the places do have few of them, hence, the vector representation of the objects in a place is usually sparse. The methods proposed by this dissertation have two stages: Dimensionality reduction and categorization. The ﬁrst stage relies on Signal Compression concepts, Deep Learning and Self-Organizing Maps (SOMs), aiming at preprocessing the data on object frequencies for dimensionality reduction and minimization of data sparsity. The second stage employs Probabilistic Self-Organizing Maps (PSOMs). The experiments were performed for the two proposed methods and compared with the Bayesian ﬁlter previously proposed in the literature. The experiments were performed with four different databases ranging considering different number of samples and categories. The accuracy of the proposed methods was higher than the previous models when the number of categories of the database is high. The results for the Bayesian ﬁlter tends to degrade with higher number of categories, so do the proposed methods, however, in a slower rate. Categorização de Lugares Redução de Dimensionalidade Aprendizado Profundo Dados Esparsos
47	Algoritmos de seleção de características personalizados por classe para categorização de texto FRAGOSO, Rogério César Peixoto 26 August 2016 (has links) Submitted by Rafael Santana (rafael.silvasantana@ufpe.br) on 2017-08-31T19:39:48Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Rogerio_Fragoso.pdf: 1117500 bytes, checksum: 3e7915ee5c34322de3a8358d59679961 (MD5) / Made available in DSpace on 2017-08-31T19:39:48Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Rogerio_Fragoso.pdf: 1117500 bytes, checksum: 3e7915ee5c34322de3a8358d59679961 (MD5) Previous issue date: 2016-08-26 / A categorização de textos é uma importante ferramenta para organização e recuperação de informações em documentos digitais. Uma abordagem comum é representar cada palavra como uma característica. Entretanto, a maior parte das características em um documento textual são irrelevantes para sua categorização. Assim, a redução de dimensionalidade é um passo fundamental para melhorar o desempenho de classificação e reduzir o alto custo computacional inerente a problemas de alta dimensionalidade, como é o caso da categorização de textos. A estratégia mais utilizada para redução de dimensionalidade em categorização de textos passa por métodos de seleção de características baseados em filtragem. Métodos deste tipo exigem um esforço para configurar o tamanho do vetor final de características. Este trabalho propõe métodos de filtragem com o intuito melhorar o desempenho de classificação em comparação com os métodos atuais e de tornar possível a automatização da escolha do tamanho do vetor final de características. O primeiro método proposto, chamado Category-dependent Maximum f Features per Document-Reduced (cMFDR), define um limiar para cada categoria para determinar quais documentos serão considerados no processo de seleção de características. O método utiliza um parâmetro para definir quantas características são selecionadas por documento. Esta abordagem apresenta algumas vantagens, como a simplificação do processo de escolha do subconjunto mais efetivo através de uma drástica redução da quantidade de possíveis configurações. O segundo método proposto, Automatic Feature Subsets Analyzer (AFSA), introduz um procedimento para determinar, de maneira guiada por dados, o melhor subconjunto de características dentre um número de subconjuntos gerados. Este método utiliza o mesmo parâmetro usado por cMFDR para definir a quantidade de características no vetor final. Isto permite que a busca pelo melhor subconjunto tenha um baixo custo computacional. O desempenho dos métodos propostos foram avaliados nas bases de dados WebKB, Reuters, 20 Newsgroup e TDT2, utilizando as funções de avaliação de características Bi-Normal Separation, Class Discriminating Measure e Chi-Squared Statistics. Os resultados dos experimentos demonstraram uma maior efetividade dos métodos propostos em relação aos métodos do estado da arte. / Text categorization is an important technic to organize and retrieve information from digital documents. A common approach is to represent each word as a feature. However most of the features in a textual document is irrelevant to its categorization. Thus, dimensionality reduction is a fundamental step to improve classification performance and diminish the high computational cost inherent to high dimensional problems, such as text categorization. The most commonly adopted strategy for dimensionality reduction in text categorization undergoes feature selection methods based on filtering. This kind of method requires an effort to configure the size of the final feature vector. This work proposes filtering methods aiming to improve categorization performence comparing to state-of-the-art methods and to provide a possibility of automitic determination of the size of the final feature set. The first proposed method, namely Category-dependent Maximum f Features per Document-Reduced (cMFDR), sets a threshold for each category that determines which documents are considered in feature selection process. The method uses a parameter to arbitrate how many features are selected per document. This approach presents some advantages, such as simplifying the process of choosing the most effective subset through a strong reduction of the number of possible configurations. The second proposed method, Automatic Feature Subsets Analyzer (AFSA), presents a procedure to determine, in a data driven way, the most effective subset among a number of generated subsets. This method uses the same parameter used by cMFDR to define the size of the final feature vector. This fact leads to lower computational costs to find the most effective set. The performance of the proposed methods was assessed in WebKB, Reuters, 20 Newsgroup and TDT2 datasets, using Bi-Normal Separation, Class Discriminating Measure and Chi-Squared Statistics feature evaluations functions. The experimental results demonstrates that the proposed methods are more effective than state-of-art methods.
48	Um estudo sobre categorização de mídias através do método de Latent Dirichlet Allocatio / A study on media categorization using the latent Dirichlet allocation method Costa, Glauber de Oliveira 07 December 2010 (has links) Orientador: Siome Klein Goldenstein / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-17T03:15:16Z (GMT). No. of bitstreams: 1 Costa_GlauberdeOliveira_M.pdf: 17659239 bytes, checksum: 5e50f48bdc78f7e7a59d4904e9e05b76 (MD5) Previous issue date: 2010 / Resumo: Com o crescimento das bases de imagem digitais, motivado principalmente pela popularização da World Wide Web, bem como a massificação de dispositivos de captura digital de imagens, o processamento e extração de informações semânticas destas imagens cresce em importância. A informação encerrada nestas imagens não tem significado semântico imediato, sendo necessário o uso de técnicas para capturá-la. A abordagem trivial, que envolve a anotação das imagens por humanos se torna falha à medida que o tamanho das bases cresce, sendo necessário voltar-se para métodos mais sofisticados. Esta dissertação estudou a aplicação do método Latent Dirichlet Allocation em bases de imagens digitais, verificando a performance do algoritmo utilizando quatro métodos distintos de criação de dicionários visuais. Este trabalho mostrou que a combinação de diferentes descritores capturando aspectos distintos das imagens, para a construção de classificadores pelo método Latent Dirichlet Allocation é capaz de obter taxas de acerto médias na faixa de 90%, ainda que cada classificador individualmente não tenha desempenho muito superior à chance. Ainda, os experimentos realizados demonstraram que a influência do tamanho do dicionário e número de tópicos não é significativa, sendo possível construir classificadores com poucos tópicos latentes a partir de poucas palavras visuais, e portanto, eficientes. / Abstract: With the growth of digital image databases, mainly motivated by the spread of the World Wide Web and digital capture devices, processing and extraction of semantic information from these images gain importance. The information contained within these images have no immediate semantic meaning and techniques must be used in order to acquire it. The trivial approach, which involves the manual annotation of the images by humans, becomes flawed as the size of the database grows. Using a more sophisticated method is needed. This work studied applications of the Latent Dirichlet Allocation method for digital image databases, verifying the algorithm's performance using four different methods of codewords dictionary generation. It shows that a combination of different descriptors capturing different aspects of the images, aiming at the construction of Latent Dirichlet Allocation -based classifiers, is capable of achieving hit ratios around 90%, even if each of the individual classifiers isn't largely superior to chance. Yet, experiments performed during this work demonstrated that the influence of the codewords dictionary size and the number of topics in the model are not significant, making the construction of small-sized, and thus, efficient classifiers possible. / Mestrado / Visão Computacional / Mestre em Ciência da Computação Categorização de imagens Visão por computador Recuperação da informação Image categorization Computer vision Information retrieval
49	O percurso sócio-cognitivo das recategorizações metafóricas = construção de sentidos na retórica neopentecostal / The path of socio-cognitive metaphorical recategorizações : senses construction in rhetoric neopentecostal Martins, Erik Fernando Miletta, 1983- 18 August 2018 (has links) Orientador: Edwiges Maria Morato / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-18T10:14:13Z (GMT). No. of bitstreams: 1 Martins_ErikFernandoMiletta_M.pdf: 1976999 bytes, checksum: eec222570fa78f608ec82e2dff6cae3d (MD5) Previous issue date: 2011 / Resumo: As igrejas neopentecostais brasileiras adquiriram, nos últimos anos, grande relevância e notoriedade no quadro religioso nacional. Dentre as diversas hipóteses aventadas no campo das Ciências Sociais para a explicação deste fenômeno, destacam-se, para esta dissertação de mestrado em Linguística: i-) a constituição de um campo simbólico no qual a ética neoliberal de consumo não só ganha legitimidade religiosa como é estimulada ii-) a capacidade de exploração simbólica, por parte de seus líderes, dos problemas cotidianos enfrentados por boa parte da população urbana brasileira. Em face destas hipóteses, protagonizadas pela língua, uma das motivações para o desenvolvimento do presente texto está no fato de que não há, até o momento, estudos detalhados sobre o papel das práticas linguísticas de construção de sentidos próprios a este campo. Por essa razão, nossa investigação tem por objetivo principal delimitar a função e explicar a emergência de mecanismos textuais de construção referencial, as recategorizações metafóricas, no contexto da retórica neopentecostal. Justifica-se a escolha das recategorizações metafóricas através da hipótese de que é este um mecanismo muito eficiente para o ato suasório, possibilitando o emprego de metáforas bíblicas na maneira de compreender as causas, e possíveis soluções, para as adversidades impostas por um cotidiano neoliberal. Tendo em mente estas considerações, a inscrição teórico-metodológica aqui adotada é de crivo sócio-cognitivo, cujo postulado básico refere-se à indissociabilidade entre sociedade e cognição, e de inclinação textual-interativa, cuja premissa básica fundamenta-se em torno de uma relação não especular entre língua e mundo, ensejando um modelo social de cognição na qual o papel da linguagem não é meramente representativo, mas constitutivo. Neste quadro, o corpus analisado é constituído por dez cultos de duas igrejas neopentecostais, sendo cinco da Igreja Universal do Reino de Deus (IURD) e cinco da Igreja Internacional da Graça de Deus (IIGD). Para a interpretação dos dados extraídos deste corpus, as recategorizações metafóricas são primeiramente discutidas no contexto religioso da enunciação - relativo, sobretudo, à abordagem dos temas de cada culto - e, em seguida, interpretadas à luz do contexto social mais amplo de composição do neopentecostalismo. Com isso, busca-se mostrar que as recategorizações metafóricas são fundamentais à constituição conceptual dos eixos argumentativos da retórica neopentecostal, aqui tratados sob a forma de "nichos metafóricos", um conjunto de proposições metafóricas superordenadas que permitem estabelecer com maior precisão o direcionamento da argumentação. Por fim, busca-se mostrar que sua singularidade, enquanto uma forma específica de construção de sentidos, permite uma rediscussão de conceitos fundamentais à análise textual-interativa / Abstract: Brazilian neopentecostal churches acquired, over the last years, great relevance and notoriety in the national religious board. Among the various hypotheses suggested in the field of Social Sciences to explain this phenomenon, it will be highlighted for this master's in Linguistics dissertation: i-) the constitution of the symbolic field in which a neoliberal ethics of consumption is not only legitimated but also stimulated; ii-) the capacity of symbolic exploitation, by its leaders, of the quotidian problems faced by most part of the urban Brazilian population. In the face of these hypotheses, where language is the protagonist, one of the motivations for the development of this text lies in the fact that, until now, there is no detailed study on the role of linguistic practices in the construction of the attached senses of their proper symbolic field. For this reason, our investigation has as its main objective to delimitate the function and explain the emergence of textual mechanisms of referential construction, the metaphorical recategorizations, on the context of neopentecostal rhetoric. This choice is justified over the hypothesis that this mechanism is very efficient in the persuasive act, making possible the use of biblical metaphors on the comprehension of the causes, and some possible solutions, to the adversities imposed by a neoliberal quotidian. Keeping these considerations in mind, the theoretical and methodological inscription here adopted is social-cognitive, of which the basic postulate refers to the inseparability between society and cognition, and has textual-interactive inclination, of which the basic premise is founded around a non specular relation between language and the world, giving rise to a social model of cognition in which the role of language is not merely representative, but constitutive. In this frame, the analyzed corpus is composed by ten neopentecostal churches cults: five from the The Universal Church and other five from the International Church of God's Grace. To interpret the data extracted from this corpus, the metaphorical recategorizations are firstly discussed in the religious context of the enunciation - relative, mainly, to the themes' approach in each cult - and, then, interpreted on the light of the larger social context of composition of the neopentecostalism. With that, it is showed that these mechanisms are fundamental to the constitution of the neopentecostal rethoric argumentative axis, here treated under the form of "metaphorical niches", a set of metaphorical superordenated propositions under which is possible to establish with greater precision the argumentative orientation. Finally, it is showed that the metaphorical recategorizations singularity, as a specific form of senses construction, allows a rediscussion over fundamental concepts to the textual-interactive analysis as a whole / Mestrado / Linguistica / Meste em Linguística Referencias Categorização (Linguística) Metáfora Sociocognitivismo Igrejas pentecostais Referencing Categorization (Linguistics) Metaphor Sociocognitivism Pentecostal churches
50	Construção coletiva da identidade no setor de coleta seletiva de resíduos sólidos de equipamentos elétricos e eletrônicos: uma análise a partir do processo de categorização Braga, Ana Carolina Simões 27 October 2015 (has links) Submitted by Aline Amarante (1146629@mackenzie.br) on 2017-03-30T00:48:26Z No. of bitstreams: 2 Ana Carolina Simões Braga.pdf: 2578114 bytes, checksum: 6849e690dc8c413b911737ca8dc901bf (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Paola Damato (repositorio@mackenzie.br) on 2017-03-31T13:58:39Z (GMT) No. of bitstreams: 2 Ana Carolina Simões Braga.pdf: 2578114 bytes, checksum: 6849e690dc8c413b911737ca8dc901bf (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-03-31T13:58:40Z (GMT). No. of bitstreams: 2 Ana Carolina Simões Braga.pdf: 2578114 bytes, checksum: 6849e690dc8c413b911737ca8dc901bf (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2015-10-27 / This study aimed to describe the evolutive process of the identity in the organizational level from the categorization of the elements of the symbolic and formal order defined by the organizational members and external agents of the audience of the a cooperatives of the selective collection of the waste of electronics and electrical equipment. To obtain this objective, were reviewed the concepts: identity in the organizational level, audience, actors of the reverse chain and categorization. For the concepts identity in the organizational level and categorization, there was a preoccupation of the adequacy to the perspective of the processes. Anchored in these concepts, was developed a conceptual model, and, consequently, the operational that served, at first, as a guide for the development of case study Coopermiti, which tissue in narrative form made it possible to describe in chronological order the process of the collective construction of the Coopermiti identity, over time, constituted by events and their promoters. The data are longitudinal, encompassing a period of the gathering primary data of the 29 (twenty nine) months, starting in November 2012 and ending in April 2015. Were realized in total 11 (eleven) interviews between organizational members and external agents of the audience of the Coopermiti, being complemented with information arising from the non-participatory observation and secondary data. As a result, were observed the roles performed, either by organizational members, either by external agents, in the process of the inclusion, exclusion and alteration of the elements of the formal and symbolic order components of the identity in the organizational level, along the construction process. The period which comprise since the your birth at the end 2008 until the present time identified a evolution in the identity of Coopermiti, presenting a sequence of the seven identities over time, showing that, although its purpose of being remains the same, the identity of past and of present differ gradually, as was the inclusion, exclusion and alteration of the elements of the formal and symbolic order that constitute it. As theoretical contribution, highlights that adopt a process approach allows to view the identity in an evolutive perspective; as the empirical contribution, found that Coopermiti is a success story in Brazil of the cooperatives of selective collection of solid waste, were identified elements that prove its evolution and organizational development and the co-participation of organizational members and external agents of the audience for obtaining the social legitimacy. / Teve-se como objetivo central, neste estudo, descrever o processo evolutivo da identidade no nível organizacional a partir da categorização dos elementos de ordem simbólica e formal definidos pelos membros organizacionais e agentes externos da audiência de uma cooperativa de coleta seletiva de resíduos de equipamentos elétricos e eletrônicos. Para auferir esse objetivo, foram revisados os conceitos identidade no nível organizacional, audiência, atores da cadeia reversa e categorização. Para os conceitos identidade no nível organizacional e categorização, houve uma preocupação de adequação à perspectiva de processos. Ancorado nesses conceitos, foi desenvolvido um modelo conceitual e, consequentemente, o operacional servindo, a princípio, como um guia para o desenvolvimento do estudo de caso Coopermiti, o qual tecido em forma de narrativa possibilitou descrever em ordem cronológica o processo de construção coletiva da identidade da Coopermiti, ao longo do tempo, constituída por eventos e seus promotores. Os dados são longitudinais, abrangendo um período de coleta de dados primários de 29 (vinte e nove) meses, iniciando em novembro de 2012 e finalizando em abril de 2015. Foram realizadas no total 11 (onze) entrevistas entre membros organizacionais e agentes externos da audiência da Coopermiti, sendo complementadas com informações advindas da observação não participativa e dados secundários. Como resultado, observaram-se os papéis exercidos, ora pelos membros organizacionais, ora pelos agentes externos, no processo de inclusão, exclusão e alteração de elementos de ordem formal e simbólica componentes da identidade no nível organizacional, ao longo do processo de construção. O período que compreende desde o seu nascimento no final de 2008 até o momento atual identificou uma evolução na identidade da Coopermiti, apresentando uma sequência de sete identidades ao longo tempo, evidenciando que, embora o seu propósito de ser permaneça o mesmo, a identidade do passado e do presente se diferem gradativamente, conforme houve a inclusão, exclusão e alteração de elementos de ordem formal e simbólica que a constituem. Como contribuição teórica, destaca-se que adotar a abordagem de processos permite visualizar a identidade em uma perspectiva evolutiva; quanto à contribuição empírica, constatou que a Coopermiti é um caso de sucesso no Brasil de cooperativas de coleta seletiva de resíduos sólidos, visto que foram identificados elementos que comprovam sua evolução e desenvolvimento organizacional e que a coparticipação dos membros organizacionais e agentes externos da audiência direcionam para a obtenção da legitimidade social. audiência identidade no nível organizacional categorização abordagem de processos

Search results