Global ETD Search

1	Gênero carta-corrente digital: estudo dos aspectos formais e funcionais / Digital chain-letter as a genre: a study about formal and functional values Almeida, Larissa Pereira de January 2007 (has links) ALMEIDA, Larissa Pereira de. Gênero carta-corrente digital: estudo dos aspectos formais e funcionais. 2007. 157f. – Dissertação (Mestrado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2007. / Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2014-08-20T12:35:48Z No. of bitstreams: 1 2007_dis_lpalmeida.pdf: 1310914 bytes, checksum: 5fa1aef5aa1db67d2c5ba2a73aa04430 (MD5) / Approved for entry into archive by Márcia Araújo(marcia_m_bezerra@yahoo.com.br) on 2014-08-20T16:36:45Z (GMT) No. of bitstreams: 1 2007_dis_lpalmeida.pdf: 1310914 bytes, checksum: 5fa1aef5aa1db67d2c5ba2a73aa04430 (MD5) / Made available in DSpace on 2014-08-20T16:36:45Z (GMT). No. of bitstreams: 1 2007_dis_lpalmeida.pdf: 1310914 bytes, checksum: 5fa1aef5aa1db67d2c5ba2a73aa04430 (MD5) Previous issue date: 2007 / This research analyzes the digital chain letters through the sociorethoric perspective of gender, that consider speech gender as an interaction process between people and places where it is in. The approach of textual gender discourse is based on propositions of Bakhtin (1981, 1997), Swales (1990, 1992) and Bhatia (1993, 2004). The corpus is composed of 36 digital chain letters copies. The methodology procedure is based on Bhatia (1993) and allowed us to identify digital chain letters by others genders that are in the web. The main purpose is to analyze the formal and functional aspects of digital chain letters and the specific objectives are: to analyze digital chain letters specifics purposes; to identify the standardized form characteristics; to analyze the standardized functional characteristics in the samples. The characteristics analyzed showed the essence of digital medium inside the texts. Evidenced, either, a standardized constitution of linguistics and functional aspects, that are connected to their specific purposes and have digital evidence inside constitution and text. / Enviadas por e-mail a diversos destinatários, as cartas-corrente surgem cada vez mais freqüentes nos correios eletrônicos. Este trabalho de pesquisa analisa as cartas-corrente digitais por meio de uma orientação sócio-retórica de gêneros e possui fundamentação teórica composta pelos postulados de Bakhtin (1981, 1997), passando por concepções atuais de Swales (1990, 1992) e Bhatia (1993, 2004). A pesquisa nos permitiu alcançar os objetivos específicos de identificação das cartas-corrente e diferenciação dos outros gêneros que circulam por e-mail, analisar seus propósitos comunicativos específicos e identificar as regularidades formais e funcionais encontradas nos exemplares. Observamos que nas cartas-corrente digitais, assim como em outros gêneros, os aspectos formais e funcionais estão intimamente ligados e que as tornam diferentes entre si é o uso dos recursos lingüísticos e de apresentação da ordem de idéias, que estão ligados ao tema apresentado e ao conhecimento institucional do ambiente de replicação. A análise nos permitiu identificar as regularidades da carta-corrente digital e alguns aspectos que são específicas do próprio gênero não apenas por se tratar de uma mensagem que circula por e-mail, mas por levar em consideração as peculiaridades desse meio, as estratégias de escrita e a abordagem de assuntos que configuram como específicos. Digital Chaion-letters Specifics Purposes Mensagens eletrônicas – Lexicografia Mensagens eletrônicas não solicitadas Narrativa (Retórica) Exposição (Retórica)
2	A inter-relação entre a metafunção composicional e o dispositivo argumentativo na construção da persuasão em e-mails promocionais / The relation between argumetative device and composition metafunction in the persuasion construction of the promotional e-mail Caldas, Maria Cilânia de Sousa January 2014 (has links) CALDAS, Maria Cilânia de Sousa. A inter-relação entre a metafunção composicional e o dispositivo argumentativo na construção da persuasão em e-mails promocionais. 2014. 171f. – Dissertação (Mestrado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2014. / Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2015-02-20T13:52:11Z No. of bitstreams: 1 2014_dis_mcscaldas.pdf: 5866189 bytes, checksum: 621a3d232ce4b7ade0bf7c95081f5db8 (MD5) / Approved for entry into archive by Márcia Araújo(marcia_m_bezerra@yahoo.com.br) on 2015-02-20T13:57:05Z (GMT) No. of bitstreams: 1 2014_dis_mcscaldas.pdf: 5866189 bytes, checksum: 621a3d232ce4b7ade0bf7c95081f5db8 (MD5) / Made available in DSpace on 2015-02-20T13:57:05Z (GMT). No. of bitstreams: 1 2014_dis_mcscaldas.pdf: 5866189 bytes, checksum: 621a3d232ce4b7ade0bf7c95081f5db8 (MD5) Previous issue date: 2014 / This research examines the relation between verbal and nonverbal language in the persuasion construction of the promotional e-mail. To verify this link between verbal and nonverbal texts, we used two theories that conceive the act of language as a reflex of the social and cultural practices of a collectiveness subjects, in particular communication situation: multimodality (KRESS; VAN LEEUWEN, 2006) and semiolinguistics (CHARAUDEAU, 2008). In the development research, we realized the following process: a) analysis of argumentative device (proposal, proposition and persuasion) in the verbal and visual persuasion construction of the promotional e-mail; b) verification of casual overlap of the elements that configure the argumentative device; c) analysis of the meaning of composition (given/new, ideal/real), salience and framing to verify how the promotional genre provides techniques to persuade the reader/probable consumer. For the analysis of the study subject, we chose a 30 e-mails sample of the Peixe Urbano collective shopping site, directly collected in inbox emails, between 2013 July and 2014 July. In the survey results, we established that showed elements are used to persuade the reader/probable consumer and that argumentative device (CHARAUDEAU, 2008) is recurring in all analyzed sample. We verified that proposal, proposition and persuasion are recurrent in all promotional e-mails analyzed. In addition, we observed that the composition of argumentative device is most frequent in verbal language, and that relation between verbal and nonverbal language contribute to demonstrate systematic overlaps between the elements in the promotional e-mail structure. About the composition meaning, we noticed that ideal/real information values predominate in the entire sample, in the sense of the ideal, that manage “promise”, and the real that manage the product itself join greater persuasive appeal. In relation to salience, we realized image is the most evident item to persuade the reader. In its turn, framing shows connection or disconnection between the elements, be it through empty spaces or successive colours and forms between them. In brief, results indicate an inseparable relation verbal/nonverbal language in the promotional e-mail structure, because, joined, they develop meaning effects that usher reader to the persuasion. / Esta pesquisa analisa a inter-relação entre a linguagem verbal e a linguagem não verbal na construção da persuasão nos e-mails promocionais. Para verificar essa junção entre os textos verbal e visual, fizemos uso de duas teorias que concebem o ato de linguagem como um reflexo das práticas culturais e sociais dos sujeitos de uma coletividade, em determinada situação de comunicação: a multimodalidade (KRESS; VAN LEEUWEN, 2006) e a semiolinguística (PATRICK CHARAUDEAU, 2008). No desenvolvimento da pesquisa, realizamos o seguinte processo: a) análise do dispositivo argumentativo (proposta, proposição e persuasão) na linguagem verbal e visual, na construção da persuasão dos e-mails promocionais: b) verificação da ocasional sobreposição dos elementos que configuram o dispositivo argumentativo: c) análise do significado composicional (dado/novo, ideal/real), saliência e framing, no sentido de verificar como o gênero promocional estabelece técnicas para persuadir o leitor/provável consumidor. Para a análise do objeto de estudo, selecionamos uma amostra de 30 e-mails promocionais do site de compra coletiva Peixe Urbano, coletados diretamente na caixa de entrada de e-mails, entre os meses de julho de 2013 e julho de 2014. Na verificação dos resultados, constatou-se que os elementos colocados em cena têm o objetivo de persuadir o leitor/provável consumidor e que o dispositivo argumentativo (CHARAUDEAU, 2008) é recorrente em toda a amostra analisada. Verificamos que a proposta, proposição e persuasão são recorrentes em todos os e-mails promocionais que analisamos. Além disso, observamos que a composição do dispositivo argumentativo ocorre com mais evidência na linguagem verbal, e que a inter-relação entre as duas linguagens contribui para atestar sistemáticas sobreposições entre os elementos na estrutura do e-mail promocional. Sobre o significado composicional, notamos que os valores informacionais ideal/real são predominantes em toda a amostra, no sentido de que o ideal, que veicula a “promessa”, e o real, que conduz ao produto em si, agregam maior apelo persuasivo. Em relação à saliência, percebemos que a imagem é o item mais evidente na condução do leitor à persuasão. O framing, por sua vez, evidencia a conexão ou desconexão entre os elementos, seja pelos espaços vazios ou repetição de cores e formas. Em suma, os dados sinalizam que a inter-relação entre a linguagem verbal e não verbal é indissociável na estrutura do e-mail promocional, porque, juntas, elas desenvolvem efeitos de sentido que conduzem o leitor à persuasão. Persuasion Semiolinguistics Mensagens eletrônicas Anúncios pela Internet Modalidade (Linguística)
3	A personalização em e-mails promocionais Andrade, Richarson Lobo de January 2008 (has links) ANDRADE, Richarson Lobo de. A personalização em e-mails promocionais. 2008. 104f. – Dissertação (Mestrado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2008. / Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2014-08-20T15:00:18Z No. of bitstreams: 1 2008_dis_rlandrade.pdf: 873853 bytes, checksum: 68cce29c3ff2e4182990cb3b275c38f5 (MD5) / Approved for entry into archive by Márcia Araújo(marcia_m_bezerra@yahoo.com.br) on 2014-08-20T17:15:05Z (GMT) No. of bitstreams: 1 2008_dis_rlandrade.pdf: 873853 bytes, checksum: 68cce29c3ff2e4182990cb3b275c38f5 (MD5) / Made available in DSpace on 2014-08-20T17:15:05Z (GMT). No. of bitstreams: 1 2008_dis_rlandrade.pdf: 873853 bytes, checksum: 68cce29c3ff2e4182990cb3b275c38f5 (MD5) Previous issue date: 2008 / The present study has as a goal, taking as the basis the Politeness Theory, developed by Brown and Levinson (1987), to show how certain strategies of politeness can contribute to personalize the reader/client of promotional e-mails. We analyze some positive politeness strategies, used by opt-in promotional e-mails, that is, the ones sent with the addressee’s permission, and opt-out, that is, the ones sent with no permission. From the presuppose that the politeness strategies, essential in the face-to-face interaction, are used with the objective of client’s personalization. The methodology used is from interpretative and qualitative basis, in that the object of this study is focused through observation and data analysis. The corpus is formed of 30 promotional e-mails (15 opt-in and 15 opt-out). We observed that the major part shoed the politeness strategies, presenting that way, personalization’s mechanisms; differently from the opt-out e-mails, which show few or no personalization’s strategy. The research is situated, then, in a interdisciplinary perspective between Interactional Sociolinguistics and Marketing, contributing for a reflexion about the various strategies used in the publicitary language, a phenomenon so actualt in our lives / O presente trabalho tem como objetivo, tomando por base a Teoria da Polidez, desenvolvida por Brown e Levinson (1987), mostrar como certas estratégias de polidez podem contribuir para personalizar o leitor/cliente de e-mails promocionais. Analisam-se algumas estratégias de polidez positiva, utilizadas em e-mails promocionais opt-in, ou seja, aqueles enviados com consentimento do destinatário, e opt-out, ou seja, aqueles enviados sem consentimento do destinatário. Parte-se do pressuposto, que as estratégias de polidez, essenciais na interação face-a-face, são utilizadas com o objetivo de personalização do cliente. A metodologia empregada é de base interpretativa e qualitativa, em que o objeto de estudo é focalizado através de observações e de análises de dados. O corpus analisado constitui-se 30 e-mails promocionais (sendo 15 do tipo opt-in e 15 do tipo opt-out). Constatou-se que a maioria dos e-mails opt-in apresentou as estratégias de polidez, demonstrando, assim, mecanismos de personalização; diferentemente dos e-mails opt-out, que apresentaram poucas ou nenhuma estratégia de personalização. A pesquisa situa-se, portanto, numa perspectiva interdisciplinar entre a sociolingüística interacional e o marketing, contribuindo para uma reflexão sobre as várias estratégias utilizadas na linguagem publicitária, fenômeno tão presente em nossa vida. Politeness Theory Publicitary Language Análise do Discurso Mensagens Eletrônicas Análise da Conversação Atos de Fala (Lingüística)
4	A organização lingüística do espaço nos e-mails pessoais: um estudo da dêixis espacial / The linguistic organization of space in the personal e-mails: a study of spatial deixis. Oliveira, Elaine Lima de January 2009 (has links) OLIVEIRA, Elaine Lima de. A organização lingüística do espaço nos e-mails pessoais: um estudo da dêixis espacial. 2009. 183f. Dissertação (Mestrado em Linguística) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-Graduação em Linguística, Fortaleza-CE, 2009. / Submitted by nazareno mesquita (nazagon36@yahoo.com.br) on 2012-07-09T15:28:34Z No. of bitstreams: 1 2009_diss_ELOliveira.pdf: 1088729 bytes, checksum: 7298f10db72047b313ed72516e99c5f6 (MD5) / Approved for entry into archive by Maria Josineide Góis(josineide@ufc.br) on 2012-08-03T16:31:57Z (GMT) No. of bitstreams: 1 2009_diss_ELOliveira.pdf: 1088729 bytes, checksum: 7298f10db72047b313ed72516e99c5f6 (MD5) / Made available in DSpace on 2012-08-03T16:31:57Z (GMT). No. of bitstreams: 1 2009_diss_ELOliveira.pdf: 1088729 bytes, checksum: 7298f10db72047b313ed72516e99c5f6 (MD5) Previous issue date: 2009 / This research focuses on spatial deixis in personal emails. Our aim is to find out where to point the deictic spatial coordinates, and investigate how these coordinates are constructed in discourse and seek to draw a profile of these coordinates as a function of spatial distance of the interlocutors. To address the phenomenon under study, we focus our research on three pillars: the study of referral, which includes the study of spatial deixis we refer to us, especially the work of Dubois and Mondada (2003), Lyons (1977) Levinson (2007 ), the phenomenon of the construction of referring expressions, we consider very pertinent studies of Ariel (1996, 1998 and 2001) and his theory of accessibility, the semantics of space, we make use of the observations of Lyons (1977) and Saeed (2003) . With the theoretical completed, we analyzed 80 personal emails, 40 interactions and their interviews. The interviews helped to know a little more about the production situation of the messages and also helped to separate the messages into two major groups depending on the spatial distance is established between the interlocutors. Separate groups, marked the deictic and studied the conditions of production and semantics of deictic spaces, we come to several considerations, among which we point out the following: speakers who have significant spatial distance feel a greater need to address the space and it is located, factors diverse nature justifying the emergence of such coordinates in discourse, spaces are mainly metaphorical sense of time and now that point to a type of e-mail; speakers who present a short space feel little need to depict the space, the space depicted, in general, will be shared soon, so the more detail of such marks, the criterion morphosyntactic and first mention of justifying the provision of the coordinates in this block, the spaces have metaphorical idea of time, but point to a later. / Esta pesquisa foca a dêixis espacial nos e-mails pessoais. Nosso intuito é descobrir para onde apontam as coordenadas dêiticas espaciais, bem como investigar como são construídas tais coordenadas no discurso e buscar traçar um perfil dessas coordenadas em função da distância espacial dos interlocutores. Para contemplar o fenômeno em estudo, centramos nossa investigação em três pilares: o estudo da referenciação, que inclui o estudo da dêixis espacial, reportamo-nos, principalmente, aos trabalhos de Mondada e Dubois (2003), Lyons (1977) Levinson (2007); o fenômeno da construção das expressões referenciais, consideramos bastante pertinente os estudos de Ariel (1996, 1998 e 2001) e sua Teoria da Acessibilidade; a semântica dos espaços, valemo-nos das observações de Lyons (1977) e Saeed (2003). Com o referencial teórico concluído, analisamos 80 e-mails pessoais, 40 interações e suas respectivas entrevistas. As entrevistas ajudaram a conhecer um pouco mais da situação de produção das mensagens e também ajudaram a separar as mensagens em dois grandes blocos em função da distância espacial estabelecida entre os interlocutores. Separados os grupos, marcados os dêiticos e estudadas as condições de produção e a semântica dos espaços dêiticos, chegamos a várias considerações, dentre elas apontamos as seguintes: interlocutores que apresentam significativa distância espacial sentem maior necessidade de tratar do espaço e nele se situar, fatores de naturezas diversas justificam o surgimento de tais coordenadas no discurso, espaços metaforizados apresentam principalmente a noção de tempo e apontam para um agora nesse tipo de e-mail; interlocutores que apresentam uma curta distância espacial sentem pouca necessidade de retratarem o espaço, os espaços retratados, em geral, serão compartilhados em breve, por isso, o maior detalhamento de tais marcas, o critério morfossintático e os de primeira menção justificam a disposição das coordenadas neste bloco, os espaços metaforizados apresentam idéia de tempo, mas apontam para um depois. Teoria e Analise Linguistica Referenciação Dêixis e-mail Mensagens Eletrônicas Língua portuguesa - Deixis Língua portuguesa - Referência deixis e-mail
5	Contribuições ao combate de web spamming / Contributions to the battle against web spamming Silva, Renato Moraes, 1988- 22 August 2018 (has links) Orientadores: Akebo Yamakami, Tiago Agostinho de Almeida / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-22T13:22:48Z (GMT). No. of bitstreams: 1 Silva_RenatoMoraes_M.pdf: 4136928 bytes, checksum: 218846058592353cb167c8c2d61e1bfd (MD5) Previous issue date: 2013 / Resumo: Com o crescente aumento do volume de informações disponíveis na Web, as ferramentas de busca tornam-se cada vez mais importantes para os usuários da Internet. Consequentemente, com o objetivo de se tornar mais visíveis, os sites concorrem entre si para ganhar melhores posições nos resultados das buscas feitas por esses usuários. Porém, muitos ganham maior visibilidade através de estratégias que enganam as ferramentas de busca. Esses sites, conhecidos como Web spam, causam prejuízos pessoais e econômicos aos usuários. Diante desse cenário, este trabalho apresenta uma análise do desempenho de diversos métodos de aprendizado de máquina aplicados na detecção automática de Web hosts que propagam Web spam. Os experimentos foram realizados usando duas bases de dados reais, públicas e de grande porte, das quais foram extraídos três diferentes conjuntos de vetores de atributos: baseados no conteúdo das páginas Web, baseados nos links das páginas Web e formados pela transformação dos atributos baseados nos links. Também foi analisada a viabilidade da redução de dimensionalidade do espaço dos atributos. Outra contribuição desse trabalho é a proposta de uma abordagem de classificação de Web spam, em que as predições obtidas com cada tipo de vetor de atributos são combinadas e uma decisão final é obtida usando-se voto majoritário simples. Os resultados obtidos indicam que os métodos de bagging de árvores de decisão, redes neurais perceptron de múltiplas camadas, floresta aleatória e boosting adaptativo de árvores de decisão são promissores na tarefa de detecção de Web spam. Além disso, verificou-se que os métodos de aprendizado tem melhor desempenho quando os vetores de atributos baseados no conteúdo e os vetores formados pela transformação dos atributos baseados nos links são combinados. Por fim, a combinação das predições obtidas com cada tipo de vetor de atributos gera bons resultados e por isso, essa é uma abordagem recomendada para o combate de Web spamming / Abstract: Due to the increasing volume of information available on the Web, search engines become increasingly important to Internet users. Consequently, with the purpose of becoming more visible, the Web sites compete to achieve better positions in the results of the searches made by such users. However, many of them achieve a good visibility through strategies that try to circumvent the search engines. This kind of Web sites are known as Web spam and they are responsible for personal injury and economic losses to users. Given this scenario, this work presents a performance analysis of established machine learning techniques employed to automatically detect Web hosts that disseminate Web spam. The experiments were performed with two real, public and large datasets, from which were extracted three different sets of features vectors: contentbased ones, link-based ones and features vectors generated by the transformation of the link-based features. We also analyzed the viability of the dimensionality reduction of the feature space. Another contribution of this work is the proposal of a Web spam classification approach which combines the predictions achieved by each type of features vector and using a simple majority voting. The results indicate that bagging of decision trees, multilayer perceptron neural networks, random forest and adaptive boosting of decision trees are promising in the task of spam hosts classification. Furthermore, we have conclude that the learning techniques perform better when we have combined the content-based features vectors and the features vectors generated by the transformation of the link-based features. Finally, the combination of the predictions achieved with each type of features vector has achieved superior results and therefore it is a recommended approach to automatically detect Web spam / Mestrado / Automação / Mestre em Engenharia Elétrica Spam (Mensagens eletrônicas) Aprendizado de máquina Reconhecimento de padrões Spam (Electronic mail) Machine learning Pattern recognition
6	Teoria da ressonância adaptativa através da linguagem Java para detecção e classificação de e-mails indesejados / Santos Junior, Carlos Roberto dos. January 2013 (has links) Orientador: Anna Diva Plasencia Lotufo / Coorientador: Maria do Carmo Gomes da Silveira / Banca: Mara Lúcia Martins Lopes / Banca: Benedito Isaias de Lima Lopes / Resumo: O problema de mensagens não solicitadas pelos usuários em meios de comunicação eletrônica, apesar de ter surgido antes mesmo da popularização da Internet, ainda é um assunto preocupante. Desperdício de largura de banda, perda de tempo, de produtividade e de dados, ou atraso na leitura de e-mails legítimos, são alguns dos problemas que as mensagens não solicitadas, ou Spams, podem causar. Diversas técnicas de filtragem automática de e-mails são apresentadas na literatura, porém muitas destas não oferecem a possibilidade de adaptação, já que o problema em sistemas reais tem como um de seus principais aspectos ser dinâmico, ou seja, mudar constantemente de características com intuito de evadir as técnicas de filtragem. Neste trabalho é desenvolvido um filtro anti-spam utilizando uma técnica de préprocessamento disponível na literatura, no qual os e-mails são submetidos à extração e seleção de características; e uma Rede Neural Artificial baseada na Teoria da Ressonância Adaptativa, para detecção e classificação de Spams. Tais redes neurais possuem grande capacidade de generalização e adaptabilidade, características importantes para um bom desempenho de filtros anti-spam. O modelo proposto neste trabalho é testado a fim de se validar a eficiência do filtro. / Abstract: The problem in receiving non desired messages in electronic communication systems is a very hard task; even it has begun before the popularization of Internet. The problems that these kinds of messages can cause are among others: waste of time, waste of band width, productivity and data or delay in reading the real e-mails. Several e-mail automatic filtering techniques are presented in the literature, however many of them without capacity of adaptation, while the problem in real systems must be dynamical, i.e. avoid filtering techniques. This work develops a SPAM filtering using a pre processing technique available in the literature, where the e-mails are submitted to extract and select the characteristics; and a neural network based on the resonance adaptive theory to detect and classify the SPAMS. These neural networks have capacity in generalization and adaptation, important characteristics of good performance of SPAM filters. The proposed model is submitted to several tests to validate the efficiency of the filter. / Mestre Mensagem de correio eletrônico. Spam (Mensagens eletrônicas) Redes neurais (Computação) Neural networks (Computer science)
7	Teoria da ressonância adaptativa através da linguagem Java para detecção e classificação de e-mails indesejados Santos Junior, Carlos Roberto dos [UNESP] 28 February 2013 (has links) (PDF) Made available in DSpace on 2014-06-11T19:22:34Z (GMT). No. of bitstreams: 0 Previous issue date: 2013-02-28Bitstream added on 2014-06-13T19:28:06Z : No. of bitstreams: 1 santosjunior_cr_me_ilha.pdf: 674616 bytes, checksum: 0eb6d5afdb466f77cd53efea2c4e4db7 (MD5) / O problema de mensagens não solicitadas pelos usuários em meios de comunicação eletrônica, apesar de ter surgido antes mesmo da popularização da Internet, ainda é um assunto preocupante. Desperdício de largura de banda, perda de tempo, de produtividade e de dados, ou atraso na leitura de e-mails legítimos, são alguns dos problemas que as mensagens não solicitadas, ou Spams, podem causar. Diversas técnicas de filtragem automática de e-mails são apresentadas na literatura, porém muitas destas não oferecem a possibilidade de adaptação, já que o problema em sistemas reais tem como um de seus principais aspectos ser dinâmico, ou seja, mudar constantemente de características com intuito de evadir as técnicas de filtragem. Neste trabalho é desenvolvido um filtro anti-spam utilizando uma técnica de préprocessamento disponível na literatura, no qual os e-mails são submetidos à extração e seleção de características; e uma Rede Neural Artificial baseada na Teoria da Ressonância Adaptativa, para detecção e classificação de Spams. Tais redes neurais possuem grande capacidade de generalização e adaptabilidade, características importantes para um bom desempenho de filtros anti-spam. O modelo proposto neste trabalho é testado a fim de se validar a eficiência do filtro. / The problem in receiving non desired messages in electronic communication systems is a very hard task; even it has begun before the popularization of Internet. The problems that these kinds of messages can cause are among others: waste of time, waste of band width, productivity and data or delay in reading the real e-mails. Several e-mail automatic filtering techniques are presented in the literature, however many of them without capacity of adaptation, while the problem in real systems must be dynamical, i.e. avoid filtering techniques. This work develops a SPAM filtering using a pre processing technique available in the literature, where the e-mails are submitted to extract and select the characteristics; and a neural network based on the resonance adaptive theory to detect and classify the SPAMS. These neural networks have capacity in generalization and adaptation, important characteristics of good performance of SPAM filters. The proposed model is submitted to several tests to validate the efficiency of the filter. Mensagem de correio eletrônico Spam (Mensagens eletrônicas) Redes neurais (Computação) Java (Computer program language) Neural networks (Computer science)
8	SPAM = do surgimento à extinção / SPAM : from the rise to the extinction Almeida, Tiago Agostinho de 09 October 2010 (has links) Orientador: Akedo Yamakami / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-16T13:44:58Z (GMT). No. of bitstreams: 1 Almeida_TiagoAgostinhode_D.pdf: 1582584 bytes, checksum: 8a444adaf46219a5200a75deb26be781 (MD5) Previous issue date: 2010 / Resumo: Nos últimos anos, spams têm se tornado um importante problema com enorme impacto na sociedade. A filtragem automática de tais mensagens impõem um desafio especial em categorização de textos, no qual a característica mais marcante é que os filtros enfrentam um adversário ativo, que constantemente procura evadir as técnicas de filtragem. Esta tese apresenta um estudo abrangente sobre o problema do spamming. Dentre as contribuições oferecidas, destacam-se: o levantamento histórico e estatístico do fenômeno do spamming e as suas consequências, o estudo sobre a legalidade do spam e os recursos jurídicos adotados por alguns países, a análise de medidas de desempenho utilizadas na avaliação dos filtros de spams, o estudo dos métodos mais empregados para realizar a filtragem de spams, a proposta de melhorias dos filtros Bayesianos através da adoção de técnicas de redução de dimensionalidade e, principalmente, a proposta de um novo método de classificação baseado no princípio da descrição mais simples auxiliado por fatores de confidência. Vários experimentos são apresentados e os resultados indicam que a técnica proposta 'e superior aos melhores filtros anti-spams presentes tanto comercialmente quanto na literatura. / Abstract: Spam has become an increasingly important problem with a big economic impact in society. Spam filtering poses a special problem in text categorization, in which the defining characteristic is that filters face an active adversary, which constantly attempts to evade filtering. In this thesis, we present a comprehensive study of the spamming problem. Among many offered contributions we present: the statistical and historical survey of spamming and its consequences, a study regarding the legality of spams and the main juridic methods adopted by some countries, the study and proposal of new performance measures used for the evaluation of the spam classifiers, the proposals for improving the accuracy of Naive Bayes filters by using dimensionality reduction techniques and a novel approach to spam filtering based on the minimum description length principle and confidence factors. Furthermore, we have conducted an empirical experiments which indicate that the proposed classifier outperforms the state-of-the-art spam filters. / Doutorado / Automação / Doutor em Engenharia Elétrica Spam (Mensagens eletrônicas) Inteligência artificial Classificação Categorização (Linguística) Sistemas inteligentes Spam (Electronic mail) Artificial intelligence Classification Categorization (Linguistic) Intelligent systems
9	TubeSpam: Filtragem Automática de Comentários Indesejados Postados no YouTube / TubeSpam: automatic undesired comments filtering on YouTube Alberto, Túlio Casagrande 03 February 2017 (has links) Submitted by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:06:58Z No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:07:11Z (GMT) No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:07:27Z (GMT) No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Made available in DSpace on 2017-10-03T19:07:37Z (GMT). No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) Previous issue date: 2017-02-03 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / YouTube has become an important video sharing platform. Several users regularly produce video content and make this task their main livelihood. However, such success is also drawing the attention of malicious users propagating undesired comments and videos, looking for self-promotion or disseminating malicious links which may have malwares and viruses. Since YouTube offers limited tools for blocking spam, the volume of such messages is shockingly increasing and harming users and channels owners. In addition to the problem being naturally online, comment spam filtering on YouTube is different than the traditional email spam filtering, since the messages are very short and often rife with spelling errors, slangs, symbols and abbreviations. This manuscript presents a performance evaluation of traditional online classification methods, aided by lexical normalization and semantic indexing techniques when applied to automatic filter YouTube comment spam. It was also evaluated the performance of MDLText, a promising text classification method based on the minimum description length principle. The statistical analysis of the results indicates that MDLText, Passive-Aggressive, Naïve Bayes, MDL and Online Gradient Descent obtained statistically equivalent performances. The results also indicate that the lexical normalization and semantic indexing techniques are effective to be applied to the problem. Based on the results, it is proposed and designed TubeSpam, an online tool to automatic filter undesired comments posted on YouTube. / O YouTube tem se tornado uma importante plataforma de compartilhamento de vídeos. Muitos usuários produzem regularmente conteúdo em vídeo e fazem desta tarefa seu principal meio de vida. Contudo, esse sucesso também vem despertando a atenção de usuários mal-intencionados, que propagam comentários e vídeos indesejados para se autopromoverem ou para disseminar links maliciosos que podem conter vírus e malwares. Visto que o YouTube atualmente oferece recursos limitados para bloquear spam, o volume dessas mensagens está impactando muitos usuários e proprietários de canais. Além da característica inerentemente online do problema, filtrar spam nos comentários do YouTube é uma tarefa que difere-se da tradicional filtragem de spam em emails, pois as mensagens costumam ser muito mais curtas e repletas de erros de digitação, gírias, símbolos e abreviações que podem dificultar a tarefa de classificação. Assim, nesta dissertação é apresentada a avaliação de desempenho obtido por métodos tradicionais de classificação online auxiliados por técnicas de normalização léxica e indexação semântica, quando aplicados na filtragem automática de comentários indesejados postados no YouTube. Foi avaliado também o desempenho do MDLText, um promissor método de classificação de texto baseado no princípio da descrição mais simples. A análise estatística dos resultados indica que os métodos MDLText, Passivo-Agressivo, Naïve Bayes, MDL e Gradiente Descendente Online obtiveram desempenhos equivalentes. Além disso, os resultados também indicam que o uso de técnicas de normalização léxica e indexação semântica são eficazes para atenuar os problemas de representação de texto e, consequentemente, aumentar o poder de predição dos métodos de classificação. Baseado nos resultados dos experimentos, foi proposto e desenvolvido o TubeSpam, uma ferramenta online para filtrar automaticamente comentários indesejados postados no YouTube. Youtube (Recurso eletrônico) Aprendizado do computador Spam (Mensagens eletrônicas) Youtube (Recurso eletrônico) Comentários indesejados Spam (Electronic mail) Machine learning Undesired comments
10	Classificação de conteúdo malicioso baseado em floresta de caminhos ótimos / Fernandes, Dheny. January 2016 (has links) Orientador: João Paulo Papa / Coorientador: Kelton Augusto Pontara da Costa / Banca: Aparecido Nilceu Marana / Banca: Jurandy Gomes Almeida Jr. / Resumo: O advento da Internet trouxe amplos benefícios nas áreas de comunicação, entretenimento, compras, relações sociais, entre outras. Entretanto, várias ameaças começaram a surgir nesse cenário, levando pesquisadores a criar ferramentas para lidar com elas. Spam, malwares, conteúdos maliciosos, pishing, fraudes e falsas URLs são exemplos de ameaças. Em contrapartida, sistemas antivírus, firewalls e sistemas de detecção e prevenção de intrusão são exemplos de ferramentas de combate às tais ameaças. Principalmente a partir de 2010, encabeçado pelo malware Stuxnet, as ameaças tornaram-se muito mais complexas e persistentes, fazendo com que as ferramentas até então utilizadas se tornassem obsoletas. O motivo é que tais ferramentas, baseadas em assinaturas e anomalias, não conseguem acompanhar tanto a velocidade de desenvolvimento das ameaças quanto sua complexidade. Desde então, pesquisadores têm voltado suas atenções a métodos mais eficazes para se combater ciberameaças. Nesse contexto, algoritmos de aprendizagem de máquina estão sendo explorados na busca por soluções que analisem em tempo real ameaças provenientes da internet. Assim sendo, este trabalho tem como objetivo analisar o desempenho dos classificadores baseados em Floresta de Caminhos Ótimos, do inglês Optimum-path Forest (OPF), comparando-os com os demais classificadores do estado-da-arte. Para tanto, serão analisados dois métodos de extração de características: um baseado em tokens e o outro baseado em Ngrams, sendo N igual a 3. De maneira geral, o OPF mais se destacou no não bloqueio de mensagens legítimas e no tempo de treinamento. Em algumas bases a quantidade de spam corretamente classificada também foi alta. A versão do OPF que utiliza grafo completo foi melhor, apesar de que em alguns casos a versão com grafo knn se sobressaiu. Devido às exigências atuais em questões de segurança, o OPF, pelo seu rápido tempo de treinamento,... / Abstract: The advent of Internet has brought widespread benefits in the areas of communication, entertainment, shopping, social relations, among others. However, several threats began to emerge in this scenario, leading researchers to create tools to deal with them. Spam, malware, malicious content, phishing, fraud and false URLs are some examples of these threats. In contrast, anti-virus systems, firewalls and intrusion detection and prevention systems are examples of tools to combat such threats. Especially since 2010, headed by the Stuxnet malware, threats have become more complex and persistent, making the tools previously used became obsolete. The reason is that such tools based on signatures and anomalies can not follow both the speed of development of the threats and their complexity. Since then, researchers have turned their attention to more effective methods to combat cyber threats. In this context, machine learning algorithms are being exploited in the search for solutions to analyze real-time threats from the internet. Therefore, this study aims to analyze the performance of classifiers based on Optimum-path Forest, OPF, comparing them with the other state-of-the-art classifiers. To do so, two features extraction methods will be analyzed: one based on tokens and other based on Ngrams, considering N equal 3. Overall, OPF stood out in not blocking legitimate messages and training time. In some bases the amount of spam classified correctly was high as well. The version that uses complete graph was better, although in some cases the version that makes use of knn graph outperformed it. Due to the current demands on security issues, OPF, considering its fast training time, can be improved in its effectiveness aiming at a real application. In relation to feature extraction methods, 3gram was better, improving OPF's results / Mestre Ciência da computação - Matemática. Floresta de caminhos ótimos. Aprendizado do computador. Spam (Mensagens eletrônicas) Computer science

Search results