Made available in DSpace on 2016-04-29T14:23:30Z (GMT). No. of bitstreams: 1
Valter Lacerda de Andrade Junior.pdf: 673552 bytes, checksum: 68480511c98995570354a0166d2bb577 (MD5)
Previous issue date: 2014-08-13 / The need for expert assessment of Data Mining in textual data fields and other
unstructured information is increasingly present in the public and private sector. Through
probabilistic models and analytical studies, it is possible to broaden the understanding of
a particular information source. In recent years, technology progress caused exponential
growth of the information produced and accessed in the virtual media (web and private).
It is estimated that by 2003 humanity had historically generated a total of 5 exabytes of
content; today that asset volume can be produced in a few days. With the increasing
demand, this project aims to work with probabilistic models related to the financial
market in order to check whether the textual data fields, or unstructured information,
contained within the business environment, can predict certain customers behaviors. It
is assumed that in the corporate environment and on the web, there is great valuable
information that, due to the complexity and lack of structure, they are barely considered
in probabilistic studies. This material may represent competitive and strategic advantage
for business, so analyzing unstructured information one can acquire important data on
behaviors and mode of user interaction in the environment in which it operates,
providing data as to obtain psychographic profile and satisfaction degree. The corpus of
this study consists of the results of experiments made in negotiating environment of a
financial company in São Paulo. On the foregoing analysis, it was applied statistical bias
semiotic concepts. Among the findings of this study, it is possible to get a critical review
and thorough understanding of the processes of textual data assessment / A necessidade de análise especializada de Mineração de Dados (Data Mining) em
campos textuais e em outras informações não estruturadas estão, cada vez mais,
presente nas instituições dos setores públicos e privados. Por meio de modelos
probabilísticos e estudos analíticos, torna-se possível ampliar o entendimento sobre
determinada fonte de informação. Nos últimos anos, devido ao
avanço tecnológico, observa-se um crescimento exponencial na quantidade de
informação produzida e acessada nas mídias virtuais (web e privada). Até 2003, a
humanidade havia gerado, historicamente, um total de 5 exabytes de conteúdo;
hoje estima-se que esse volume possa ser produzido em poucos dias. Assim, a partir
desta crescente demanda identificada, este projeto visa trabalhar com modelos
probabilísticos relacionados ao mercado financeiro com o intuito de analisar se os
campos textuais e ilustrativos, ou informações não estruturadas, contidas dentro do
ambiente de negócio, podem prever certos comportamentos de clientes. Parte-se do
pressuposto que, no ambiente corporativo e na web, existem informações de grande
valor e que, devido à complexidade e falta de estrutura, não são consideradas em
estudos probabilísticos. Isso pode representar vantagem competitiva e estratégica para
o negócio, pois, por meio da análise da informação não estruturada, podem-se
conhecer comportamentos e modos de interação do usuário nestes ambientes,
proporcionando obter dados como perfil psicográfico e grau de satisfação.
O corpus deste estudo constitui-se de resultados de experimentos efetuados no
ambiente negocial de uma empresa do setor financeiro. Para as análises, foram
aplicados conceitos estatísticos com viés semiótico. Entre as informações obtidas por
esta pesquisa, verifica-se a compreensão crítica e aprofundada dos processos de
análise textual
Identifer | oai:union.ndltd.org:IBICT/oai:leto:handle/18150 |
Date | 13 August 2014 |
Creators | Andrade Junior, Valter Lacerda de |
Contributors | Peixoto, Nelson Brissac |
Publisher | Pontifícia Universidade Católica de São Paulo, Programa de Estudos Pós-Graduados em Tecnologia da Inteligência e Design Digital, PUC-SP, BR, Mídias Digitais |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP, instname:Pontifícia Universidade Católica de São Paulo, instacron:PUC_SP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds