Spelling suggestions: "subject:"minería dde opinion"" "subject:"minería dee opinion""
1 |
Interés complementario: Diseño e implementación de una metodología de estudio de mercado orientado a redes sociales, con el uso de herramientas de minería de opinionesNumhauser Cabrera, Abel Iván January 2018 (has links)
Magíster en ingeniería de Negocios con Tecnologías de Información. Ingeniero Civil Industrial / La presente tesis se centró en la implementación de Interés Complementario, un servicio tecnológico para OpinionZoom (OZ), proyecto académico con fines comerciales llevado a cabo por el Web Intelligence Centre (WIC) de la Universidad de Chile. Se creó un módulo que detecta automáticamente los temas que un usuario chileno de Twitter expone en los comentarios que emite, con la finalidad comercial es generar insights de los prospectos de clientes de OpinionZoom.
La problemática recae en que el volumen da datos es muy numeroso y además aumenta considerablemente conforme pasa el tiempo. Adicionalmente, se trata de un estudio pionero: la tesis debió hacerse cargo de generar una metodología para descubrir aproximadamente cuántos tópicos y de qué naturaleza existen ente los usuarios de Twitter en Chile, así como la paquetización en un servicio.
De acuerdo a lo anterior, se declaró la hipótesis de investigación: Es factible montar una herramienta comercial que identifique los tópicos de mayor interés de usuarios de redes sociales, basándose en el contenido que éstos generan y mediante el uso de herramientas de minería de opiniones, con foco en topic modeling.
Se optó por utilizar LDA, un modelo supervisado para realizar Topic Modeling pero en un proceso iterativo para estimar la cantidad más adecuadas de tópicos. Gracias a ello, y sumado a una limitante en la capacidad de procesamiento, se generaron 120 tópicos, donde se evidencia que 28 de ellos no guardan ninguna relevancia semántica y que fueron generados por sesgo de la base de entrenamiento. Los restantes decantaron en una taxonomía de 27 categorías con 44 subcategorías, donde las principales categorías son Social y noticias.
La precisión de la herramienta globalmente no fue satisfactorio, pues en promedio es de 40%. Sin embargo, tras estudiar los casos se evidenció que los usuarios que tienen una mayor cantidad de tweets presentan una mejora significativa en la precisión, llegando hasta una precisión del orden de 60%.
Para determinar factibilidad se realizó una cubicación y análisis de sensibilidad de los recursos necesarios para la comercialización, bajo tres estrategias: (1) Spin-in, en el que se vende como un organismo interno de la Universidad de Chile; (2) Partner Estratégico, en el que se confía la exclusividad de los servicios de investigación y mantención a un privado, a cambio del cobro de una licencia; y (3) Spin-off, en el que se desprende la fuerza de venta de la Universidad y paga un tributo extra por los ingresos.
En conclusiones principales de destaca en la dimensión de negocio que el proyecto es rentable y la alternativa de comercialización de Spin-off es factible en tanto se obtenga una cantidad determinada de clientes al año. En cuanto a visión de procesos, fue posible utilizar metodologías del plan de estudios para el diseño global y particular del módulo de Interés Complementario. Sobre la investigación en sí, se determinó que la hipótesis se cumple siempre y cuando el usuario a analizar genere suficiente contenido, tal que los tópicos estimados sumen cierto nivel del denominado Ratio de Interés. / Este trabajo ha sido financiado por el proyecto CORFO 13IDL2-23170
|
2 |
Análisis semántico multidimensional aplicado a la desambiguación del lenguaje naturalGutiérrez, Yoan 30 January 2012 (has links)
No description available.
|
3 |
EMOTIBLOG: a model to learn subjetive information detection in the new textual genres of the web 2.0 -a multilingual and multi-genre approachBoldrini, Ester 23 January 2012 (has links)
No description available.
|
4 |
Detección de opinion spam usando PU-learningHernández Fusilier, Donato 20 July 2016 (has links)
Tesis por compendio / [EN] Abstract
The detection of false or true opinions about a product or service has become nowadays a very important problem. Recent studies show that up to 80% of people have changed their final decision on the basis of opinions checked on the web. Some of these opinions may be false, positive in order to promote a product/service or negative to discredit it.
To help solving this problem in this thesis is proposed a new method for detection of false opinions, called PU-Learning*, which increases the precision by an iterative algorithm. It also solves the problem of lack of labeled opinions.
To operate the method proposed only a small set of opinions labeled as positive and another large set of opinions unlabeled are needed. From this last set, missing negative opinions are extracted and used to achieve a two classes binary classification. This scenario has become a very common situation in the available corpora.
As a second contribution, we propose a representation based on n-grams of characters. This representation has the advantage of capturing both the content and the writing style, allowing for improving the effectiveness of the proposed method for the detection of false opinions.
The experimental evaluation of the method was carried out by conducting three experiments classification of opinions, using two different collections. The results obtained in each experiment allow seeing the effectiveness of proposed method as well as differences between the use of several types of attributes.
Because the veracity or falsity of the reviews expressed by users becomes a very important parameter in decision making, the method presented here, can be used in any corpus where you have the above characteristics. / [ES] Resumen
La detección de opiniones falsas o verdaderas acerca de un producto o servicio, se ha convertido en un problema muy relevante de nuestra 'época. Según estudios recientes hasta el 80% de las personas han cambiado su decisión final basados en las opiniones revisadas en la web. Algunas de estas opiniones pueden ser falsas positivas, con la finalidad de promover un producto, o falsas negativas para desacreditarlo.
Para ayudar a resolver este problema se propone en esta tesis un nuevo método para la detección de opiniones falsas, llamado PU-Learning modificado. Este método aumenta la precisión mediante un algoritmo iterativo y resuelve el problema de la falta de opiniones etiquetadas.
Para el funcionamiento del método propuesto se utilizan un conjunto pequeño de opiniones etiquetadas como falsas y otro conjunto grande de opiniones no etiquetadas, del cual se extraen las opiniones faltantes y así lograr una clasificación de dos clases. Este tipo de escenario se ha convertido en una situación muy común en los corpus de opiniones disponibles.
Como una segunda contribución se propone una representación basada en n-gramas de caracteres. Esta representación tiene la ventaja de capturar tanto elementos de contenido como del estilo de escritura, permitiendo con ello mejorar la efectividad del método propuesto en la detección de opiniones falsas.
La evaluación experimental del método se llevó a cabo mediante tres experimentos de clasificación de opiniones utilizando dos colecciones diferentes. Los resultados obtenidos en cada experimento permiten ver la efectividad del método propuesto así como también las diferencias entre la utilización de varios tipos de atributos.
Dado que la falsedad o veracidad de las opiniones vertidas por los usuarios, se convierte en un parámetro muy importante en la toma de decisiones, el método
que aquí se presenta, puede ser utilizado en cualquier corpus donde se tengan las características mencionadas antes. / [CA] Resum
La detecció d'opinions falses o vertaderes al voltant d'un producte o servei s'ha convertit en un problema força rellevant de la nostra època. Segons estudis recents, fins el 80\% de les persones han canviat la seua decisió final en base a les opinions revisades en la web. Algunes d'aquestes opinions poden ser falses positives, amb la finalitat de promoure un producte, o falses negatives per tal de desacreditarlo.
Per a ajudar a resoldre aquest problema es proposa en aquesta tesi un nou mètode de detecció d'opinions falses, anomenat PU-Learning*. Aquest mètode augmenta la precisió mitjançant un algoritme iteratiu i resol el problema de la falta d'opinions etiquetades.
Per al funcionament del mètode proposat, s'utilitzen un conjunt reduït d'opinions etiquetades com a falses i un altre conjunt gran d'opinions
no etiquetades, del qual se n'extrauen les opinions que faltaven i, així, aconseguir una classificació de dues classes. Aquest tipus d'escenari s'ha convertit en una situació molt comuna en els corpus d'opinions de què es disposa.
Com una segona contribució es proposa una representació basada en n-gramas de caràcters. Aquesta representació té l'avantatge de capturar tant elements de contingut com a d'estil d'escriptura, permetent amb això millorar l'efectivitat del mètode proposat en la detecció d'opinions falses.
L'avaluació experimental del mètode es va dur a terme mitjançant tres experiments de classificació d'opinions utilitzant dues coleccions diferents. Els resultats obtingut en cada experiment permeten veure l'efectivitat del mètode proposat, així com també les diferències entre la utilització de varis tipus d'atributs.
Ja que la falsedat o veracitat de les opinions vessades pels usuaris es converteix en un paràmetre molt important en la presa de decisions, el mètode que ací es presenta pot ser utilitzat en qualsevol corpus on es troben les característiques abans esmentades. / Hernández Fusilier, D. (2016). Detección de opinion spam usando PU-learning [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61990 / Compendio
|
5 |
Can Sentiments of Social Media Participants Reflect by Financial Market LiquiditySaleemi, Jawad 26 July 2024 (has links)
Tesis por compendio / [ES] Esta tesis doctoral se enmarca en el área de investigación del Departamento de
Economía y Ciencias Sociales, y se centra en la perspectiva conductual de la liquidez del
mercado. La liquidez que varía en el tiempo y sus problemas relacionados son una de las
preocupaciones dominantes en la literatura de microestructura del mercado. El papel
crítico de la liquidez del mercado en la ejecución de transacciones o la determinación
del rendimiento de la inversión genera inquietudes tanto para académicos como para
aquellos que participan en el mercado. Por lo tanto, es necesario desvelar los problemas
potenciales que pueden afectar la liquidez del mercado financiero.
Esta tesis busca entender la liquidez del mercado y sus problemas relacionados a la luz
del comportamiento de los inversores. La perspectiva conductual de la liquidez se
examina utilizando información orientada a opiniones en microblogs. La creciente
literatura de finanzas conductuales también incluye la autenticidad de los datos de
microblogs tanto en la modelización como en la predicción de diversas preocupaciones
asociadas con el funcionamiento eficiente de los mercados financieros. Sin embargo, la
investigación previa en el ámbito de las finanzas conductuales podría haber pasado por
alto algunas implicaciones potenciales de la información orientada a opiniones en
microblogs sobre la liquidez del mercado a nivel de mercado y de empresa. Por lo tanto,
la tesis pretende ser una aplicación empírica en esta área de investigación. La tesis se
lleva a cabo como un compendio de artículos científicos, cuya memoria incluye varios
artículos de investigación publicados en revistas indexadas.
El primer artículo proporciona información sobre la relación entre el contenido de
microblogs y el coste de facilitación de la liquidez. Durante los períodos de negociación,
este estudio sugirió que el estado de ánimo de los inversionistas tenía menos influencia
en afectar la liquidez que varía en el tiempo y su coste de facilitación. Sin embargo, la
información entrante en un día dado fue más influyente para las sesiones de negociación
siguientes. Los sentimientos construidos sobre una base de dos días estaban asociados
con el costo de facilitación de la liquidez. El segundo articulo aborda las dimensiones de
la liquidez del mercado utilizando opiniones de microblogs. Esta investigación reveló que
los sentimientos de los inversores en entornos de pesimismo tenían más poder
autoritario sobre las dimensiones de la liquidez, incluidos los costes de negociación, la
inmediatez de la transacción, la dispersión de precios y el volumen de negociación.
Finalmente, el tercer articulo de investigación explora el riesgo sistemático de
sentimiento para la liquidez en relación con los datos de microblogs. Este estudio mostró
que la liquidez del índice bancario estaba expuesta al riesgo sistemático de sentimiento
y liquidez, pero la liquidez del índice de empresas no financieras solo estaba expuesta a
un riesgo sistemático de liquidez.
Los participantes del mercado impulsados por los sentimientos observados en la
plataforma de microblogging pueden no solo influir en la liquidez del mercado, que varía
en el tiempo y sus dimensiones, sino que también pueden exponerse al riesgo
sistemático para la liquidez dentro de un mercado más amplio. Por lo tanto, se sugiere
que la liquidez y sus aspectos relacionados se valoren frente a los problemas de selección
adversa en el mercado. Además, la medición de la información entrante en la plataforma
de microblogging puede ayudar mejor a los proveedores de liquidez en la construcción
de carteras. / [CA] Aquesta tesi doctoral s'emmarca en l'àrea d'investigació del Departament d'Economia i
Ciències Socials, i es centra en la perspectiva conductual de la liquiditat del mercat. La
liquiditat que varia en el temps i els seus problemes relacionats són una de les
preocupacions dominants en la literatura de microestructura del mercat. El paper crític
de la liquiditat del mercat en l'execució de transaccions o la determinació del rendiment
de la inversió genera inquietuds tant per a acadèmics com per a aquells que participen
en el mercat. Per tant, és necessari desvetlar els problemes potencials que poden afectar
la liquiditat del mercat financer.
Aquesta tesi busca entendre la liquiditat del mercat i els seus problemes relacionats a la
llum del comportament dels inversors. La perspectiva conductual de la liquiditat
s'examina utilitzant informació orientada a opinions en microblogs. La creixent literatura
de finances conductuals també inclou l'autenticitat de les dades de microblogs tant en
la modelització com en la predicció de diverses preocupacions associades amb el
funcionament eficient dels mercats financers. No obstant això, la recerca prèvia en
l'àmbit de les finances conductuals podria haver passat per alt algunes implicacions
potencials de la informació orientada a opinions en microblogs sobre la liquiditat del
mercat a nivell de mercat i d'empresa. Per tant, la tesi pretén ser una aplicació empírica
en aquesta àrea d'investigació. La tesi es duu a terme com a compendi d'articles
cientifics, la memòria de la qual inclou diversos articles de recerca publicats en revistes
indexades.
El primer article proporciona informació sobre la relació entre el contingut de microblogs
i el cost de facilitació de la liquiditat. Durant els períodes de negociació, aquest estudi va
suggerir que l'estat d'ànim dels inversors tenia menys influència en afectar la liquiditat
que varia en el temps i el seu cost de facilitació. No obstant això, la informació entrant
en un dia donat era més influent per a les sessions de negociació següents. Els
sentiments construïts sobre una base de dos dies estaven associats amb el cost de
facilitació de la liquiditat. El segon article aborda les dimensions de la liquiditat del
mercat utilitzant opinions de microblogs. Aquesta recerca va revelar que els sentiments
dels inversors en entorns de pessimisme tenien més poder autoritari sobre les
dimensions de la liquiditat, inclosos els costos de negociació, la immediatesa de la
transacció, la dispersió de preus i el volum de negociació. Finalment, el tercer article de
recerca explora el risc sistemàtic de sentiment per a la liquiditat en relació amb les dades
de microblogs. Aquest estudi va mostrar que la liquiditat de l'índex bancari estava
exposada al risc sistemàtic de sentiment i liquiditat, però la liquiditat de l'índex
d'empreses no financeres només estava exposada a un risc sistemàtic de liquiditat.
Els participants del mercat impulsats pels sentiments observats a la plataforma de
microblogging poden no només influir en la liquiditat del mercat, que varia en el temps
i les seves dimensions, sinó que també poden exposar-se al risc sistemàtic per a la
liquiditat dins d'un mercat més ampli. Per tant, es suggereix que la liquiditat i els seus
aspectes relacionats es valoren davant dels problemes de selecció adversa en el mercat.
A més, la mesura de la informació entrant a la plataforma de microblogging pot ajudar
millor els proveïdors de liquiditat en la construcció de carteres. / [EN] This doctoral dissertation falls in the research area of economic and social sciences
department, and focuses on the behavioral perspective of market liquidity. The time-varying
liquidity and its related issues are one of the dominant concerns in the market
microstructure literature. The critical role of market liquidity in executing the transactions
or determining the yield on investment is raising concerns for both academics and those
who engage in the trading. There is thus need to unveil the potential issues, that may
impact the financial market liquidity.
This dissertation seeks to understand market liquidity and its related issues in the light of
investors' behavior. The behavioral perspective of liquidity is examined using
microblogging-opinionated information. The escalation of behavioral finance literature
also comprises the authenticity of microblogging data in both modeling and predicting
various concerns associated with the efficient functioning of financial markets. However,
previous research in the behavioral finance domain might have ignored a few potential
implications of microblogging-opinionated information on market liquidity at the market
and firm levels. Therefore, the dissertation aims to be the first empirical attempt in this
area of research. The thesis is carried out as a compendium of scientific papers, whose
memory includes several research articles published in the indexed journals.
The first article provides insights into relationship between microblogging content and
liquidity-facilitating cost. During trading periods, this study suggested that investors'
mood was less influential in affecting the time-varying liquidity and its providing cost.
However, the incoming information on a given day was more influential for following
trading sessions. The sentiments built on a two-day basis were associated with the
liquidity-facilitating cost. The second article covers the dimensions of market liquidity
using microblogging opinions. This research revealed that investor sentiments in
environments of pessimism had more authoritative power on liquidity dimensions
including the trading costs, transaction immediacy, price dispersion and trading volume.
Finally, the third research paper explores the systematic sentiment risk for liquidity in
relation to the microblogging data. This study depicted that the bank index liquidity was
exposed to the systematic sentiment and liquidity risks, but non-financial firm index
liquidity was only exposed to a systematic liquidity risk.
The emotion-driven market participants on microblogging platform may not only
influence the time-varying market liquidity and its dimensions, but they may also expose
to the systematic risk for liquidity withing a broader market. Thus, liquidity and its related
aspects are suggested to be priced against the adverse selection issues in the market.
Additionally, the measurement of incoming information on microblogging platform may
better assist the liquidity providers in the construction of portfolio. / Saleemi, J. (2024). Can Sentiments of Social Media Participants Reflect by Financial Market Liquidity [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/206814 / Compendio
|
Page generated in 0.0965 seconds