Spelling suggestions: "subject:"sesgos"" "subject:"iesgos""
1 |
Teoría y aplicaciones de corrección de sesgos para métodos de valoración ambientalGándara Fierro, Guillermo 08 February 2002 (has links)
La tesis se centra en la detección y corrección de algunos de los sesgos que afectan a los ejercicios de valoración contingente. Concretamente se estudian el sesgo del precio de salida en aplicaciones del formato mixto de la pregunta de valoración, y el sesgo estratégico en aplicaciones del formato abierto. Por otra parte, se estudia el sesgo de estimación, donde se analizan las diferencias entre estimar los resultados de la aplicación del formato dicotómico mediante una aproximación no paramétrica o una aproximación paramétrica.Con relación al sesgo del precio de salida, el Capítulo 2 se presenta como un desarrollo teórico y empírico del diseño de mecanismos para determinar los precios de salida que corrijan de manera ex-ante este sesgo. Se contrastan algunas diferencias entre distintos formatos de la pregunta de valoración (abierto y mixto) y se comparan los mecanismos propuestos con los diseños tradicionalmente utilizados para definir los precios. Para contrastar la robustez de los mecanismos de corrección propuestos en la parte teórica, se desarrolla un experimento de simulación de Monte Carlo y se realiza un ejercicio de valoración contingente aplicado a la valoración de externalidades asociadas a la gestión de residuos sólidos urbanos.Respecto al sesgo estratégico, el Capítulo 3 se centra en el estudio de los incentivos que llevan a los individuos a revelar o no su verdadera disposición a pagar (comportamiento estratégico). Se plantea que existen formatos de la pregunta de valoración que no son manipulables y por tanto están libres del sesgo estratégico. Una vez definido el planteamiento teórico, a través de un experimento de laboratorio se demuestra por una parte que el formato abierto de la pregunta de valoración con una regla de decisión basada en la mediana no es manipulable, y por otra, que el formato abierto con una regla de decisión basada en la media es manipulable. En Capítulo 4, a través de un ejercicio de simulación de Monte Carlo se comparan las estimaciones paramétrica y no paramétricamente de la disposición a pagar con una disposición de pago real. Se definen tres formas funcionales para la disposición a pagar real: normal, Weibull y lognormal, y se prueban diversos diseños para definir los precios de oferta. En este sentido la tesis realiza aportaciones sobre el tamaño muestral y el diseño de los precios de salida en el marco de la estimación no paramétrica. / The thesis objective is to study the detection and correction of some bias in CVM exercises. Concretely the starting point bias in close-open ended format and the strategic bias in open format applications are attended. On the other hand, the estimation bias is studied, where are analyzed the differences between to estimate the results from close format with a non parametric approach and a parametric approach.The proposal of the thesis in chapter 2 consists to a change in the processing of the starting point bias. For it one propose, it applies and it verifies a new design of mechanisms to determine the bids in the valuation question of close-open format, that correct in ex-ante form the starting point bias. These designs are denominated sequential, because they follow a self-adaptation process, and its novelty is that they are defined as the survey progresses. In addition, it is verified that these mechanisms maintain the advantages of the close-open format over the open format. The application and verification of the sequential designs are made in an exercise of Monte Carlo simulation and the different designs are applied in the valuation of externalities associated to the RSU incineration and disposal as well as to the PMGRM of the Barcelona Metropolitan Area.The potential manipulability of CVM can lead to biased results if a strategic behaviour exists. However, in accordance with economic theory exists eliciting question formats that are not manipulable. The objective of chapter 3 has been to confirm in practice that a open ended format with a media rule is strategy-proof, and to compare its differences between a manipulable mean rule format. Information for the tests preceding from a laboratory experiment. The result indicates that a greater proportion of people states their true WTP in a experiment when non manipulability information of median rule is provided, in comparison with the rest of options used here.In chapter 4 it has been did a comparison between the WTP estimated nonparametric and parametrically, and a comparison between each one of these estimations with real WTP, through an exercise of Monte Carlo simulation. Three functional forms for WTP* have been considered (normal, Weibull and lognormal). In the nonparametric approach three values are calculated: maximum (Paashe), intermedium and minimum (Laspeyres), and in the parametric approach have been considered a model logit that although is not the model that corresponds to each one of the three functional forms of WTP*, is the model that is most frequently used in this type of exercises. The bids have been determined according to three different designs: one by percentiles in agreement with the suggestions of Alberini and Carson (1993) for parametric estimations, another systematic following McFadden (1994) for nonparametric estimations and finally, a design of random bids.
|
2 |
Mitigación de Sesgos para la Automatización Justa de Tareas de ClasificaciónConsuegra-Ayala, Juan Pablo 19 January 2024 (has links)
Los modelos de aprendizaje automático están siendo ampliamente utilizados en múltiples áreas de la vida humana. Tradicionalmente, se han aplicado en reconocimiento de voz, detección de rostros, clasificación de imágenes, sistemas de recomendación, etc. Con la reciente revolución de los modelos generativos, la popularidad de los chatbots conversacionales se ha disparado. Esto ha dado lugar a que los modelos de aprendizaje automático se utilicen cada vez más para abordar tareas para las que no estaban específicamente capacitados. El prompt engineering ha permitido que personas no expertas en aprendizaje automático (que comúnmente tampoco están familiarizadas con los problemas subyacentes al uso de modelos de aprendizaje automático para hacer predicciones) automaticen ciertas tareas. La incorporación de algoritmos de aprendizaje automático en tareas de toma de decisiones de alto riesgo ha levantado algunas alertas en la comunidad científica. Las tareas de toma de decisiones de alto riesgo denotan aquellas tareas que pueden tener un gran impacto en las vidas de las personas sobre quienes se toman las decisiones. Por ejemplo, se han utilizado modelos para decidir si una persona es contratada o no, si se le concede un préstamo, si se acepta una solicitud de cobertura ampliada de seguridad sanitaria y para predecir la probabilidad de reincidencia en un delito. Estudios han demostrado que la automatización inconsciente de este tipo de tareas contiene sesgos, lo cual provoca que decisiones injustas sean tomadas sobre determinados grupos de población. El peligro fundamental de ignorar este problema es que los métodos de aprendizaje automático podrían no sólo reflejar los sesgos presentes en nuestra sociedad, sino que también amplificarlos. Esta tesis presenta el diseño y validación de una tecnología para asistir la automatización justa de problemas de clasificación. En esencia, la propuesta se basa en diseñar una tecnología que saque provecho de las soluciones intermedias generadas durante la resolución de problemas de clasificación mediante el uso de herramientas de Auto-ML, en particular, AutoGOAL, con el propósito de crear clasificadores imparciales y justos. Cuatro componentes fundamentales conforman la propuesta: (I) una componente de Auto-ML, encargada de generar colecciones de modelos con hipótesis diferentes entre sí, cada uno debiendo ser capaz de transformar los datos de entrada a los de salida; (II) una componente de ensemble, responsable de combinar múltiples soluciones para producir una más robusta, exacta y justa, según criterios definidos por funciones de pérdida; (III) una componente de cuantificación de sesgos, encargada de medir la calidad de un modelo según varias definiciones de sesgo y equidad; y (IV) una componente de anotación automática de atributos protegidos, para permitir estimar los sesgos en situaciones donde normalmente no sería posible. Los resultados discutidos en este documento prueban la capacidad de la tecnología propuesta para automatizar tareas de clasificación a la par que se controla su equidad. Además, la experimentación muestra la competitividad de la propuesta respecto a otras alternativas para controlar los sesgos en el modelo de aprendizaje automático y colecciones de datos. La propuesta tiene la ventaja adicional de requerir poco o ningún conocimiento sobre arquitecturas de aprendizaje automático dada las componentes de Auto-ML que incorpora. Todo esto lo convierte en una tecnología valiosa y conveniente de explotar. Más allá de los resultados obtenidos sobre la línea principal de investigación, se obtuvieron algunos resultados secundarios de gran valor. Por un lado, se pudo demostrar que ciertas componentes de la tecnología pueden utilizarse para extender, de forma más robusta, corpus de texto con entidades y relaciones anotadas, asumiendo que se cuente con varias versiones de anotación que se quieran combinar; esta condición suele ser viable dada la existencia de competencias internacionales donde varios participantes compiten por generar la mejor solución. Muy ligado a esto, otro resultado secundario es la generación del eHealth-KD 2019 ensembled corpus a partir de ensamblar las soluciones participantes de la competencia eHealth-KD 2019. Otro resultado secundario se tiene en la componente de anotación automática de atributos protegidos, la cual puede funcionar independiente del flujo end-to-end de automatización justa, y por tanto puede utilizarse como fase de preprocesamiento para otros sistemas de cuantificación o mitigación de sesgos. En ese sentido, se publicó también el corpus Reviews' Gender} diseñado para auxiliar el entrenamiento y evaluación de modelos de anotación de atributos protegidos con el fin de usar sus predicciones como estimadores de equidad. Todos los recursos desarrollados en esta investigación están a disposición pública de la comunidad científica. / Esta investigación ha sido desarrollada de forma conjunta en la Universidad de Alicante (España) y la Universidad de La Habana (Cuba), entre enero de 2020 y septiembre de 2023, en sucesivas estancias de investigación co-financiadas por ambas instituciones. La Universidad de Alicante, el Departamento de Lenguajes y Sistemas Informáticos ha soportado esta investigación a través de los proyectos TRIVIAL (PID2021-122263OB-C22), CORTEX (PID2021-123956OB-I00), CLEARTEXT (TED2021-130707B-I00), SOCIALTRUST (PDC2022-133146-C22), NL4DISMIS (CIPROM/2021/21) y VIVES (2022-TL22-00215334). La Universidad de La Habana, la Facultad de Matemática y Computación y el Departamento de Inteligencia Artificial y Sistemas Computacionales han soportado esta investigación.
|
3 |
Sesgos de género en el diagnóstico de las espondiloartritisJovaní, Vega 03 April 2019 (has links)
OBJETIVOS: Los estudios analizan desde la perspectiva de género el retraso diagnóstico y los sesgos de género en las espondiloartritis. Artículo 1: Objetivo principal: identificar la evidencia empírica del retraso diagnóstico en espondiloartritis. Objetivos específicos: determinar si existen diferencias por sexo, conducir un análisis desde la perspectiva de género de las posibles causas y valorar la calidad de los artículos. Artículo 2: Objetivo principal: identificar y cuantificar, con perspectiva de género el retraso diagnóstico en un grupo de pacientes con espondiloartritis. Objetivos secundarios: identificar si el retraso diagnóstico depende del paciente o del sistema sanitario, describir las manifestaciones clínicas al inicio de la enfermedad en ambos sexos, comparar las manifestaciones clínicas referidas por los paciente con lo expresado en la historia clínica por los reumatólogos, identificar los itinerarios sanitarios recorridos por los pacientes, identificar qué servicios remitieron a los pacientes a reumatología, identificar los diferentes diagnósticos recibidos antes del diagnóstico definitivo de la enfermedad. MÉTODO: Artículo 1: Revisión sistemática del retraso diagnóstico de las espondiloartritis en Medline y Embase. La calidad se evaluó con la declaración STROBE. Se realizó un meta-análisis de 13 artículos con datos desagregados por sexo para evaluar las diferencias por sexos en el retraso diagnóstico. El efecto global del retraso diagnóstico por sexo se calculó utilizando diferencia de medias vía modelo de efectos fijos. Artículo 2: Estudio trasversal de 96 hombres y 54 mujeres con espondiloartritis procedentes del Hospital General Universitario de Alicante. Se realizó una entrevista semi-estructurada y se revisaron las historias clínicas. Se efectuó análisis comparativo por sexo mediante T-student y tests Mann-Whitney U para variables continuas paramétricas y no paramétricas, tests chi-cuadrado y test exacto de Fisher para variables categóricas no pareadas y test de McNemar para las pareadas. RESULTADOS: Artículo 1: La revisión incluyó 23.883 pacientes (32.3% mujeres) procedentes de 42 artículos. No se detectaron diferencias significativas entre sexos en los síntomas al inicio de la enfermedad o durante su evolución. Sin embargo, la media para retraso diagnóstico de espondiloartritis mostró diferencias relacionadas con el sexo, siendo 8.8 (7.4-10.1) años para las mujeres y 6.5 (5.6-7.4) para hombres (p=0.01). Un 40% de los artículos tenían calidad alta. El meta-análisis incluyó 12.073 pacientes (31.2% mujeres). El efecto global medio fue D=0.6 (0.31-0.89) años, indicando que los hombres eran diagnosticados 0.60 años (7 meses) antes que las mujeres. Artículo 2: La mediana de retraso diagnóstico en mujeres 7.5 (11.5) años es superior a hombres 4 (11) años con una diferencia cercana a la significación estadística (p=0.053). Las mujeres y los hombres consultaron al mismo tiempo al inicio de la enfermedad por lo que el retraso es atribuible al sistema sanitario. Un total de 30.2% hombres recibieron un primer diagnóstico correcto frente a un 11.1% de las mujeres (p=0.016) lo que significa que los hombres tienen mayor probabilidad de no tener un diagnóstico erróneo (odds ratio=3.5; 1.3-9). Once servicios de salud remitieron a reumatología a los pacientes varones frente a solo seis en el caso de las mujeres. Los profesionales realizaron diagnósticos erróneos diferentes según el sexo de los pacientes. No se detectaron diferencias en las manifestaciones clínicas de dolor de espalda al inicio de la enfermedad según lo expresado por los pacientes. Sin embargo, en los registros médicos de detectaron diferencias (mujeres 44.4%, hombres 82.1%; p<0.001). En cuanto a afectación periférica, las mujeres presentaron más afectación que los hombres, tanto en los datos recogidos en la historia clínica (mujeres 55.6%, hombres 17.9%; p < 0.001) como en las manifestaciones expresadas por los pacientes (mujeres 57.7%, hombres 35.2%; p = 0.008). Pero en las historia clínicas se evidenció menos dolor periférico en hombres (17.9%) que lo expresado por ellos en las entrevistas (35.2%), (p<0.001). CONCLUSIÓN: Artículo 1: El retraso en el diagnóstico de las espondiloartritis persiste y es mayor en mujeres que en hombres. No hay diferencias significativas relacionadas con el sexo en los síntomas que puedan explicar las diferencias por sexo en el retraso diagnóstico. Los sesgos de publicación y metodológicos podrían dar lugar a una práctica clínica con sesgos de género. Artículo 2: El retraso diagnóstico en las espondiloartritis es superior en mujeres a pesar de no presentar diferencias clínicas de dolor axial en el inicio de la enfermedad. Se detectan sesgos de género probablemente por la falta de reconocimiento de esta enfermedad en las mujeres.
|
4 |
Mathematical modelling of the anchoring effect on the underconfidence bias / Modelado matemático del efecto del anclaje sobre el sesgo de subconfianzaMacbeth, Guillermo, Razumiejczyk, Eugenia 25 September 2017 (has links)
The anchoring effect is defined as the tendency of human thought to the fixation on certain pieces of information that affect decision-making. In the same context, the underconfidence bias is understood as an agent’s propensity to underestimate his or her own objective performance. While some aspects of these phenomena are well known, there are no formal models that specifically describe the relationship between both. This paper presents: i) an experiment that illustrates the anchoring effect on the underconfidence bias by both reducing and amplifying such bias in the domain of geographic decision tasks and ii) the foundations of a new mathematical model that promotes precision in the study of the relationship between anchoring and underconfidence. / Se define el efecto de anclaje como la tendencia del pensamiento humano a la fijación endeterminados fragmentos de información que afectan la toma de decisiones. El sesgo de subconfianza, por su parte, se entiende como la propensión de un agente a subestimar su desempeño objetivo. Si bien se conocen algunos aspectos de la interacción entre ambos efectos, no se dispone de modelos formales que describan tal relación específica. Este estudio presenta: i) un experimento que pone en evidencia el efecto que ejerce el anclaje tanto para reducir, como para amplificar la subconfianza en tareas de decisión geográfica y ii) los fundamentos de un modelo matemático novedoso que permite estudiar con mayor precisión la relación del anclaje con la subconfianza
|
5 |
Sesgos de género en investigación clínica, marketing farmacéutico y prescripción de medicamentos / Gender bias in clinical research, pharmaceutical marketing and the prescription of drugsChilet Rosell, Elisa 25 July 2012 (has links)
No description available.
|
6 |
Do surgimento à descrição: como o tempo e a extinção estão relacionados / From the origin to the description: how time and extinction are relatedSilva, Bruno Vilela de Moraes e 18 March 2016 (has links)
Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2017-02-02T12:36:32Z
No. of bitstreams: 2
Tese - Bruno Vilela de Moraes e Silva - 2016.pdf: 2908668 bytes, checksum: 88cc5e7beddd3698aef28d0ab94f3bd4 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-02-06T09:41:35Z (GMT) No. of bitstreams: 2
Tese - Bruno Vilela de Moraes e Silva - 2016.pdf: 2908668 bytes, checksum: 88cc5e7beddd3698aef28d0ab94f3bd4 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-02-06T09:41:35Z (GMT). No. of bitstreams: 2
Tese - Bruno Vilela de Moraes e Silva - 2016.pdf: 2908668 bytes, checksum: 88cc5e7beddd3698aef28d0ab94f3bd4 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016-03-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / La extinción es un proceso central en la evolución de las especies y como todo proceso biológico su complejidad es causada por la conjunción de factores actuantes y sus correspondientes interacciones. En esta tesis buscamos estudiar parte de esas causas, particularmente como el tiempo comprendido entre la descripción científica de una especie hasta la actualidad puede influir en nuestro conocimiento sobre la misma y su riesgo de extinción asociado. Desde las serpientes del nuevo mundo (primer capítulo) hasta diversos grupos animales de todo el mundo (segundo capítulo), enfocamos en como el tamaño del cuerpo, el rango de distribución geográfica y la abundancia relativa están generando una correlación entre el año en que una especie fue descripta, la cantidad de información y el riesgo de extinción. Mostramos como esas correlaciones pueden ocasionar errores en estudios correlativos y probables consecuencias negativas para el conocimiento de la biodiversidad, puesto que los resultados demuestran que se están perdiendo especies menos conocidas para la ciencia. En el tercer capítulo, indicamos como la edad del clado, juntamente con otras características evolutivas, influencian el riesgo de extinción actual en plantas ibéricas y mediterráneas, y como este efecto pude llevar a una pérdida desproporcional de historia evolutiva en la región. Presentamos un modelo teórico de como los patrones evolutivos del riesgo de extinción observados pueden ser explicados por la interacción con la historia biogeográfica.
Finalmente, agregamos herramientas para la obtención, manipulación y análisis de datos, que fueron usados en los diferentes capítulos de esta tesis, en un paquete de R, presentado en el último capítulo. Se ejemplifican sus funcionalidades al estudiar el patrón global del año de descripción en anfibios, mostrando el papel relativo de la influencia humana y el rango de distribución. / A extinção é um processo chave na evolução das espécies e, como a maior parte dos processos biológicos, envolve uma complexidade causada pela multiplicidade de fatores envolvidos e suas correspondentes interações. Nessa tese procuramos estudar nos dois primeiros capítulos parte
dessas causas, particularmente como o tempo compreendido entre a descrição científica de uma espécie até a atualidade pode influenciar o nosso conhecimento sobre a mesma e seu risco de extinção associado. Partindo das serpentes do Novo Mundo (primeiro capítulo) e depois ampliando os resultados a diversos grupos animais em um nível global (segundo capítulo), focamos em como o tamanho do corpo, a distribuição geográfica e a abundância estão gerando uma correlação entre o ano em que uma espécie foi descrita, sua informação associada e seu risco de extinção. Mostramos como isso pode ocasionar potenciais erros em estudos correlativos e prováveis consequências negativas para o conhecimento científico da biodiversidade, já que os resultados indicam que estamos perdendo as espécies menos conhecidas para a ciência. No terceiro capítulo, mostramos como a idade de uma espécie, juntamente com outras características evolutivas, influenciam o risco de extinção atual em plantas ibéricas e mediterrâneas, e como essa relação pode levar a uma perda desproporcional de história evolutiva na região. Apresentamos uma proposta teórica de como o padrão filogenético do risco de extinção observado pode ser explicado pela interação com a história biogeográfica. Por fim, agregamos uma série de ferramentas de obtenção, manipulação e análise dados macroecológicos desenvolvidas ao longo dos capítulos dessa tese em um pacote de R, apresentado no último capítulo. Exemplificamos a sua funcionalidade ao revelar o padrão global do ano de descrição em anfíbios, mostrando o papel relativo da influência humana e do tamanho da distribuição geográfica.
|
7 |
La presencia de sesgos de género en reclutadores y su repercusión en la imagen empresarialReátegui Belber, Gabriela 31 July 2020 (has links)
El presente trabajo analiza la presencia de sesgos de género en reclutadores y su repercusión en la imagen empresarial. Esta particularidad se origina cuando una persona tiene una inclinación o preferencia tanto para el femenino como masculino que, casi siempre, conlleva en perjudicar uno en específico. Esta inclinación ocurre en distintos aspectos de la persona, esencialmente donde se necesita del juicio crítico, por ejemplo, durante la etapa de Reclutamiento. Por ello, la utilización de esta desemejanza en este proceso laboral es suficiente para impactar en la imagen de la empresa. Esta investigación propone desarrollar un estudio cualitativo a empresas en Lima Metropolitana. Se realizarán 20 entrevistas en profundidad a reclutadores y 15 entrevistas simples a jóvenes que hayan pasado por un proceso de inducción en el último año, con la finalidad de analizar, comparar y evaluar las diferentes impresiones o imágenes de acuerdo al tema elegido. / This paper analyzes the presence of gender biases in recruiters and its repercussion on the business image. This distinction originates when a person has an inclination or preference for both the feminine and masculine that, almost always, leads to harming one in specific. This inclination occurs in different aspects of the person, essentially where critical judgment is needed, for example, during the Recruitment stage. Therefore, the use of this dissimilarity in this work process is enough to impact the image of the company. This research proposes to develop a qualitative study of companies in Metropolitan Lima. There will be 20 in-depth interviews with recruiters and 15 simple interviews with young people who have passed an induction process in the last year, in order to analyze, compare and evaluate the different impressions or images according to the chosen topic. / Trabajo de investigación
|
8 |
Essays on Health and Behavioral EconomicsMarín-López, Blas Ángel 27 September 2023 (has links)
En el primer capítulo, presentamos un marco teórico para investigar el papel de estos sesgos conductuales en el inicio de conductas de riesgo para la salud. En concreto, demostramos que los sesgos de los amigos en forma de fallos de autocontrol son una parte esencial de los efectos endógenos de contagio entre iguales. Ilustramos estos resultados utilizando datos de Add Health, que contiene información única sobre las redes de amistades de los adolescentes estadounidenses. Empíricamente, encontramos que la contribución del autocontrol de los amigos al comportamiento de riesgo para la salud de los estudiantes no es despreciable. Además, podemos identificar al jugador clave en este escenario. Este estudiante no siempre es el que tiene las medidas de centralidad más altas (no microfundamentadas) o el jugador más activo. Descubrimos que centrarse en el jugador clave conduce a una mayor reducción del comportamiento de riesgo para la salud agregado óptimo que una política centrada en el jugador más activo o en un jugador seleccionado al azar. En el segundo capítulo, utilizamos datos sobre la predisposición genética al TDAH de la encuesta Add Health en las escuelas de EE.UU. para descubrir los estándares relativos en el diagnóstico del TDAH. Estimamos que el rango ordinal de los estudiantes en la predisposición genética al TDAH entre sus compañeros del mismo género tiene un efecto causal positivo, estadísticamente significativo y sustancial en el diagnóstico del TDAH, manteniendo constante la propia predisposición genética de los estudiantes al TDAH. Este efecto está impulsado principalmente por los chicos, lo que contribuye a explicar la mayor tasa de diagnóstico observada en los chicos en relación con las chicas para una predisposición genética dada al TDAH. En el tercer capítulo, presentamos un modelo epidemiológico teórico-juego para la pandemia COVID-19 que tiene en cuenta que: 1) los individuos asintomáticos pueden ser contagiosos, 2) el contagio depende del comportamiento, 3) el comportamiento viene determinado por un juego que depende de las creencias y las interacciones sociales, 4) puede haber sesgos sistemáticos en las percepciones y creencias sobre la pandemia. Incorporamos al modelo las decisiones de bloqueo adoptadas por el gobierno. Las creencias de los ciudadanos y del gobierno pueden presentar varios sesgos que analizamos desde el punto de vista de la economía del comportamiento. Proporcionamos simulaciones para comprender el efecto de las decisiones de bloqueo y la posibilidad de "empujar" a los ciudadanos en la dirección correcta mejorando la exactitud de sus creencias.
|
9 |
Políticas de género y prácticas de marketing y publicidad que repercuten en la salud de las mujeresCambronero Saiz, Belén 11 June 2012 (has links)
No description available.
|
10 |
On the Keyword Extraction and Bias Analysis, Graph-based Exploration and Data Augmentation for Abusive Language Detection in Low-Resource SettingsPeña Sarracén, Gretel Liz de la 07 April 2024 (has links)
Tesis por compendio / [ES] La detección del lenguaje abusivo es una tarea que se ha vuelto cada vez más importante en la era digital moderna, donde la comunicación se produce a través de diversas plataformas en línea. El aumento de las interacciones en estas plataformas ha provocado un aumento de la aparición del lenguaje abusivo. Abordar dicho contenido es crucial para mantener un entorno en línea seguro e inclusivo.
Sin embargo, esta tarea enfrenta varios desafíos que la convierten en un área compleja y que demanda de continua investigación y desarrollo. En particular, detectar lenguaje abusivo en entornos con escasez de datos presenta desafíos adicionales debido a que el desarrollo de sistemas automáticos precisos a menudo requiere de grandes conjuntos de datos anotados.
En esta tesis investigamos diferentes aspectos de la detección del lenguaje abusivo, prestando especial atención a entornos con datos limitados. Primero, estudiamos el sesgo hacia palabras clave abusivas en modelos entrenados para la detección del lenguaje abusivo. Con este propósito, proponemos dos métodos para extraer palabras clave potencialmente abusivas de colecciones de textos. Luego evaluamos el sesgo hacia las palabras clave extraídas y cómo se puede modificar este sesgo para influir en el rendimiento de la detección del lenguaje abusivo. El análisis y las conclusiones de este trabajo revelan evidencia de que es posible mitigar el sesgo y que dicha reducción puede afectar positivamente el desempeño de los modelos. Sin embargo, notamos que no es posible establecer una correspondencia similar entre la variación del sesgo y el desempeño de los modelos cuando hay escasez datos con las técnicas de reducción del sesgo estudiadas.
En segundo lugar, investigamos el uso de redes neuronales basadas en grafos para detectar lenguaje abusivo. Por un lado, proponemos una estrategia de representación de textos diseñada con el objetivo de obtener un espacio de representación en el que los textos abusivos puedan distinguirse fácilmente de otros textos. Por otro lado, evaluamos la capacidad de redes neuronales convolucionales basadas en grafos para clasificar textos abusivos.
La siguiente parte de nuestra investigación se centra en analizar cómo el aumento de datos puede influir en el rendimiento de la detección del lenguaje abusivo. Para ello, investigamos dos técnicas bien conocidas basadas en el principio de minimización del riesgo en la vecindad de instancias originales y proponemos una variante para una de ellas. Además, evaluamos técnicas simples basadas en el reemplazo de sinónimos, inserción aleatoria, intercambio aleatorio y eliminación aleatoria de palabras.
Las contribuciones de esta tesis ponen de manifiesto el potencial de las redes neuronales basadas en grafos y de las técnicas de aumento de datos para mejorar la detección del lenguaje abusivo, especialmente cuando hay limitación de datos.
Estas contribuciones han sido publicadas en conferencias y revistas internacionales. / [CA] La detecció del llenguatge abusiu és una tasca que s'ha tornat cada vegada més important en l'era digital moderna, on la comunicació es produïx a través de diverses plataformes en línia. L'augment de les interaccions en estes plataformes ha provocat un augment de l'aparició de llenguatge abusiu. Abordar este contingut és crucial per a mantindre un entorn en línia segur i inclusiu.
No obstant això, esta tasca enfronta diversos desafiaments que la convertixen en una àrea complexa i contínua de recerca i desenvolupament. En particular, detectar llenguatge abusiu en entorns amb escassetat de dades presenta desafiaments addicionals pel fet que el desenvolupament de sistemes automàtics precisos sovint requerix de grans conjunts de dades anotades.
En esta tesi investiguem diferents aspectes de la detecció del llenguatge abusiu, prestant especial atenció a entorns amb dades limitades. Primer, estudiem el biaix cap a paraules clau abusives en models entrenats per a la detecció de llenguatge abusiu. Amb este propòsit, proposem dos mètodes per a extraure paraules clau potencialment abusives de col·leccions de textos. Després avaluem el biaix cap a les paraules clau extretes i com es pot modificar este biaix per a influir en el rendiment de la detecció de llenguatge abusiu. L'anàlisi i les conclusions d'este treball revelen evidència que és possible mitigar el biaix i que esta reducció pot afectar positivament l'acompliment dels models. No obstant això, notem que no és possible establir una correspondència similar entre la variació del biaix i l'acompliment dels models quan hi ha escassetat dades amb les tècniques de reducció del biaix estudiades.
En segon lloc, investiguem l'ús de xarxes neuronals basades en grafs per a detectar llenguatge abusiu. D'una banda, proposem una estratègia de representació textual dissenyada amb l'objectiu d'obtindre un espai de representació en el qual els textos abusius puguen distingir-se fàcilment d'altres textos. D'altra banda, avaluem la capacitat de models basats en xarxes neuronals convolucionals basades en grafs per a classificar textos abusius.
La següent part de la nostra investigació se centra en analitzar com l'augment de dades pot influir en el rendiment de la detecció del llenguatge abusiu. Per a això, investiguem dues tècniques ben conegudes basades en el principi de minimització del risc en el veïnatge d'instàncies originals i proposem una variant per a una d'elles. A més, avaluem tècniques simples basades en el reemplaçament de sinònims, inserció aleatòria, intercanvi aleatori i eliminació aleatòria de paraules.
Les contribucions d'esta tesi destaquen el potencial de les xarxes neuronals basades en grafs i de les tècniques d'augment de dades per a millorar la detecció del llenguatge abusiu, especialment quan hi ha limitació de dades.
Estes contribucions han sigut publicades en revistes i conferències internacionals. / [EN] Abusive language detection is a task that has become increasingly important in the modern digital age, where communication takes place via various online platforms. The increase in online interactions has led to an increase in the occurrence of abusive language. Addressing such content is crucial to maintaining a safe and inclusive online environment.
However, this task faces several challenges that make it a complex and ongoing area of research and development. In particular, detecting abusive language in environments with sparse data poses an additional challenge, since the development of accurate automated systems often requires large annotated datasets.
In this thesis we investigate different aspects of abusive language detection, paying particular attention to environments with limited data. First, we study the bias toward abusive keywords in models trained for abusive language detection. To this end, we propose two methods for extracting potentially abusive keywords from datasets. We then evaluate the bias toward the extracted keywords and how this bias can be modified in order to influence abusive language detection performance. The analysis and conclusions of this work reveal evidence that it is possible to mitigate the bias and that such a reduction can positively affect the performance of the models. However, we notice that it is not possible to establish a similar correspondence between bias mitigation and model performance in low-resource settings with the studied bias mitigation techniques.
Second, we investigate the use of models based on graph neural networks to detect abusive language. On the one hand, we propose a text representation framework designed with the aim of obtaining a representation space in which abusive texts can be easily distinguished from other texts. On the other hand, we evaluate the ability of models based on convolutional graph neural networks to classify abusive texts.
The next part of our research focuses on analyzing how data augmentation can influence the performance of abusive language detection. To this end, we investigate two well-known techniques based on the principle of vicinal risk minimization and propose a variant for one of them. In addition, we evaluate simple techniques based on the operations of synonym replacement, random insertion, random swap, and random deletion.
The contributions of this thesis highlight the potential of models based on graph neural networks and data augmentation techniques to improve abusive language detection, especially in low-resource settings.
These contributions have been published in several international conferences and journals. / This research work was partially funded by the Spanish Ministry of Science and Innovation under the research project MISMIS-FAKEnHATE on Misinformation and Miscommunication in social media: FAKE news and HATE speech (PGC2018-096212-B-C31). The authors thank also the EU-FEDER Comunitat Valenciana 2014-2020 grant IDIFEDER/2018/025. This work was done in the framework of the research project on Fairness
and Transparency for equitable NLP applications in social media, funded by MCIN/AEI/10.13039/501100011033 and by ERDF, EU A way of making
EuropePI. FairTransNLP research project (PID2021-124361OB-C31) funded by MCIN/AEI/10.13039/501100011033 and by ERDF, EU A way of making
Europe. Part of the work presented in this article was performed during the first author’s research visit to the University of Mannheim, supported
through a Contact Fellowship awarded by the DAAD scholarship program “STIBET Doktoranden”. / Peña Sarracén, GLDL. (2024). On the Keyword Extraction and Bias Analysis, Graph-based Exploration and Data Augmentation for Abusive Language Detection in Low-Resource Settings [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/203266 / Compendio
|
Page generated in 0.0366 seconds