Global ETD Search

191	Facing-up Challenges of Multiobjective Clustering Based on Evolutionary Algorithms: Representations, Scalability and Retrieval Solutions García Piquer, Álvaro 13 April 2012 (has links) Aquesta tesi es centra en algorismes de clustering multiobjectiu, que estan basats en optimitzar varis objectius simultàniament obtenint una col•lecció de solucions potencials amb diferents compromisos entre objectius. El propòsit d'aquesta tesi consisteix en dissenyar i implementar un nou algorisme de clustering multiobjectiu basat en algorismes evolutius per afrontar tres reptes actuals relacionats amb aquest tipus de tècniques. El primer repte es centra en definir adequadament l'àrea de possibles solucions que s'explora per obtenir la millor solució i que depèn de la representació del coneixement. El segon repte consisteix en escalar el sistema dividint el conjunt de dades original en varis subconjunts per treballar amb menys dades en el procés de clustering. El tercer repte es basa en recuperar la solució més adequada tenint en compte la qualitat i la forma dels clusters a partir de la regió més interessant de la col•lecció de solucions ofertes per l’algorisme. / Esta tesis se centra en los algoritmos de clustering multiobjetivo, que están basados en optimizar varios objetivos simultáneamente obteniendo una colección de soluciones potenciales con diferentes compromisos entre objetivos. El propósito de esta tesis consiste en diseñar e implementar un nuevo algoritmo de clustering multiobjetivo basado en algoritmos evolutivos para afrontar tres retos actuales relacionados con este tipo de técnicas. El primer reto se centra en definir adecuadamente el área de posibles soluciones explorada para obtener la mejor solución y que depende de la representación del conocimiento. El segundo reto consiste en escalar el sistema dividiendo el conjunto de datos original en varios subconjuntos para trabajar con menos datos en el proceso de clustering El tercer reto se basa en recuperar la solución más adecuada según la calidad y la forma de los clusters a partir de la región más interesante de la colección de soluciones ofrecidas por el algoritmo. / This thesis is focused on multiobjective clustering algorithms, which are based on optimizing several objectives simultaneously obtaining a collection of potential solutions with different trade¬offs among objectives. The goal of the thesis is to design and implement a new multiobjective clustering technique based on evolutionary algorithms for facing up three current challenges related to these techniques. The first challenge is focused on successfully defining the area of possible solutions that is explored in order to find the best solution, and this depends on the knowledge representation. The second challenge tries to scale-up the system splitting the original data set into several data subsets in order to work with less data in the clustering process. The third challenge is addressed to the retrieval of the most suitable solution according to the quality and shape of the clusters from the most interesting region of the collection of solutions returned by the algorithm. Mineria de dades Clustering Algoritmes evolutius Clustering Multiobjectiu Grans Volums de Dades Minería de datos Algoritmos evolutivos Clustering Multiobjetivo Grandes Volúmenes de Datos Data Mining Evolutionary Algorithms Multiobjective Clustering Large Data Les TIC i la seva gestió 004
192	Descoberta do desânimo de alunos em ambientes virtuais de ensino e aprendizagem : um modelo a partir da mineração de dados educacionais Santos, Fabricia Damando January 2016 (has links) A presente pesquisa aborda uma investigação interdisciplinar (Educação e Computação) sobre estudos que estabeleceram como foco a influência da afetividade na educação e sobre como reconhecer o desânimo do aluno em interação em um ambiente virtual de ensino e aprendizagem (AVEA) utilizando mineração de dados educacionais (MDE). A afetividade pode influenciar na aprendizagem do aluno, principalmente com relação aos aspectos negativos, frustrações, sensações de solidão, desânimo, fazendo com que o aluno possa, inclusive, desistir de um curso, tornando-se uma problemática no ensino. Identificar esses aspectos em cursos à distância torna-se desafiador para o professor devido à distância temporal e assincronicidade desse meio. Nos cursos à distância, essa possibilidade pode ser permitida através das análises dos dados das interações do aluno no ambiente, porém, o volume de dados existentes torna-se muito grande para ser analisado pelo professor, fazendo com que seja mais difícil realizar essa identificação. Na busca por identificar o estado de ânimo desanimado, esta tese apresenta um Modelo de Predição do Desânimo baseado em comportamento observável e autorrelato armazenados em AVEA, utilizando regras de associação. Para desenvolver o Modelo de Predição do aluno, as variáveis comportamentais indicadoras do desânimo foram evidenciadas na pesquisa, bem como a utilização dos fundamentos e instrumento de Scherer para identificação dos estados afetivos, mais precisamente do estado de ânimo desanimado, que duram por longos períodos, possibilitando sua identificação após determinados fatos terem ocorrido no processo de aprendizagem, o que possibilitou ter uma metodologia de acompanhamento do aluno. As regras de associação foram descobertas devido ao potencial da MDE, que, além de propiciar a inferência e predição, pode ser usada para fornecer apoio tanto ao professor, no processo de ensino e acompanhamento do aluno, quanto ao aluno, no processo de aprendizagem. Nesse contexto, a pesquisa é aplicada ao processo de ensino e aprendizagem utilizando como procedimento técnico experimentos para coleta de dados. Foram feitos experimentos com aplicação de técnicas computacionais para apoio à inferência e geração do modelo de predição. Em cada experimento onde se aplicou a MDE, as melhores regras foram escolhidas com base nas medidas de interesse e presença do estado de ânimo desanimado. A partir dessas melhores regras, uma validação foi realizada em um novo experimento propondo o Modelo de Predição do aluno desanimado em interação no AVEA Moodle. Além de apresentar o Modelo de Predição do Aluno Desanimado, este modelo foi implementado e integrado como ferramenta computacional à plataforma Moodle. A pesquisa justifica-se na medida em que apresenta inovação tecnológica para investigar a influência da afetividade na aprendizagem dentro do contexto da Educação a Distância (EAD) e aplica técnicas computacionais desenvolvendo um Modelo de Predição do Aluno Desanimado, que fornece para o professor uma visão geral do modelo e melhor acompanhamento de seus alunos, através de dashboard, contribuindo na sua prática docente. Logo, a tese apresenta como destaque inovador um produto de pesquisa com utilidade na prática docente no ensino superior, principalmente em cursos EAD, para o reconhecimento de aspectos relacionados à afetividade no contexto educacional. Através da ferramenta computacional, um melhor acompanhamento de alunos desanimados em interação em AVEA pode ser feito pelo professor, permitindo a este fomentar uma metodologia de acompanhamento desses alunos, a fim de minimizar futuras evasões, bem como desistências em cursos e disciplinas, beneficiando a comunidade acadêmica. / This research addresses an interdisciplinary research (Education and Computer) on studies that established focus on the influence of affectivity in education and how to recognize the dismay of student interaction in a virtual teaching and learning environment (VTLE) using educational data mining (EDM). Affection can influence student learning, particularly with respect to the negative, frustration, feelings of loneliness, discouragement, causing the student can even give up a course, becoming a problematic teaching. Identify these aspects in distance courses becomes challenging for the teacher due to the temporal distance and asynchronicity that medium. In distance learning courses, this possibility may be permitted by the data analysis of student interactions in the environment, however, the amount of data becomes too large to be analyzed by the teacher, making it more difficult to carry out such identification. In seeking to identify the state of despondent mood, this thesis presents a prediction model of the observable behavior-based Discouragement and self-report stored in VTLE using association rules. To develop the prediction model student, the indicator behavioral variables of discouragement were evident in the research, and the use of the grounds and Scherer tool to identify the affective states, specifically the state of despondent mood that last for long periods, enabling identification after certain events have occurred in the learning process, making it possible to have a follow-up methodology of the student. Association rules were discovered due to the potential of the EAW, which, besides providing the inference and prediction, can be used to provide support to both the teacher in the teaching and monitoring of the student as the student in the learning process. In this context, the research is applied to the teaching and learning process using as a technical procedure experiments to collect data. experiments were made with application of computational techniques to support the inference and generation of the prediction model. In each experiment where we applied the MED, the best rules were chosen based on measures of interest and presence in the state of despondent mood. From these best rules, a validation was performed on a new experiment proposing the Prediction Model discouraged student interaction in VTLE Moodle. In addition to presenting the Prediction Model of Student Discouraged, this model was implemented and integrated as a computational tool to the Moodle platform. The research is justified in that it presents technological innovation to investigate the influence of affect on learning within the education context Distance Learning and applies computational techniques developing a prediction model Discouraged Student, which provides for the teacher a view general model and better monitoring of their students through dashboard, contributing to their teaching practice. Therefore, the thesis shows how innovative highlight a research product to use in teaching practice in higher education, especially in distance education courses, for the recognition of aspects related to affectivity in the educational context. Through computational tool for better monitoring of disheartened students interacting in VTLE it can be done by the teacher, allowing him to promote a follow-up methodology of these students in order to minimize future evasions and dropouts courses and disciplines, benefiting the community academic. / Esta investigación se ocupa de una investigación interdisciplinaria (Educación e Informática) en los que se estableció el enfoque sobre la influencia de la afectividad en la educación y cómo reconocer la consternación de la interacción del estudiante en un entorno virtual de enseñanza aprendizaje (AVEA) utilizando la minería de datos educativa (MDE). El afecto puede influir en el aprendizaje del estudiante, en particular con respecto a la negativa, frustración, sentimientos de soledad, desánimo, haciendo que el estudiante puede incluso renunciar a un curso, convirtiéndose en una enseñanza problemática. Identificar estos aspectos en los cursos a distancia se convierte en un reto para el maestro debido a la distancia temporal y asincronía ese medio. En los cursos de enseñanza a distancia, esta posibilidad puede ser permitido por el análisis de los datos de las interacciones de los estudiantes en el ambiente, sin embargo, la cantidad de datos es demasiado grande para ser analizados por el profesor, lo que hace más difícil llevar a cabo dicha identificación. Al tratar de identificar el estado de ánimo deprimido, esta tesis presenta un modelo de predicción del desaliento observables basada en el comportamiento y auto-informe almacenado en AVEA las reglas de asociación. Para desarrollar el estudiante modelo de predicción, las variables de comportamiento del indicador de desaliento eran evidentes en la investigación, y el uso de los terrenos y Scherer herramienta para identificar los estados afectivos, específicamente el estado de ánimo deprimido que duran por largos períodos de tiempo, que permite la identificación después de ciertos acontecimientos se han producido en el proceso de aprendizaje, por lo que es posible tener una metodología de seguimiento del estudiante. Reglas de asociación fueron descubiertos debido al potencial de la orden de detención europea, que, además de proporcionar la inferencia y la predicción, se puede utilizar para proporcionar apoyo tanto a la maestra en la enseñanza y el seguimiento del alumno como estudiante en el proceso de aprendizaje. En este contexto, la investigación se aplica al proceso de enseñanza y aprendizaje mediante experimentos como un procedimiento técnico para recopilar datos. experimentos se hicieron con la aplicación de técnicas computacionales para apoyar la inferencia y la generación del modelo de predicción. En cada experimento en el que se aplicó el MDE, las mejores reglas fueron elegidos en base a medidas de interés y presencia en el estado de ánimo deprimido. A partir de estas mejores reglas, una validación se realizó en un nuevo experimento que propone la interacción de los estudiantes desalentado modelo de predicción de AVEA Moodle. Además de presentar el Modelo de Predicción del Estudiante Desalentado, este modelo fue implementado e integrado como una herramienta computacional para la plataforma Moodle. La investigación se justifica porque presenta la innovación tecnológica para investigar la influencia del efecto sobre el aprendizaje en el contexto de la educación a distancia (EAD) y aplica técnicas computacionales en desarrollo un modelo de predicción de Estudiantes Desalentado, que prevé el profesor una vista modelo general y un mejor seguimiento de sus estudiantes a través de tablero de instrumentos, contribuyendo a su práctica docente. Por lo tanto, la tesis muestra cómo destacado innovador de un producto de investigación a utilizar en la práctica docente en la enseñanza superior, sobre todo en los cursos de educación a distancia, para el reconocimiento de los aspectos relacionados con la afectividad en el contexto educativo. A través de la herramienta computacional para un mejor seguimiento de los estudiantes desanimados que interactúan en AVEA se puede hacer por el profesor, lo que le permite promover una metodología de seguimiento de estos estudiantes con el fin de reducir al mínimo las evasivas y abandonos futuros cursos y disciplinas, en beneficio de la comunidad académica. Computação Affective computing Discouragement Educational data mining Computación afectiva El desánimo La minería de datos para la educación
193	Descoberta do desânimo de alunos em ambientes virtuais de ensino e aprendizagem : um modelo a partir da mineração de dados educacionais Santos, Fabricia Damando January 2016 (has links) A presente pesquisa aborda uma investigação interdisciplinar (Educação e Computação) sobre estudos que estabeleceram como foco a influência da afetividade na educação e sobre como reconhecer o desânimo do aluno em interação em um ambiente virtual de ensino e aprendizagem (AVEA) utilizando mineração de dados educacionais (MDE). A afetividade pode influenciar na aprendizagem do aluno, principalmente com relação aos aspectos negativos, frustrações, sensações de solidão, desânimo, fazendo com que o aluno possa, inclusive, desistir de um curso, tornando-se uma problemática no ensino. Identificar esses aspectos em cursos à distância torna-se desafiador para o professor devido à distância temporal e assincronicidade desse meio. Nos cursos à distância, essa possibilidade pode ser permitida através das análises dos dados das interações do aluno no ambiente, porém, o volume de dados existentes torna-se muito grande para ser analisado pelo professor, fazendo com que seja mais difícil realizar essa identificação. Na busca por identificar o estado de ânimo desanimado, esta tese apresenta um Modelo de Predição do Desânimo baseado em comportamento observável e autorrelato armazenados em AVEA, utilizando regras de associação. Para desenvolver o Modelo de Predição do aluno, as variáveis comportamentais indicadoras do desânimo foram evidenciadas na pesquisa, bem como a utilização dos fundamentos e instrumento de Scherer para identificação dos estados afetivos, mais precisamente do estado de ânimo desanimado, que duram por longos períodos, possibilitando sua identificação após determinados fatos terem ocorrido no processo de aprendizagem, o que possibilitou ter uma metodologia de acompanhamento do aluno. As regras de associação foram descobertas devido ao potencial da MDE, que, além de propiciar a inferência e predição, pode ser usada para fornecer apoio tanto ao professor, no processo de ensino e acompanhamento do aluno, quanto ao aluno, no processo de aprendizagem. Nesse contexto, a pesquisa é aplicada ao processo de ensino e aprendizagem utilizando como procedimento técnico experimentos para coleta de dados. Foram feitos experimentos com aplicação de técnicas computacionais para apoio à inferência e geração do modelo de predição. Em cada experimento onde se aplicou a MDE, as melhores regras foram escolhidas com base nas medidas de interesse e presença do estado de ânimo desanimado. A partir dessas melhores regras, uma validação foi realizada em um novo experimento propondo o Modelo de Predição do aluno desanimado em interação no AVEA Moodle. Além de apresentar o Modelo de Predição do Aluno Desanimado, este modelo foi implementado e integrado como ferramenta computacional à plataforma Moodle. A pesquisa justifica-se na medida em que apresenta inovação tecnológica para investigar a influência da afetividade na aprendizagem dentro do contexto da Educação a Distância (EAD) e aplica técnicas computacionais desenvolvendo um Modelo de Predição do Aluno Desanimado, que fornece para o professor uma visão geral do modelo e melhor acompanhamento de seus alunos, através de dashboard, contribuindo na sua prática docente. Logo, a tese apresenta como destaque inovador um produto de pesquisa com utilidade na prática docente no ensino superior, principalmente em cursos EAD, para o reconhecimento de aspectos relacionados à afetividade no contexto educacional. Através da ferramenta computacional, um melhor acompanhamento de alunos desanimados em interação em AVEA pode ser feito pelo professor, permitindo a este fomentar uma metodologia de acompanhamento desses alunos, a fim de minimizar futuras evasões, bem como desistências em cursos e disciplinas, beneficiando a comunidade acadêmica. / This research addresses an interdisciplinary research (Education and Computer) on studies that established focus on the influence of affectivity in education and how to recognize the dismay of student interaction in a virtual teaching and learning environment (VTLE) using educational data mining (EDM). Affection can influence student learning, particularly with respect to the negative, frustration, feelings of loneliness, discouragement, causing the student can even give up a course, becoming a problematic teaching. Identify these aspects in distance courses becomes challenging for the teacher due to the temporal distance and asynchronicity that medium. In distance learning courses, this possibility may be permitted by the data analysis of student interactions in the environment, however, the amount of data becomes too large to be analyzed by the teacher, making it more difficult to carry out such identification. In seeking to identify the state of despondent mood, this thesis presents a prediction model of the observable behavior-based Discouragement and self-report stored in VTLE using association rules. To develop the prediction model student, the indicator behavioral variables of discouragement were evident in the research, and the use of the grounds and Scherer tool to identify the affective states, specifically the state of despondent mood that last for long periods, enabling identification after certain events have occurred in the learning process, making it possible to have a follow-up methodology of the student. Association rules were discovered due to the potential of the EAW, which, besides providing the inference and prediction, can be used to provide support to both the teacher in the teaching and monitoring of the student as the student in the learning process. In this context, the research is applied to the teaching and learning process using as a technical procedure experiments to collect data. experiments were made with application of computational techniques to support the inference and generation of the prediction model. In each experiment where we applied the MED, the best rules were chosen based on measures of interest and presence in the state of despondent mood. From these best rules, a validation was performed on a new experiment proposing the Prediction Model discouraged student interaction in VTLE Moodle. In addition to presenting the Prediction Model of Student Discouraged, this model was implemented and integrated as a computational tool to the Moodle platform. The research is justified in that it presents technological innovation to investigate the influence of affect on learning within the education context Distance Learning and applies computational techniques developing a prediction model Discouraged Student, which provides for the teacher a view general model and better monitoring of their students through dashboard, contributing to their teaching practice. Therefore, the thesis shows how innovative highlight a research product to use in teaching practice in higher education, especially in distance education courses, for the recognition of aspects related to affectivity in the educational context. Through computational tool for better monitoring of disheartened students interacting in VTLE it can be done by the teacher, allowing him to promote a follow-up methodology of these students in order to minimize future evasions and dropouts courses and disciplines, benefiting the community academic. / Esta investigación se ocupa de una investigación interdisciplinaria (Educación e Informática) en los que se estableció el enfoque sobre la influencia de la afectividad en la educación y cómo reconocer la consternación de la interacción del estudiante en un entorno virtual de enseñanza aprendizaje (AVEA) utilizando la minería de datos educativa (MDE). El afecto puede influir en el aprendizaje del estudiante, en particular con respecto a la negativa, frustración, sentimientos de soledad, desánimo, haciendo que el estudiante puede incluso renunciar a un curso, convirtiéndose en una enseñanza problemática. Identificar estos aspectos en los cursos a distancia se convierte en un reto para el maestro debido a la distancia temporal y asincronía ese medio. En los cursos de enseñanza a distancia, esta posibilidad puede ser permitido por el análisis de los datos de las interacciones de los estudiantes en el ambiente, sin embargo, la cantidad de datos es demasiado grande para ser analizados por el profesor, lo que hace más difícil llevar a cabo dicha identificación. Al tratar de identificar el estado de ánimo deprimido, esta tesis presenta un modelo de predicción del desaliento observables basada en el comportamiento y auto-informe almacenado en AVEA las reglas de asociación. Para desarrollar el estudiante modelo de predicción, las variables de comportamiento del indicador de desaliento eran evidentes en la investigación, y el uso de los terrenos y Scherer herramienta para identificar los estados afectivos, específicamente el estado de ánimo deprimido que duran por largos períodos de tiempo, que permite la identificación después de ciertos acontecimientos se han producido en el proceso de aprendizaje, por lo que es posible tener una metodología de seguimiento del estudiante. Reglas de asociación fueron descubiertos debido al potencial de la orden de detención europea, que, además de proporcionar la inferencia y la predicción, se puede utilizar para proporcionar apoyo tanto a la maestra en la enseñanza y el seguimiento del alumno como estudiante en el proceso de aprendizaje. En este contexto, la investigación se aplica al proceso de enseñanza y aprendizaje mediante experimentos como un procedimiento técnico para recopilar datos. experimentos se hicieron con la aplicación de técnicas computacionales para apoyar la inferencia y la generación del modelo de predicción. En cada experimento en el que se aplicó el MDE, las mejores reglas fueron elegidos en base a medidas de interés y presencia en el estado de ánimo deprimido. A partir de estas mejores reglas, una validación se realizó en un nuevo experimento que propone la interacción de los estudiantes desalentado modelo de predicción de AVEA Moodle. Además de presentar el Modelo de Predicción del Estudiante Desalentado, este modelo fue implementado e integrado como una herramienta computacional para la plataforma Moodle. La investigación se justifica porque presenta la innovación tecnológica para investigar la influencia del efecto sobre el aprendizaje en el contexto de la educación a distancia (EAD) y aplica técnicas computacionales en desarrollo un modelo de predicción de Estudiantes Desalentado, que prevé el profesor una vista modelo general y un mejor seguimiento de sus estudiantes a través de tablero de instrumentos, contribuyendo a su práctica docente. Por lo tanto, la tesis muestra cómo destacado innovador de un producto de investigación a utilizar en la práctica docente en la enseñanza superior, sobre todo en los cursos de educación a distancia, para el reconocimiento de los aspectos relacionados con la afectividad en el contexto educativo. A través de la herramienta computacional para un mejor seguimiento de los estudiantes desanimados que interactúan en AVEA se puede hacer por el profesor, lo que le permite promover una metodología de seguimiento de estos estudiantes con el fin de reducir al mínimo las evasivas y abandonos futuros cursos y disciplinas, en beneficio de la comunidad académica. Computação Affective computing Discouragement Educational data mining Computación afectiva El desánimo La minería de datos para la educación
194	Método de evaluación de variables e indicadores para el proceso de Bloque de Cirugía utilizando Process Mining y Data Visualization / Evaluation method of variables and indicators for Surgery Block process using Process Mining and Data Visualization Rojas Candio, Piero Gilmar, Villantoy Pasapera, Arturo Alonso 06 June 2020 (has links) El presente trabajo consiste en proponer un método que permita formular y evaluar indicadores de Process Mining a través de preguntas relacionadas al funcionamiento de un proceso y permita comprender de manera sencilla las variables del proceso a través de técnicas de Data Visualization. Esta propuesta identifica cuellos de botella y violaciones de políticas de un proceso crítico en una organización de salud, ya que resulta complicado realizar mediciones y análisis para mejorar la calidad y transformación de los procesos en instituciones de atención en el sector salud. Este resultado contribuye a la mejora y optimización de la toma de decisiones por parte del equipo médico del Bloque de Cirugía. Este método está conformado por ocho actividades: 1. Definición de objetivos y preguntas, 2. Extracción de datos, 3. Preprocesamiento de datos, 4. Inspección de registro y patrón, 5. Análisis de Minería de Procesos, 6. Técnicas de Visualización de Datos, 7. Evaluación de resultados y 8. Propuestas de mejora de procesos. / In the present work, we proposed a method that allows us to formulate and evaluate Process Mining indicators through questions related to the process traceability, and to bring about a clear understanding of the process variables through Data Visualization techniques. This proposal identifies bottlenecks and violations of policies that arise due to the difficulty of carrying out measurements and analysis for the improvement of process quality assurance and process transformation. The result contributes to the optimization of decision-making by the medical staff involved in the Surgery Block process. This method is divided into eight fundamental activities: 1. Objectives and question definition, 2. Data extraction, 3. Data preprocessing, 4. Registration and pattern inspection, 5. Process mining analysis, 6. Data visualization techniques, 7. Outcome evaluation, and 8. Process improvement approaches. / Trabajo de investigación Minería de datos Visualización de datos Proceso de negocio Cuidado de salud Variables médicas Process mining Data visualization Business processes Healthcare Medical variables
195	Information Retrieval Based on DOM Trees Alarte Aleixandre, Julián 14 September 2023 (has links) [ES] Desde hace varios años, la cantidad de información disponible en la web crece de manera exponencial. Cada día se genera una gran cantidad de información que prácticamente de inmediato está disponible en la web. Los buscadores e indexadores recorren diariamente la web para encontrar toda esa información que se ha ido añadiendo y así, ponerla a disposición del usuario devolviéndola en los resultados de las búsquedas. Sin embargo, la cantidad de información es tan grande que debe ser preprocesada con anterioridad. Dado que el usuario que realiza una búsqueda de información solamente está interesado en la información relevante, no tiene sentido que los buscadores e indexadores procesen el resto de elementos de las páginas web. El procesado de elementos irrelevantes de páginas web supone un gasto de recursos innecesario, como por ejemplo espacio de almacenamiento, tiempo de procesamiento, uso de ancho de banda, etc. Se estima que entre el 40% y el 50% del contenido de las páginas web son elementos irrelevantes. Por eso, en los últimos 20 años se han desarrollado técnicas para la detección de elementos tanto relevantes como irrelevantes de páginas web. Este objetivo se puede abordar de diversas maneras, por lo que existen técnicas diametralmente distintas para afrontar el problema. Esta tesis se centra en el desarrollo de técnicas basadas en árboles DOM para la detección de diversas partes de las páginas web, como son el contenido principal, la plantilla, y el menú. La mayoría de técnicas existentes se centran en la detección de texto dentro del contenido principal de las páginas web, ya sea eliminando la plantilla de dichas páginas o detectando directamente el contenido principal. Las técnicas que proponemos no sólo son capaces de realizar la extracción de texto, sino que, bien por eliminación de plantilla o bien por detección del contenido principal, son capaces de aislar cualquier elemento relevante de las páginas web, como por ejemplo imágenes, animaciones, videos, etc. Dichas técnicas no sólo son útiles para buscadores y rastreadores, sino que también pueden ser útiles directamente para el usuario que navega por la web. Por ejemplo, en el caso de usuarios con diversidad funcional (como sería una ceguera) puede ser interesante la eliminación de elementos irrelevantes para facilitar la lectura (o escucha) de las páginas web. Para hacer las técnicas accesibles a todo el mundo, las hemos implementado como extensiones del navegador, y son compatibles con navegadores basados en Mozilla o en Chromium. Además, estas herramientas están públicamente disponibles para que cualquier persona interesada pueda acceder a ellas y continuar con la investigación si así lo deseara. / [CA] Des de fa diversos anys, la quantitat d'informació disponible en la web creix de manera exponencial. Cada dia es genera una gran quantitat d'informació que immediatament es posa disponible en la web. Els cercadors i indexadors recorren diàriament la web per a trobar tota aqueixa informació que s'ha anat afegint i així, posar-la a la disposició de l'usuari retornant-la en els resultats de les cerques. No obstant això, la quantitat d'informació és tan gran que aquesta ha de ser preprocessada. Atés que l'usuari que realitza una cerca d'informació solament es troba interessat en la informació rellevant, no té sentit que els cercadors i indexadors processen la resta d'elements de les pàgines web. El processament d'elements irrellevants de pàgines web suposa una despesa de recursos innecessària, com per exemple espai d'emmagatzematge, temps de processament, ús d'amplada de banda, etc. S'estima que entre el 40% i el 50% del contingut de les pàgines web són elements irrellevants. Precisament per això, en els últims 20 anys s'han desenvolupat tècniques per a la detecció d'elements tant rellevants com irrellevants de pàgines web. Aquest objectiu es pot afrontar de diverses maneres, per la qual cosa existeixen tècniques diametralment diferents per a afrontar el problema. Aquesta tesi se centra en el desenvolupament de tècniques basades en arbres DOM per a la detecció de diverses parts de les pàgines web, com són el contingut principal, la plantilla, i el menú. La majoria de tècniques existents se centren en la detecció de text dins del contingut principal de les pàgines web, ja siga eliminant la plantilla d'aquestes pàgines o detectant directament el contingut principal. Les tècniques que hi proposem no sols són capaces de realitzar l'extracció de text, sinó que, bé per eliminació de plantilla o bé per detecció del contingut principal, són capaços d'aïllar qualsevol element rellevant de les pàgines web, com per exemple imatges, animacions, vídeos, etc. Aquestes tècniques no sols són útils per a cercadors i rastrejadors, sinó també poden ser útils directament per a l'usuari que navega per la web. Per exemple, en el cas d'usuaris amb diversitat funcional (com ara una ceguera) pot ser interessant l'eliminació d'elements irrellevants per a facilitar-ne la lectura (o l'escolta) de les pàgines web. Per a fer les tècniques accessibles a tothom, les hem implementades com a extensions del navegador, i són compatibles amb navegadors basats en Mozilla i en Chromium. A més, aquestes eines estan públicament disponibles perquè qualsevol persona interessada puga accedir a elles i continuar amb la investigació si així ho desitjara. / [EN] For several years, the amount of information available on the Web has been growing exponentially. Every day, a huge amount of data is generated and it is made immediately available on the Web. Indexers and crawlers browse the Web daily to find the new information that has been added, and they make it available to answer the users' search queries. However, the amount of information is so huge that it must be preprocessed. Given that users are only interested in the relevant information, it is not necessary for indexers and crawlers to process other boilerplate, redundant or useless elements of the web pages. Processing such irrelevant elements lead to an unnecessary waste of resources, such as storage space, runtime, bandwidth, etc. Different studies have shown that between 40% and 50% of the data on the Web are noisy elements. For this reason, several techniques focused on the detection of both, relevant and irrelevant data, have been developed over the last 20 years. The problems of identifying the relevant content of a web page, its template, its menu, etc. can be faced in various ways, and for this reason, there exist completely different techniques to address those problems. This thesis is focused on the development of information retrieval techniques based on DOM trees. Its goal is to detect different parts of a web page, such as the main content, the template, and the main menu. Most of the existing techniques are focused on the detection of text inside the main content of the web pages, mainly by removing the template of the web page or by inferring the main content. The techniques proposed in this thesis do not only extract text by eliminating the template or inferring the main content, but also extract any other relevant information from web pages such as images, animations, videos, etc. Our techniques are not only useful for indexers and crawlers but also for the user browsing the Web. For instance, in the case of users with functional diversity problems (such as blindness), removing noisy elements can facilitate them to read (or listen to) the web pages. To make the techniques broadly accessible to everybody, we have implemented them as browser extensions, which are compatible with Mozilla-based and Chromium-based browsers. In addition, these tools are publicly available, so any interested person can access them and continue with the research if they wish to do so. / Alarte Aleixandre, J. (2023). Information Retrieval Based on DOM Trees [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/196679 Detección de bloques Extracción de contenidos Detección de plantillas Minería web Minería de datos Detección de menús Web Procesamiento de datos DOM tree Data mining Web mining Template detection Content extraction Block detection Web menu detection Web content mining LENGUAJES Y SISTEMAS INFORMATICOS
196	Arquitectura para analíticas de datos orientada a la ayuda del proceso de la toma de decisiones Kauffmann, Erick 16 January 2020 (has links) Internet ha ayudado a revolucionar muchas actividades cotidianas, y en ellas se generan grandes cantidades de datos, muchos de ellos expresados por los usuarios en lenguaje natural. Son datos no estructurados que no son fáciles de procesar ni de organizar. Obtener información relevante de esos datos puede ayudar a conocer un entorno, organizarlo y/o tomar decisiones respecto al conocimiento que se adquiere con ellos. Para esto, en esta tesis doctoral se propone una arquitectura para analíticas de datos a través de las herramientas de procesamiento de lenguaje natural para transformar esos datos en información cuantitativa que permitirá tomar decisiones y/o organizar mejor la información. La arquitectura se ha probado en dos áreas en los que se genera un gran volumen de datos textuales en actividades diarias que se realizan actualmente por Internet: Comercio electrónico y Foros de discusión de cursos masivos abiertos en línea. En las redes sociales de comercio electrónico, diariamente los compradores generan una gran cantidad de revisiones y calificaciones acerca de los productos en venta. Estas evaluaciones contienen información importante que puede ser utilizada para mejorar la toma de decisiones de directivos y compradores. El reto principal es automáticamente extraer información fiable de las opiniones textuales de los consumidores y utilizarla para calificar los mejores productos o marcas. Se utilizan herramientas de Análisis de Sentimientos y detección de Revisiones Falsas (Fake Reviews) para ayudar tanto a usuarios como a empresarios en la toma de decisiones respecto a los productos afectados por esas opiniones. Para ello, se propone transformar las opiniones de los usuarios en una nueva variable cuantitativa empleando Análisis de Sentimiento, así como detectar y eliminar las Revisiones Falsas. La propuesta se ha evaluado sobre productos de electrónica para clasificar la imagen de la marca de acuerdo al sentimiento expresado por el consumidor y mostrar el comportamiento en cuadros de mandos. Otra actividad que ha hecho uso del Internet es el aprendizaje en línea como una respuesta a las nuevas necesidades educativas. Sin embargo, presenta muchos retos, tales como el procesamiento de la gran cantidad de datos que se genera en los foros en línea. Darle seguimiento y buscar información en ese volumen de datos puede ser contraproducente, dado que son datos no estructurados y de una gran variedad de temas. La arquitectura propuesta en esta tesis propone resolver los principales retos encontrados en el estado del arte administrando los datos de forma eficiente mediante un monitoreo y seguimiento eficiente de los foros, el diseño de mecanismos efectivos de búsqueda para preguntas y respuestas en los foros, y extrayendo indicadores claves de rendimiento para administrar adecuadamente los foros. / Este trabajo ha sido parcialmente financiado por el Ministerio de Ciencia, Innovación y Universidades de España a través del Proyecto ECLIPSE-UA (Enhancing Data Quality and Security for Improving Business Processes and Strategic Decisions in Cyber Physical Systems) con referencia RTI2018-094283-B-C32. Big Data Procesamiento de Lenguaje Natural Recuperación de Información Comercio Electrónico Análisis de Sentimientos Detección de Revisiones Falsas Decisiones de Marketing Foros en Línea Minería de Datos MOOC Lenguajes y Sistemas Informáticos
197	Discovering frequent and significant episodes. Application to sequences of events recorded in power distribution networks Quiroga Quiroga, Oscar Arnulfo 18 December 2012 (has links) This thesis proposes a formalism to analyse and automatically exploit sequences of events, which are related with faults occurred in power distribution networks and are recorded by power quality monitors at substations. This formalism allows to find dependencies or relationships among events, looking for meaningful patterns. Once those patterns are found, they can be used to better describe fault situations and their temporal evolution or can be also useful to predict future failures by recognising the events that match the early stages of a pattern. / En aquesta tesi es proposa un formalisme per analitzar conjunts de dades d'esdeveniments relacionats amb les fallades que es produeixen en les xarxes de distribució elèctrica, i explotar automàticament seqüències d'esdeveniments registrats pels monitors de qualitat d'ona instal•lats en substacions. Aquest formalisme permet cercar dependencies o relacions entre esdeveniments per trobar patrons significatius. Quan els patrons es troben, es poden utilitzar per descriure millor les situacions de fallada i la seva evolució. Els patrons també poden ser útils per a predir fallades futures mitjançant el reconeixement dels successos que coincideixin amb les primeres etapes d'un patró. Xarxes de distribució elèctrica Power distribution networks Redes de distribución eléctrica Seqüències d'esdeveniments Event sequences Secuencias de eventos Diagnòstic de fallades Fault diagnosis Diagnóstico de fallos Pronòstic de fallades Fault prognosis Pronóstico de fallos Fallades del sistema de potència Power system faults Fallos del sistema de potencia Mineria de patrons Pattern mining Minería de patrones Mineria de dades Data mining Minería de datos 68
198	Desarrollo de modelos predictivos de contaminantes ambientales Salazar Ruiz, Enriqueta 04 July 2008 (has links) El desarrollo de modelos matemáticos predictivos de distinto tipos de fenómenos son aplicaciones fundamentales y útiles de las técnicas de Minería de Datos. Un buen modelo se convierte en una excelente herramienta científica que requiere de la existencia y disposición de grandes volúmenes de datos, además de habilidad y considerable tiempo aplicado del investigador para integrar los conocimientos más relevantes y característicos del fenómeno en estudio. En el caso concreto de ésta tesis, los modelos de predicción desarrollados se enfocaron en la predicción contaminantes ambientales como el valor medio de Partículas Finas (PM2.5) presentes en el aire respirable con un tiempo de anticipación de 8 horas y del Ozono Troposférico Máximo (O3) con 24 horas de anticipación. Se trabajó con un interesante conjunto de técnicas de predicción partiendo con herramientas de naturaleza paramétrica tan sencillas como Persistencia, Modelación Lineal Multivariante, así como la técnica semi-paramétrica: Regresión Ridge además de herramientas de naturaleza no paramétrica como Redes Neuronales Artificiales (ANN) como Perceptron Multicapa (MLP), Perceptrón Multi Capa Cuadrática (SMLP), Función de Base Radial (RBF) y Redes Elman, así como Máquinas de Vectores Soporte (SVM), siendo las técnicas no paramétricas las que generalizaron mejor los fenómenos modelizados. / Salazar Ruiz, E. (2008). Desarrollo de modelos predictivos de contaminantes ambientales [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2504 / Palancia Minería de datos Calidad del aire Partículas en suspensión PM2,5 Frontera EEUU-México Redes neuronales Función de base radial (rbf) Perceptrón multicapa (mlp) Perceptrón multicapa cuadrática (smlp) Regresión "ridge" Redes neuronales "elman" Máquina de vectores soporte (svm) PROYECTOS DE INGENIERIA 630502 - Elaboración de modelos 120304 - Inteligencia artificial 250902 - Contaminación atmosférica
199	Percepción social de la ciencia y participación digital: impacto de la comunicación científica en Twitter Denia Navarro, Elena 02 November 2020 (has links) [ES] La percepción pública de la ciencia es un aspecto social ampliamente estudiado mediante encuestas a la población para evaluar la comprensión de la ciencia y las actitudes hacia la misma. Sin embargo, existen críticas robustas hacia los supuestos teóricos que sustentan el diseño de estos sondeos y hacia la metodología empleada. La presente tesis pretende aportar vías de análisis más innovadoras a la discusión. En primer lugar, se proporciona un marco introductorio que esboza las relaciones más destacables entre ciencia y sociedad en el mundo moderno, incluyendo los enfoques de participación, considerados más democráticos. En segundo lugar, se profundiza en el marco del nuevo escenario de la vida digital, en particular con la finalidad de complementar los estudios clásicos de percepción social de la ciencia con la propuesta de una herramienta metodológica adaptada a la sociedad digital que abra nuevas direcciones de investigación orientadas hacia los espacios de participación ciudadana que constituyen las redes sociales digitales. Para ello, se diseña un algoritmo capaz de analizar tendencias en el impacto de la comunicación de la ciencia en Twitter a partir de conjuntos representativos de tuits utilizando técnicas computacionales de minería de datos, combinadas con una valoración cualitativa de los tipos de contenido ¿categorizado como: «ciencia», «cultura», «político-social», «creencias», «medios» y «emocional»¿. Para probar la herramienta, se examina una variedad de discursos en abierto sobre temas científicos presentes en la plataforma, aplicando el algoritmo sobre perfiles de distinta naturaleza ¿científicos famosos, instituciones y otros¿ y sobre conversaciones no centralizadas en usuarios específicos, sino recabando la información relativa a cuestiones científicas de las que los medios se han hecho eco. El resultado es una herramienta de bajo coste fácilmente reproducible por otros investigadores que revela aspectos sobre las estrategias de comunicación científica que generan mayor impacto. Se requerirán estudios más profundos, a gran escala, para corroborar si las tendencias preliminares identificadas con el método de análisis propuesto pueden extrapolarse a un marco más general. / [EN] Public perception of science is a widely studied social aspect through population surveys to assess understanding of science and attitudes towards it. However, there are strong criticisms of the theoretical assumptions behind the design of these surveys and the methodology used. This thesis aims to provide more innovative ways of analysis to the discussion. Firstly, it provides an introductory framework outlining the most remarkable relationships between science and society in the modern world, including approaches to 'engagement' in science, which are considered to be more democratic. Secondly, it delves into the framework of the new scenario of digital life, in particular with the aim of complementing the classic studies of the social perception of science with the proposal of a methodological tool adapted to the digital society that opens up new directions of research oriented towards the spaces of citizen participation that constitute social networks. To this end, an algorithm is designed that is capable of analyzing the impact of science communication on Twitter from representative sets of tweets using computational data mining techniques, combined with a qualitative assessment of the types of content; categorized as «science», «culture», «political-social», «beliefs», «media» and «emotional». To test the tool, a variety of open discourses on scientific topics present in the platform are examined, applying the algorithm on profiles of different nature (famous scientists, institutions and others) and on conversations not centralized on specific users, but gathering information on scientific issues that have been echoed by the media. The result is a low-cost tool that can be easily reproduced by other researchers and that reveals aspects about the science communication strategies that generate the greatest impact. As a next step, more in-depth, large-scale studies are required to corroborate whether the preliminary trends identified with the proposed method of analysis can be extrapolated to a more general framework. / [CA] La percepció pública de la ciència és un aspecte social àmpliament estudiat mitjançant enquestes a la població per avaluar la comprensió de la ciència i les actituds de la ciutadania. No obstant això, hi ha crítiques robustes cap als supòsits teòrics que sustenten el disseny d'aquests sondejos i cap a la metodologia utilitzada. La present tesi pretén aportar vies d'anàlisi més innovadores a la discussió. En primer lloc, es proporciona un marc introductori que esbossa les relacions més destacables entre ciència i societat en el món modern, incloent els enfocaments de participació ¿o engagement¿, considerats més democràtics. En segon lloc, s'aprofundeix en el marc de el nou escenari de la vida digital, en particular amb la finalitat de complementar els estudis clàssics de percepció social de la ciència amb la proposta d'una eina metodològica adaptada a la societat digital que obri noves direccions de investigació orientades cap als espais de participació ciutadana que constitueixen les xarxes socials. Per a això, es dissenya un algoritme capaç d'analitzar l'impacte de la comunicació de la ciència a Twitter a partir de conjunts representatius de tuits utilitzant tècniques computacionals de mineria de dades, combinades amb una valoració qualitativa dels tipus de contingut ¿categoritzat com: «ciència», «cultura», «politicosocial», «creences», «mitjans» i «emocional»¿. Per provar l'eina, s'examina una varietat de discursos en obert sobre temes científics presents a la plataforma, aplicant l'algoritme sobre perfils de diferent naturalesa ¿científics famosos, institucions i altres¿ i sobre converses no centralitzades en usuaris específics, sinó recaptant la informació relativa a qüestions científiques de les que els mitjans de comunicació s'han fet ressò. El resultat és una eina de baix cost fàcilment reproduïble per altres investigadors que revela aspectes sobre les estratègies de comunicació científica que generen major impacte. Com següent pas, es requereixen estudis més profunds, a gran escala, per corroborar si les tendències preliminars identificades amb el mètode d'anàlisi proposat poden extrapolar-se a un marc més general. / Denia Navarro, E. (2020). Percepción social de la ciencia y participación digital: impacto de la comunicación científica en Twitter [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/153797 / TESIS Percepción social de la ciencia Alfabetización científica Impacto social Engagement Comunicación de la ciencia Periodismo científico Divulgación Redes sociales Twitter Minería de datos Procesamiento del lenguaje natural. Social perception of science Scientific literacy Social impact Science engagement Science communication Science journalism Science popularization Social networks Data mining Natural language processing

Search results