Spelling suggestions: "subject:"estadística"" "subject:"estatistica""
41 |
VALIDACION DE LAS ESCALAS DEL JOB DIAGNOSTIC SURVEY (JDS) APLICADAS A ENTORNOS EDUCATIVOS UNIVERSITARIOSGiraldo O'Meara, Martha Marcela 31 March 2014 (has links)
Desde hace tiempo se habla de la necesidad de modificar la enseñanza
tradicional, caracterizada por la superficialidad en el aprendizaje y la pasividad en el
estudiante, por una en la que éste participe de forma activa y cuyo aprendizaje sea más
profundo. De hecho, en la adaptación que están llevando a cabo las universidades en
España, dentro de los planes del Espacio Europeo de Educación Superior (EEES), uno
de los objetivos propuestos es la mejora de las metodologías y recursos en la educación
de los estudiantes.
Este tipo de aprendizaje activo genera un contexto más motivador, estimulante y
más satisfactorio para los estudiantes, y una forma de crearlo es modificando las
actividades que los estudiantes realizan en clase, es decir, las características del contexto
de aprendizaje.
A pesar de toda la investigación que existe en el área de la educación sobre este
aspecto, sigue existiendo un vacío con respecto a las características relacionadas con el
aprendizaje y con la motivación y la satisfacción.
Al no haber podido encontrar instrumentos que evalúen este tipo de conceptos,
se ha decidido investigar dentro del mundo laboral, para comprender mejor ambos
constructos.
La analogía entre el mundo laboral y el académico no es un planteamiento
nuevo. Desde hace mucho tiempo se ha sugerido la idea de que lo que hace el estudiante
en la universidad, es comparable a lo que hace un trabajador en su puesto de trabajo.
En este trabajo se ha realizado la adaptación al mundo académico, de un
instrumento ampliamente utilizado en el mundo laboral para diagnosticar y rediseñar las
propiedades motivacionales del puesto de trabajo y medir la satisfacción en los
trabajadores: El Job Diagnostic Survey (JDS). Aunque existen otros instrumentos que
evalúan estos conceptos, el JDS, además de ser uno de los instrumentos más utilizados
para su valoración, incluye ambos constructos en su modelo conceptual. A través de este trabajo se ha conseguido ofrecer un instrumento válido para
analizar el potencial motivador del puesto de trabajo de los alumnos, rediseñarlo y
evaluar cómo influye en la satisfacción. / Giraldo O'meara, MM. (2014). VALIDACION DE LAS ESCALAS DEL JOB DIAGNOSTIC SURVEY (JDS) APLICADAS A ENTORNOS EDUCATIVOS UNIVERSITARIOS [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/36741
|
42 |
Bernoulli HMMs for Handwritten Text RecognitionGiménez Pastor, Adrián 09 June 2014 (has links)
In last years Hidden Markov Models (HMMs) have received significant attention in the
task off-line handwritten text recognition (HTR). As in automatic speech recognition (ASR),
HMMs are used to model the probability of an observation sequence, given its corresponding
text transcription. However, in contrast to what happens in ASR, in HTR there is no standard
set of local features being used by most of the proposed systems. In this thesis we propose the
use of raw binary pixels as features, in conjunction with models that deal more directly with
the binary data. In particular, we propose the use of Bernoulli HMMs (BHMMs), that is, conventional
HMMs in which Gaussian (mixture) distributions have been replaced by Bernoulli
(mixture) probability functions. The objective is twofold: on the one hand, this allows us
to better modeling the binary nature of text images (foreground/background) using BHMMs.
On the other hand, this guarantees that no discriminative information is filtered out during
feature extraction (most HTR available datasets can be easily binarized without a relevant
loss of information).
In this thesis, all the HMM theory required to develop a HMM based HTR toolkit is
reviewed and adapted to the case of BHMMs. Specifically, we begin by defining a simple
classifier based on BHMMs with Bernoulli probability functions at the states, and we end
with an embedded Bernoulli mixture HMM recognizer for continuous HTR. Regarding the
binary features, we propose a simple binary feature extraction process without significant
loss of information. All input images are scaled and binarized, in order to easily reinterpret
them as sequences of binary feature vectors. Two extensions are proposed to this basic feature
extraction method: the use of a sliding window in order to better capture the context,
and a repositioning method in order to better deal with vertical distortions. Competitive results
were obtained when BHMMs and proposed methods were applied to well-known HTR
databases. In particular, we ranked first at the Arabic Handwriting Recognition Competition
organized during the 12th International Conference on Frontiers in Handwriting Recognition
(ICFHR 2010), and at the Arabic Recognition Competition: Multi-font Multi-size Digitally
Represented Text organized during the 11th International Conference on Document Analysis
and Recognition (ICDAR 2011).
In the last part of this thesis we propose a method for training BHMM classifiers using In last years Hidden Markov Models (HMMs) have received significant attention in the
task off-line handwritten text recognition (HTR). As in automatic speech recognition (ASR),
HMMs are used to model the probability of an observation sequence, given its corresponding
text transcription. However, in contrast to what happens in ASR, in HTR there is no standard
set of local features being used by most of the proposed systems. In this thesis we propose the
use of raw binary pixels as features, in conjunction with models that deal more directly with
the binary data. In particular, we propose the use of Bernoulli HMMs (BHMMs), that is, conventional
HMMs in which Gaussian (mixture) distributions have been replaced by Bernoulli
(mixture) probability functions. The objective is twofold: on the one hand, this allows us
to better modeling the binary nature of text images (foreground/background) using BHMMs.
On the other hand, this guarantees that no discriminative information is filtered out during
feature extraction (most HTR available datasets can be easily binarized without a relevant
loss of information).
In this thesis, all the HMM theory required to develop a HMM based HTR toolkit is
reviewed and adapted to the case of BHMMs. Specifically, we begin by defining a simple
classifier based on BHMMs with Bernoulli probability functions at the states, and we end
with an embedded Bernoulli mixture HMM recognizer for continuous HTR. Regarding the
binary features, we propose a simple binary feature extraction process without significant
loss of information. All input images are scaled and binarized, in order to easily reinterpret
them as sequences of binary feature vectors. Two extensions are proposed to this basic feature
extraction method: the use of a sliding window in order to better capture the context,
and a repositioning method in order to better deal with vertical distortions. Competitive results
were obtained when BHMMs and proposed methods were applied to well-known HTR
databases. In particular, we ranked first at the Arabic Handwriting Recognition Competition
organized during the 12th International Conference on Frontiers in Handwriting Recognition
(ICFHR 2010), and at the Arabic Recognition Competition: Multi-font Multi-size Digitally
Represented Text organized during the 11th International Conference on Document Analysis
and Recognition (ICDAR 2011).
In the last part of this thesis we propose a method for training BHMM classifiers using In last years Hidden Markov Models (HMMs) have received significant attention in the
task off-line handwritten text recognition (HTR). As in automatic speech recognition (ASR),
HMMs are used to model the probability of an observation sequence, given its corresponding
text transcription. However, in contrast to what happens in ASR, in HTR there is no standard
set of local features being used by most of the proposed systems. In this thesis we propose the
use of raw binary pixels as features, in conjunction with models that deal more directly with
the binary data. In particular, we propose the use of Bernoulli HMMs (BHMMs), that is, conventional
HMMs in which Gaussian (mixture) distributions have been replaced by Bernoulli
(mixture) probability functions. The objective is twofold: on the one hand, this allows us
to better modeling the binary nature of text images (foreground/background) using BHMMs.
On the other hand, this guarantees that no discriminative information is filtered out during
feature extraction (most HTR available datasets can be easily binarized without a relevant
loss of information).
In this thesis, all the HMM theory required to develop a HMM based HTR toolkit is
reviewed and adapted to the case of BHMMs. Specifically, we begin by defining a simple
classifier based on BHMMs with Bernoulli probability functions at the states, and we end
with an embedded Bernoulli mixture HMM recognizer for continuous HTR. Regarding the
binary features, we propose a simple binary feature extraction process without significant
loss of information. All input images are scaled and binarized, in order to easily reinterpret
them as sequences of binary feature vectors. Two extensions are proposed to this basic feature
extraction method: the use of a sliding window in order to better capture the context,
and a repositioning method in order to better deal with vertical distortions. Competitive results
were obtained when BHMMs and proposed methods were applied to well-known HTR
databases. In particular, we ranked first at the Arabic Handwriting Recognition Competition
organized during the 12th International Conference on Frontiers in Handwriting Recognition
(ICFHR 2010), and at the Arabic Recognition Competition: Multi-font Multi-size Digitally
Represented Text organized during the 11th International Conference on Document Analysis
and Recognition (ICDAR 2011).
In the last part of this thesis we propose a method for training BHMM classifiers using discriminative training criteria, instead of the conventionalMaximum Likelihood Estimation
(MLE). Specifically, we propose a log-linear classifier for binary data based on the BHMM
classifier. Parameter estimation of this model can be carried out using discriminative training
criteria for log-linear models. In particular, we show the formulae for several MMI based
criteria. Finally, we prove the equivalence between both classifiers, hence, discriminative
training of a BHMM classifier can be carried out by obtaining its equivalent log-linear classifier.
Reported results show that discriminative BHMMs clearly outperform conventional
generative BHMMs. / Giménez Pastor, A. (2014). Bernoulli HMMs for Handwritten Text Recognition [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/37978
|
43 |
Precontrol óptimo. Caracterización, análisis y técnicas de resoluciónGiner Bosch, Vicent 26 January 2015 (has links)
El precontrol es una herramienta para el control de la calidad que tiene
como objeto evaluar la aptitud de un proceso para producir piezas dentro
de unas especificaciones dadas. Es usada, entre otros contextos, en la
validación de la puesta a punto de procesos con ciclos de ejecución cortos.
Basa su funcionamiento en la comparación de las sucesivas observaciones
individuales muestreadas frente a los límites de tolerancia y los llamados
límites de precontrol, y utiliza conteos acumulados para emitir un juicio
sobre la validez del proceso. Es una técnica sencilla, rápida y fácil de
aplicar.
El hecho de que, en su versión original, la técnica del precontrol no tenga
en cuenta la variabilidad natural del proceso objeto de monitorización,
unido a la sencillez de su diseño, provocan que, bajo ciertas circunstancias,
su comportamiento no sea tan eficaz como sería deseable, en términos
de la tasa de falsa alarma y de la potencia para detectar desviaciones
inaceptables, hasta el punto de que algunos autores rechazan su uso. En
este sentido, existen en la literatura diversas propuestas encaminadas a
mejorar el comportamiento de la técnica original mediante la modificación,
en mayor o menor medida, de sus reglas de funcionamiento.
En esta tesis doctoral se aborda la mejora del precontrol como
herramienta para la cualificación de procesos, a través de la determinación
óptima de los parámetros que rigen su comportamiento, utilizando
técnicas de programación no lineal entera mixta. El objetivo es desarrollar
una metodología para automatizar el proceso de elección del valor de los
parámetros del precontrol, de manera que éste se ajuste lo mejor posible a
los requerimientos del usuario. Este enfoque de Optimización, inédito en
el precontrol, ha sido aplicado con éxito a otras técnicas de control de la
calidad en las últimas décadas, permitiendo obtener mejores herramientas
para la toma de decisiones.
Para ello, en primer lugar se realiza una revisión exhaustiva de las
diferentes propuestas existentes en la literatura en torno al precontrol.
Posteriormente, se define el problema a resolver y se desarrolla un
modelo de programación matemática específico para la obtención de
los denominados planes de precontrol óptimos. Se realiza una completa
experiencia numérica con software de optimización de propósito general,
mediante la que se evidencia la eficacia del modelo propuesto y, al mismo
tiempo, se pone de manifiesto la existencia de diferencias significativas
entre los resultados proporcionados por los diferentes algoritmos tomados
en consideración, debidas en parte a la doble naturaleza no lineal y
entera del problema, así como la incapacidad de dichos algoritmos para
garantizar la convergencia a un óptimo global, a causa de la existencia de
no convexidades.
Todo ello justifica el diseño de algoritmos específicos para la obtención
de planes de precontrol óptimos, tarea que también se aborda en
la presente tesis doctoral. Previamente, se realiza un estudio de las
propiedades matemáticas del modelo de optimización construido, que
permite ampliar el conocimiento sobre el problema del precontrol óptimo.
Este conocimiento es empleado en la elaboración de un algoritmo
exacto para la resolución de dicho problema, denominado OPCenum, el
cual combina una estrategia enumerativa implícita con una búsqueda
local basada en métodos de búsqueda de raíces sin uso de derivadas. El
algoritmo es implementado y probado sobre la misma batería de ejemplos
que conformaban la experiencia numérica anterior.
Las pruebas revelan la eficacia y eficiencia del algoritmo OPCenum como
método para la obtención de planes de precontrol óptimos a partir de
unos requerimientos dados.
La elaboración de una interfaz gráfica para hacer más accesible el
algoritmo al usuario final, la adaptación del problema a funciones de
distribución asimétricas y a ámbitos como el de la fiabilidad, así como el
desarrollo de un enfoque paralelo al acometido aquí en el que se considere
el precontrol como herramienta para validar la capacidad del proceso
destacan como líneas futuras de investigación que surgen a partir de los
resultados obtenidos en la presente tesis doctoral. / Giner Bosch, V. (2014). Precontrol óptimo. Caracterización, análisis y técnicas de resolución [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/46373
|
44 |
Caracterización microclimática mediante sensores de humedad y temperatura de obras de arte con fines de conservación preventivaMerello Giménez, Paloma 30 October 2016 (has links)
Tesis por compendio / [EN] This PhD dissertation deals with the multivariate statistical analysis of microclimatic data for preventive conservation of cultural heritage in several locations: Ariadne's house (Pompeii, Italy), l'Almoina Archaeological Museum (Valencia, Spain) and mudejar church of Santa Maria in Ateca (Zaragoza, Spain).
The main objective of this thesis is to propose a methodology for statistical analysis of microclimatic data which can be extended to curators and restorers. The usefulness of the proposed methodology is shown, as it has been successfully applied to the studied cultural heritage sites.
Furthermore, corrective actions have been proposed and taken in accordance with the results obtained from the analysis of data recorded at Ariadne's house and the Archaeological Museum of l'Almoina. The effectiveness of such corrective measures has been evaluated through a second monitoring campaign.
In the case of Ariadne's house, two monitoring campaigns were conducted. During the first, in 2008, the analysis of the recorded data showed that the transparent polycarbonate roof installed in the 1970s was causing a greenhouse effect harmful to the conservation of the frescoes. The sensors also helped identifying differences between orientations and heights. Following our recommendations, in 2010 the roofs were changed by some opaque fibrocement and thermo-hygrometric data recorded in a second monitoring campaign allowed us evaluating the adequacy of the corrective actions in configuring a more stable microclimate.
The Archaeological Museum of l'Almoina is exposed to passers-by through a skylight that covers part of the ruins. A first monitoring campaign in 2010 allowed the thermo-hygrometric characterization of the inner microclimate and the identification of the significant influence of the skylight on the temperature and relative humidity values, causing sharp rises and falls during the daylight hours. In 2013 two corrective measures were implemented and evaluated subsequently through a second microclimatic monitoring campaign conducted at the museum.
The mudejar church of Santa Maria is located in Ateca, a town in the province of Zaragoza characterised by cold winters and warm summers. Given the low temperatures in winter, a heating system is used. The results of our analysis have shown that the heating system is turned on only for the celebration of Mass or religious festivities (half hour before the entrance of public at the church), causing extreme cycles of temperature and humidity, especially at the upper parts of the altarpiece due to the rising of hot air (hourly increase of 7 ºC in temperature and a decrease of 11% relative humidity) that are detrimental for the conservation of this artwork. / [ES] Esta tesis doctoral trata sobre el análisis estadístico multivariante de datos microclimaticos para la conservación preventiva en patrimonio cultural: la casa de Ariadna (Pompeya, Italia), el Museo arqueológico de l'Almoina (Valencia, España) y la iglesia mudéjar de Santa María en Ateca (Ateca, España) . El objetivo principal de esta tesis es proponer una metodología de análisis estadístico de datos microclimáticos extensible a conservadores y restauradores. Se demuestra la utilidad de la metodología propuesta, ya que ha sido posible caracterizar los sitios del patrimonio cultural estudiados. Además, se han propuesto y adoptado acciones correctivas de acuerdo con los resultados obtenidos del análisis de los datos registrados en la casa de Ariadna y el Museo arqueológico de l'Almoina. La efectividad de dichas medidas correctoras ha sido evaluada a través de una segunda campaña de monitorización.
En el caso de la casa de Ariadna, dos campañas de monitorización se llevaron a cabo. Durante la primera, en 2008, el análisis de los datos recogidos demostró que los tejados de policarbonato transparente instalados en los años 70 estaban provocando un efecto invernadero muy perjudicial para la conservación de los frescos.
Los sensores permitieron además identificar diferencias entre orientaciones y alturas. Bajo las recomendaciones realizadas, en 2010 los tejados fueron cambiados por unos opacos de fibrocemento, y los datos termo-higrométricos recogidos en una segunda campaña de monitorización permitieron evaluar la adecuación de la medida correctiva en la configuración de un microclima más estable.
El Museo arqueológico de l'Almoina se encuentra expuesto a los viandantes a través de una claraboya que cubre parte de las ruinas. Una primera campaña de monitorización en 2010 permitió caracterizar termo-higrométricamente el museo e identificar la influencia significativa de la claraboya sobre la temperatura y la humedad relativa, causando fuertes aumentos y caídas durante las horas de luz del día, así como un aporte de humedad de una acequia colindante. En 2013 se llevaron a cabo dos medidas correctivas que fueron evaluadas a través de una segunda monitorización microclimática.
La iglesia mudéjar de Santa María está situada en Ateca, una población de la provincia de Zaragoza caracterizada por fríos inviernos y cálidos veranos. Esta fría climatología invernal condiciona la iglesia al uso de un sistema de climatización.
El resultado de nuestros análisis ha puesto de manifiesto que el sistema de climatización solo se enciende para la celebración de misas o festividades religiosas, media hora antes de que entre el público en la iglesia, provocando extremos ciclos de temperatura y humedad relativa, más notables en las partes altas del retablo por el ascenso del aire caliente (incremento horario de 7 ºC en la temperatura y un descenso del 11% de la humedad relativa) que resultan perjudiciales para la conservación de este. / [CA] Aquesta Tesi doctoral tracta sobre l'anàlisi estadístic multivariant de dades microclimatics per a la conservació preventiva en patrimoni cultural: la casa d'Ariadna (Pompeia, Itàlia), el Museu arqueològic de l'Almoina (València, Espanya) i l'església mudèjar de Santa Maria en Ateca (Saragossa, Espanya).
L'objectiu principal d'aquesta tesi _es proposar una metodologia d'anàlisi estadístic de dades microclimatics extensible a conservadors i restauradors. Es demostra la utilitat de la metodologia proposada, ja que ha sigut possible caracteritzar els llocs del patrimoni cultural estudiats.
A més, s'han proposat i adoptat accions correctives d'acord amb els resultats obtinguts de l'anàlisi de les dades registrades en la casa d'Ariadna i el Museu arqueològic de l'Almoina. L'efectivitat d'aquestes mesures correctores ha sigut avaluada a través d'una segona campanya de monitoratge.
En el cas de la casa d'Ariadna, dues campanyes de monitoratge es van dur a terme. Durant la primera, en 2008, l'anàlisi de les dades enregistrades va demostrar que les teulades de policarbonat transparent instal·lades en els anys 70 estaven provocant un efecte hivernacle molt perjudicial per a la conservació dels frescs. Els sensors van permetre a més identificar diferències entre orientacions i altures. Sota les recomanacions realitzades, en 2010 les teulades van ser canviades per unes opaques de fibrociment, i les dades termo-higromètriques arreplegades en una segona campanya de monitoratge van permetre avaluar l'adequació de la mesura correctiva en la configuració d'un microclima més estable.
El Museu arqueològic de l'Almoina es troba exposat als vianants a través d'una claraboia que cobreix part de les ruïnes. Una primera campanya de monitoratge en 2010 va permetre caracteritzar termo-higrometricament el museu i identificar la influència significativa de la claraboia sobre la temperatura i la humitat relativa, causant forts augments i caigudes durant les hores diürnes, així__ com una aportació d'humitat d'una sèquia confrontant. En 2013 es van dur a terme dues mesures correctives que van ser avaluades a través d'un segon monitoratge microclimàtic.
L'església mudèjar de Santa Maria està situada en Ateca, una població de la província de Saragossa caracteritzada per freds hiverns i càlids estius. Aquesta freda climatologia hivernal condiciona l'església a l'ús d'un sistema de climatització. El resultat de les nostres anàlisis ha posat de manifest que el sistema de climatització solament s'encén per a la celebració de misses o festivitats religioses, mitja hora abans que entre el públic en l'església, provocant extrems cicles de temperatura i humitat relativa, més notables en les parts altes del retaule per l'ascens de l'aire calent
(increment horari de 7ºC en la temperatura i un descens del 11% de la humitat
relativa) que resulten perjudicials per a la conservació d'aquest. / Merello Giménez, P. (2015). Caracterización microclimática mediante sensores de humedad y temperatura de obras de arte con fines de conservación preventiva [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/57490 / Compendio
|
45 |
Aplicación del Análisis Envolvente de Datos y Análisis Factorial Múltiple en el estudio del desempeño en las instituciones de educación superior públicas en Colombia y su implicación en la distribución de los recursosVisbal Cadavid, Delimiro Alberto 03 April 2020 (has links)
[ES] El establecimiento de estrategias y planes de mejora de todo sistema debe abordar como primera instancia el conocimiento del estado actual del mismo, lo cual se logra mediante la formulación, estudio y análisis de los indicadores de gestión de las dimensiones consideradas importantes para el logro de los objetivos, y ello se hace extensivo al Sistema Universitario Estatal (SUE) colombiano. En este contexto, los resultados de las Instituciones de Educación Superior (IES) están entre los desafíos y retos que tiene el sistema educativo en Colombia.
Con el presente trabajo se pretende realizar un análisis comparativo del estado actual de las IES públicas colombianas. Para ello, en primer lugar se realizó un estudio de eficiencia mediante el Análisis Envolvente de Datos (DEA), para posteriormente hacer una propuesta de reestructuración del sector educativo superior público colombiano mediante la implementación del Análisis Envolvente de Datos Inverso en combinación con Algoritmos Genéticos (InvDEA - AG) a través de la identificación de posibles fusiones entre IES ineficientes en una única nueva IES resultante, de manera que esta última posea un cierto nivel de eficiencia técnica preestablecido. En una tercera etapa se realiza una caracterización de las mismas mediante el estudio de los indicadores de resultados establecidos en el Índice de Progreso de la Educación Superior (IPES) desarrollado por el Ministerio de Educación Nacional de Colombia utilizando como herramienta el Análisis Factorial Múltiple (AFM), y finalmente se va a proponer un Índice Sintético de Desempeño basado en los resultados del AFM (IAFM), índice que considera la estructura interna de los indicadores que conforman las dimensiones del sistema de indicadores de gestión de las IES.
Los resultados indican que, en términos generales, las universidades que exhiben más debilidades son: Pacifico, Chocó, UFPS-Ocaña, Guajira, Cesar, Amazonía, Sucre, Llanos, Pamplona y Cundinamarca.
Los resultados muestran que la dimensión Acceso es la más multidimensional, seguido por Calidad y Logro, siendo el más homogéneo el grupo Recursos.
El mejor desempeño en las variables de la dimensión Logro lo tiene la Universidad Nacional de Colombia (UNAL), seguida por Universidad de Antioquia (UDEA). El mejor desempeño en la dimensión Calidad lo posee la Universidad Nacional Abierta y a Distancia (UNAD), mientras que la Universidad Pedagógica Nacional tiene el mejor desempeño en Acceso, y el segundo mejor desempeño en Calidad (compartido con la Universidad Militar). / [CA] L'establiment d'estratègies i plans de millora de tot sistema ha d'abordar com a primera instància el coneixement de l'estat actual d'aquest, la qual cosa s'aconsegueix mitjançant la formulació, estudi i anàlisi dels indicadors de gestió de les dimensions considerades importants per a l'assoliment dels objectius, això també és totalment cert en el Sistema Universitari Estatal (SUE) colombià. En aquest context, els resultats de les Institucions d'Educació Superior (IES) estan entre els desafiaments i reptes que té el sistema educatiu a Colòmbia.
Amb el present treball es pretén realitzar una anàlisi comparativa de l'estat actual de les IES públiques colombianes, per a això es duu a terme un estudi d'eficiència mitjançant l'Anàlisi Envolupant de Dades (DEA), seguidament es fa una proposta de reestructuració del sector educatiu superior públic colombià mitjançant la implementació de l'Anàlisi Envolupant de Dades Invers en combinació amb Algorismes Genètics (InvDEA - AG) a través de la identificació de possibles fusions entre IES ineficients en una única nova IES resultant, de manera que aquesta última posseïsca un cert nivell d'eficiència tècnica preestablit, també es realitza una caracterització de les mateixes mitjançant l'estudi dels indicadors de resultats establits en l'Índex de Progrés de l'Educació Superior (IPES) desenvolupat pel Ministeri d'Educació Nacional de Colòmbia utilitzant com a eina l'Anàlisi Factorial Múltiple (AFM), i finalment es proposa un Índex Sintètic d'Acompliment basat en els resultats del AFM (IAFM), índex que considera l'estructura interna dels indicadors que conformen les dimensions del sistema d'indicadors de gestió de les IES.
Els resultats indiquen que, en termes generals, les universitats que exhibeixen més debilitats són: Pacífico, Chocó, UFPS-Ocaña, Guajira, Cesar, Amazonía, Sucre, Llanos, Pamplona i Cundinamarca.
Els resultats mostren que la dimensió Accés és la més multidimensional, seguit per Qualitat i Assoliment, i el més homogeni és Recursos.
El millor acompliment en les variables de la dimensió Assoliment ho té la Universitat Nacional de Colòmbia (UNAL), seguida per Universitat de Antioquia (UDEA). El millor acompliment en la dimensió Qualitat el posseeix la Universitat Nacional Oberta i a Distància (UNAD), mentre que la Universitat Pedagògica Nacional té el millor acompliment en Accés, i el segon millor acompliment en Qualitat (compartit amb la Universitat Militar). / [EN] The establishment of strategies and plans for the improvement of any system should address as a first instance the knowledge of the current state of the same, which is achieved through the formulation, study and analysis of performance indicators of the dimensions considered important for the achievement of objectives, this is also totally true in the Colombian State University System (SUE). In this context, the results of the Higher Education Institutions (HEIs) are among the challenges that the education system has in Colombia.
This work intends to carry out a comparative analysis of the current state of Colombian public HEIs. To do this, an efficiency study was first carried out using the Data Envelope Analysis (DEA), then a proposal is made to restructure Higher Public Education Sector in Colombia through the implementation of the Inverse Data Envelopment Analysis in combination with Genetic Algorithms (InvDEA -GA) by identifying possible mergers between inefficient HEI in a single resulting new HEI so that the latter fulfill a global predefined efficiency. In a third stage, a characterization of them is carried out by studying the outcome indicators established in the Progress Index of Higher Education (IPES) developed by the Ministry of National Education of Colombia through Multiple Factor Analysis (MFA) as tool, and finally, a Synthetic Performance Index based on the results of the MFA (IMFA) is proposed, index that considers the internal structure of the indicators that compose the dimensions of the system of indicators of HEIs in Colombia.
The results indicate that, in general terms, the universities that exhibit the most weaknesses are: Pacifico, Chocó, UFPS-Ocaña, Guajira, Cesar, Amazonía, Sucre, Llanos, Pamplona y Cundinamarca.
The results show that the Access dimension is the most multidimensional, followed by Quality and Achievement, and the most homogeneous is Resources.
The best performance in the variables of the Achievement dimension is the Universidad Nacional de Colombia (UNAL), followed by the Universidad de Antioquia (UDEA). The best performance in the Quality dimension is held by the Universidad Nacional Abierta y a Distancia (UNAD), while the Universidad Pedagógica Nacional has the best performance in Access, and the second best performance in Quality (shared with the Universidad Militar Nueva Granada). / Visbal Cadavid, DA. (2020). Aplicación del Análisis Envolvente de Datos y Análisis Factorial Múltiple en el estudio del desempeño en las instituciones de educación superior públicas en Colombia y su implicación en la distribución de los recursos [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/140089
|
46 |
Análisis de la incertidumbre en la estimación de la movilidad electoral mediante el procedimiento LPHOMMartín Marín, Jorge 21 December 2020 (has links)
[ES] La estimación del trasvase de votos de unos partidos a otros entre dos procesos electorales es un tema relevante dentro de la sociología política. Dadas las limitaciones de las encuestas en este campo, existe un interés creciente en los procedimientos de estimación que utilizan exclusivamente la realidad incuestionable de los propios resultados electorales. lphom es uno de estos métodos. lphom es un procedimiento, relativamente sencillo, que, tras ser aplicado en estos últimos años en algunos estudios reales, ha proporcionado, en todos los casos, resultados muy razonables.
En la presente tesis se aborda el problema, hasta ahora no investigado, de desarrollar procedimientos para estimar los márgenes de incertidumbre de los resultados obtenidos al aplicar este procedimiento en estudios reales. Tras definir unos indicadores adecuados, EI y EP, para cuantificar dicha incertidumbre, el proceso se basa en utilizar los residuos del modelo lphom para (i) evaluar el grado de incumplimiento de la hipótesis de homogeneidad en la que se sustenta lphom, y (ii) investigar, mediante un conjunto de estudios de simulación desarrollados en diferentes escenarios, las relaciones entre estos indicadores.
Las conclusiones generales de estos estudios permiten desarrollar unos procedimientos para estimar los valores previsibles de EI y EP en estudios reales, así como los límites de confianza superior para los mismos. También se desarrolla un procedimiento para obtener intervalos de confianza para las diferentes probabilidades de transición de votos pjk estimadas mediante lphom. Los métodos desarrollados se ilustran aplicándolos a la estimación del trasvase de votos entre la primera y la segunda vuelta de las elecciones presidenciales francesas de 2017.
Se indican finalmente una serie de líneas futuras de investigación sugeridas por los resultados de esta tesis. / [CAT] L'estimació del transvasament de vots d'uns partits a altres entre dos processos electorals és un tema rellevant dins de la sociología política. Donades les limitacions de les enquestes en aquest camp, hi ha un creixent interés en els procediments d'estimació que utilitzen exclusivamente la realitat inqüestionable dels propis resultats electorals. En aquest sentit, lphom és un mètode senzill que després de ser aplicat aquestos últims anys en alguns estudis reals, ha proporcionat en tots els casos resultats molt razonables.
En la següent tesi, s'aborda el problema, encara no investigat, de desenvolupar procediments per a estimar els margens d'incentidumbre dels resultats obtenguts al aplicar aquest procediment en els estudis reals. Després d'haber definit uns indicadors adecuats, EI y EP, per a quantificar dita incertidumbre, el procés es basa en utilitzar els residus del model lphom per a (i) evaluar el grau de incompliment de la hipótesis d'homogeneïtat en què es sustenta lphom, i (ii) investigar, mitjançant un conjunt d'estudis de simulacions desenvolupades en diferents escenaris, les relacions entre aquestos indicadors.
Les conclusions generals d'aquestos estudis permeten desenvolupar uns procediments per a estimar els valors previsibles de EI y EP en estudis reals, així com els límits de confianza superior per als mateixos. També s'aconsegueix un procediment per a obtindre intervals de confiança per a les diferents probabilitats de transició de vots pjk estimats mediant lphom. Els métodes desenvolupats s'ilustren aplicats a l'estimació del transvasament de vots entre la primera y segona volta de les eleccions presidencials franceses de 2017.
S'indiquen finalment una sèrie de línies futures d'investigació suggerides pels resultats d'aquesta tesi. / [EN] The estimation of the transfer of votes from some political parties to another between two electoral processes is a relevant issue within political sociology. Given the limitations of the surveys in this field, there is a growing interest in estimation procedures that exclusively use the unquestionable reality of the electoral results themselves. In this sense, lphom is a simple method that, after being applied in recent years in some real studies, has provided, in all cases, very reasonable results.
This thesis addresses the problem, so far not investigated, of developing procedures to estimate the margins of uncertainty of the results obtained by applying this procedure in real studies. After defining suitable indicators, EI and EP, to quantify this uncertainty, the process is based on using the residuals of the lphom model to (i) evaluate the degree of non-compliance with the homogeneity hypothesis on which lphom is based, and (ii) investigate, through a set of simulation studies developed in different scenarios, the relationships between these indicators.
The general conclusions of these studies allow the development of procedures to estimate the predictable values of IE and PE in real studies, as well as the upper confidence limits for them. A procedure is also developed to obtain confidence intervals for the different transition probabilities of votes pjk estimated by lphom. The methods developed are illustrated by applying them to the estimation of the transfer of votes between the first and second rounds of the 2017 French presidential elections.
A series of future lines of research suggested by the results of this thesis are finally indicated. / Martín Marín, J. (2020). Análisis de la incertidumbre en la estimación de la movilidad electoral mediante el procedimiento LPHOM [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/157638
|
47 |
Análisis de las estrategias de innovación de federaciones deportivas internacionales y de federaciones de tenis nacionalesCrespo Celda, Miguel 06 October 2022 (has links)
Tesis por compendio / [ES] Esta tesis doctoral analiza las estrategias de innovación de federaciones deportivas internacionales y federaciones nacionales de tenis. Se presenta en la modalidad "por compendio de artículos". El primero estudia las percepciones de entrenadores de tenis sobre las estrategias y programas de innovación de la Real Federación Española de Tenis (RFET). El segundo investiga las percepciones de otros grupos de interés (directivos, gestores, árbitros, etc.) sobre la estrategia innovadora y los programas de la RFET. El tercero amplía el ámbito de estudio a los gerentes y personal administrativo de las distintas federaciones de tenis de Latinoamérica. Finalmente, el cuarto, se centra en estudio de la innovación y del crowdfunding en las federaciones deportivas internacionales. Los estudios también analizaron el impacto de la pandemia COVID-19 en la estructura y capacidad innovadora de estas organizaciones. Las hipótesis plantearon la relevancia de una cultura innovadora en estas entidades, la identificación de programas específicos de cada deporte como los más innovadores y el considerable impacto de la pandemia en estas organizaciones. Se diseñó una metodología mixta que incluyó instrumentos cuantitativos (un cuestionario validado) y cualitativos (entrevistas y consulta de información). Los resultados se analizaron utilizando las herramientas estadísticas habituales y, en general, confirmaron las hipótesis planteadas pues se observó una orientación claramente favorable hacia la adopción de estrategias innovadoras y a la implementación de programas específicamente deportivos como los más innovadores. Nuestros estudios concluyen que es fundamental que estas organizaciones adopten las estrategias innovadoras necesarias para seguir mejorando en la generación e implementación de servicios y productos para satisfacer las necesidades de sus grupos de interés. / [CA] Aquesta tesi doctoral analitza les estratègies d'innovació de federacions esportives internacionals i federacions nacionals de tennis. Es presenta a la modalitat "per compendi d'articles". El primer estudia les percepcions d'entrenadors de tennis sobre les estratègies i els programes d'innovació de la Reial Federació Espanyola de Tennis (RFET). El segon investiga les percepcions d'altres grups d'interès (directius, gestors, àrbitres, etc.) sobre l'estratègia innovadora i els programes de la RFET. El tercer amplia l'àmbit d'estudi als gerents i al personal administratiu de les diferents federacions de tennis de Llatinoamèrica. Finalment, el quart, es centra en l'estudi de la innovació i del crowdfunding a les federacions esportives internacionals. Els estudis també van analitzar l'impacte de la pandèmia COVID-19 en l'estructura i la capacitat innovadora d'aquestes organitzacions. Les hipòtesis van plantejar la rellevància d'una cultura innovadora en aquestes entitats, la identificació de programes específics de cada esport com els més innovadors i el impacte considerable de la pandèmia en aquestes organitzacions. Es va dissenyar una metodologia mixta que va incloure instruments quantitatius (un qüestionari validat) i qualitatius (entrevistes i consulta d'informació). Els resultats es van analitzar utilitzant el programes estadístics habituals i, en general, van confirmar les hipòtesis plantejades, ja que es va observar una orientació clarament favorable cap a l'adopció d'estratègies innovadores i la implementació de programes específicament esportius com els més innovadors. Els nostres estudis conclouen que és fonamental que aquestes organitzacions adopten les estratègies innovadores necessàries per continuar millorant en la generació i la implementació de serveis i productes per satisfer les necessitats dels seus grups d'interès. / [EN] This doctoral thesis analyses the innovation strategies of international sports federations and national tennis federations. It is presented in the form of a "compendium of articles". The first one studies the perceptions of tennis coaches on the innovation strategies and programmes of the Royal Spanish Tennis Federation (RFET). The second investigates the perceptions of other stakeholders (directors, managers, umpires, etc.) on the RFET's innovation strategy and programmes. The third extends the scope of the study to managers and administrative staff of the different tennis federations in Latin America. Finally, the fourth focuses on the study of innovation and crowdfunding in international sports federations. The studies also analysed the impact of the COVID-19 pandemic on the structure and innovative capacity of these organisations. The hypotheses raised the relevance of an innovative culture in these organisations, the identification of sport-specific programmes as the most innovative and the considerable impact of the pandemic on these organisations. A mixed methodology was designed that included both quantitative (a validated questionnaire) and qualitative (interviews and data collection) instruments. The results were analysed using the usual statistical tools and, in general, confirmed the hypotheses put forward as there was a clear favourable orientation towards the adoption of innovative strategies and the implementation of sport-specific programmes as the most innovative. Our studies conclude that it is essential for these organisations to adopt the necessary innovative strategies to further improve the generation and implementation of services and products to meet the needs of their stakeholders. / Crespo Celda, M. (2022). Análisis de las estrategias de innovación de federaciones deportivas internacionales y de federaciones de tenis nacionales [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/187328 / Compendio
|
48 |
Chemometric Approaches for Systems BiologyFolch Fortuny, Abel 23 January 2017 (has links)
The present Ph.D. thesis is devoted to study, develop and apply approaches commonly used in chemometrics to the emerging field of systems biology. Existing procedures and new methods are applied to solve research and industrial questions in different multidisciplinary teams. The methodologies developed in this document will enrich the plethora of procedures employed within omic sciences to understand biological organisms and will improve processes in biotechnological industries integrating biological knowledge at different levels and exploiting the software packages derived from the thesis.
This dissertation is structured in four parts. The first block describes the framework in which the contributions presented here are based. The objectives of the two research projects related to this thesis are highlighted and the specific topics addressed in this document via conference presentations and research articles are introduced. A comprehensive description of omic sciences and their relationships within the systems biology paradigm is given in this part, jointly with a review of the most applied multivariate methods in chemometrics, on which the novel approaches proposed here are founded.
The second part addresses many problems of data understanding within metabolomics, fluxomics, proteomics and genomics. Different alternatives are proposed in this block to understand flux data in steady state conditions. Some are based on applications of multivariate methods previously applied in other chemometrics areas. Others are novel approaches based on a bilinear decomposition using elemental metabolic pathways, from which a GNU licensed toolbox is made freely available for the scientific community. As well, a framework for metabolic data understanding is proposed for non-steady state data, using the same bilinear decomposition proposed for steady state data, but modelling the dynamics of the experiments using novel two and three-way data analysis procedures. Also, the relationships between different omic levels are assessed in this part integrating different sources of information of plant viruses in data fusion models. Finally, an example of interaction between organisms, oranges and fungi, is studied via multivariate image analysis techniques, with future application in food industries.
The third block of this thesis is a thoroughly study of different missing data problems related to chemometrics, systems biology and industrial bioprocesses. In the theoretical chapters of this part, new algorithms to obtain multivariate exploratory and regression models in the presence of missing data are proposed, which serve also as preprocessing steps of any other methodology used by practitioners. Regarding applications, this block explores the reconstruction of networks in omic sciences when missing and faulty measurements appear in databases, and how calibration models between near infrared instruments can be transferred, avoiding costs and time-consuming full recalibrations in bioindustries and research laboratories. Finally, another software package, including a graphical user interface, is made freely available for missing data imputation purposes.
The last part discusses the relevance of this dissertation for research and biotechnology, including proposals deserving future research. / Esta tesis doctoral se centra en el estudio, desarrollo y aplicación de técnicas quimiométricas en el emergente campo de la biología de sistemas. Procedimientos comúnmente utilizados y métodos nuevos se aplican para resolver preguntas de investigación en distintos equipos multidisciplinares, tanto del ámbito académico como del industrial. Las metodologías desarrolladas en este documento enriquecen la plétora de técnicas utilizadas en las ciencias ómicas para entender el funcionamiento de organismos biológicos y mejoran los procesos en la industria biotecnológica, integrando conocimiento biológico a diferentes niveles y explotando los paquetes de software derivados de esta tesis.
Esta disertación se estructura en cuatro partes. El primer bloque describe el marco en el cual se articulan las contribuciones aquí presentadas. En él se esbozan los objetivos de los dos proyectos de investigación relacionados con esta tesis. Asimismo, se introducen los temas específicos desarrollados en este documento mediante presentaciones en conferencias y artículos de investigación. En esta parte figura una descripción exhaustiva de las ciencias ómicas y sus interrelaciones en el paradigma de la biología de sistemas, junto con una revisión de los métodos multivariantes más aplicados en quimiometría, que suponen las pilares sobre los que se asientan los nuevos procedimientos aquí propuestos.
La segunda parte se centra en resolver problemas dentro de metabolómica, fluxómica, proteómica y genómica a partir del análisis de datos. Para ello se proponen varias alternativas para comprender a grandes rasgos los datos de flujos metabólicos en estado estacionario. Algunas de ellas están basadas en la aplicación de métodos multivariantes propuestos con anterioridad, mientras que otras son técnicas nuevas basadas en descomposiciones bilineales utilizando rutas metabólicas elementales. A partir de éstas se ha desarrollado software de libre acceso para la comunidad científica. A su vez, en esta tesis se propone un marco para analizar datos metabólicos en estado no estacionario. Para ello se adapta el enfoque tradicional para sistemas en estado estacionario, modelando las dinámicas de los experimentos empleando análisis de datos de dos y tres vías. En esta parte de la tesis también se establecen relaciones entre los distintos niveles ómicos, integrando diferentes fuentes de información en modelos de fusión de datos. Finalmente, se estudia la interacción entre organismos, como naranjas y hongos, mediante el análisis multivariante de imágenes, con futuras aplicaciones a la industria alimentaria.
El tercer bloque de esta tesis representa un estudio a fondo de diferentes problemas relacionados con datos faltantes en quimiometría, biología de sistemas y en la industria de bioprocesos. En los capítulos más teóricos de esta parte, se proponen nuevos algoritmos para ajustar modelos multivariantes, tanto exploratorios como de regresión, en presencia de datos faltantes. Estos algoritmos sirven además como estrategias de preprocesado de los datos antes del uso de cualquier otro método. Respecto a las aplicaciones, en este bloque se explora la reconstrucción de redes en ciencias ómicas cuando aparecen valores faltantes o atípicos en las bases de datos. Una segunda aplicación de esta parte es la transferencia de modelos de calibración entre instrumentos de infrarrojo cercano, evitando así costosas re-calibraciones en bioindustrias y laboratorios de investigación. Finalmente, se propone un paquete software que incluye una interfaz amigable, disponible de forma gratuita para imputación de datos faltantes.
En la última parte, se discuten los aspectos más relevantes de esta tesis para la investigación y la biotecnología, incluyendo líneas futuras de trabajo. / Aquesta tesi doctoral es centra en l'estudi, desenvolupament, i aplicació de tècniques quimiomètriques en l'emergent camp de la biologia de sistemes. Procediments comúnment utilizats i mètodes nous s'apliquen per a resoldre preguntes d'investigació en diferents equips multidisciplinars, tant en l'àmbit acadèmic com en l'industrial. Les metodologies desenvolupades en aquest document enriquixen la plétora de tècniques utilitzades en les ciències òmiques per a entendre el funcionament d'organismes biològics i milloren els processos en la indústria biotecnològica, integrant coneixement biològic a distints nivells i explotant els paquets de software derivats d'aquesta tesi.
Aquesta dissertació s'estructura en quatre parts. El primer bloc descriu el marc en el qual s'articulen les contribucions ací presentades. En ell s'esbossen els objectius dels dos projectes d'investigació relacionats amb aquesta tesi. Així mateix, s'introduixen els temes específics desenvolupats en aquest document mitjançant presentacions en conferències i articles d'investigació. En aquesta part figura una descripació exhaustiva de les ciències òmiques i les seues interrelacions en el paradigma de la biologia de sistemes, junt amb una revisió dels mètodes multivariants més aplicats en quimiometria, que supossen els pilars sobre els quals s'assenten els nous procediments ací proposats.
La segona part es centra en resoldre problemes dins de la metabolòmica, fluxòmica, proteòmica i genòmica a partir de l'anàlisi de dades. Per a això es proposen diverses alternatives per a compendre a grans trets les dades de fluxos metabòlics en estat estacionari. Algunes d'elles estàn basades en l'aplicació de mètodes multivariants propostos amb anterioritat, mentre que altres són tècniques noves basades en descomposicions bilineals utilizant rutes metabòliques elementals. A partir d'aquestes s'ha desenvolupat software de lliure accés per a la comunitat científica. Al seu torn, en aquesta tesi es proposa un marc per a analitzar dades metabòliques en estat no estacionari. Per a això s'adapta l'enfocament tradicional per a sistemes en estat estacionari, modelant les dinàmiques dels experiments utilizant anàlisi de dades de dues i tres vies. En aquesta part de la tesi també s'establixen relacions entre els distints nivells òmics, integrant diferents fonts d'informació en models de fusió de dades. Finalment, s'estudia la interacció entre organismes, com taronges i fongs, mitjançant l'anàlisi multivariant d'imatges, amb futures aplicacions a la indústria alimentària.
El tercer bloc d'aquesta tesi representa un estudi a fons de diferents problemes relacionats amb dades faltants en quimiometria, biologia de sistemes i en la indústria de bioprocessos. En els capítols més teòrics d'aquesta part, es proposen nous algoritmes per a ajustar models multivariants, tant exploratoris com de regressió, en presencia de dades faltants. Aquests algoritmes servixen ademés com a estratègies de preprocessat de dades abans de l'ús de qualsevol altre mètode. Respecte a les aplicacions, en aquest bloc s'explora la reconstrucció de xarxes en ciències òmiques quan apareixen valors faltants o atípics en les bases de dades. Una segona aplicació d'aquesta part es la transferència de models de calibració entre instruments d'infrarroig proper, evitant així costoses re-calibracions en bioindústries i laboratoris d'investigació. Finalment, es proposa un paquet software que inclou una interfície amigable, disponible de forma gratuïta per a imputació de dades faltants.
En l'última part, es discutixen els aspectes més rellevants d'aquesta tesi per a la investigació i la biotecnologia, incloent línies futures de treball. / Folch Fortuny, A. (2016). Chemometric Approaches for Systems Biology [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/77148 / Premios Extraordinarios de tesis doctorales
|
49 |
Advances on the Transcription of Historical Manuscripts based on Multimodality, Interactivity and CrowdsourcingGranell Romero, Emilio 01 September 2017 (has links)
Natural Language Processing (NLP) is an interdisciplinary research field of Computer Science, Linguistics, and Pattern Recognition that studies, among others, the use of human natural languages in Human-Computer Interaction (HCI). Most of NLP research tasks can be applied for solving real-world problems. This is the case of natural language recognition and natural language translation, that can be used for building automatic systems for document transcription and document translation.
Regarding digitalised handwritten text documents, transcription is used to obtain an easy digital access to the contents, since simple image digitalisation only provides, in most cases, search by image and not by linguistic contents (keywords, expressions, syntactic or semantic categories). Transcription is even more important in historical manuscripts, since most of these documents are unique and the preservation of their contents is crucial for cultural and historical reasons.
The transcription of historical manuscripts is usually done by paleographers, who are experts on ancient script and vocabulary. Recently, Handwritten Text Recognition (HTR) has become a common tool for assisting paleographers in their task, by providing a draft transcription that they may amend with more or less sophisticated methods. This draft transcription is useful when it presents an error rate low enough to make the amending process more comfortable than a complete transcription from scratch. Thus, obtaining a draft transcription with an acceptable low error rate is crucial to have this NLP technology incorporated into the transcription process.
The work described in this thesis is focused on the improvement of the draft transcription offered by an HTR system, with the aim of reducing the effort made by paleographers for obtaining the actual transcription on digitalised historical manuscripts.
This problem is faced from three different, but complementary, scenarios:
· Multimodality: The use of HTR systems allow paleographers to speed up the manual transcription process, since they are able to correct on a draft transcription. Another alternative is to obtain the draft transcription by dictating the contents to an Automatic Speech Recognition (ASR) system. When both sources (image and speech) are available, a multimodal combination is possible and an iterative process can be used in order to refine the final hypothesis.
· Interactivity: The use of assistive technologies in the transcription process allows one to reduce the time and human effort required for obtaining the actual transcription, given that the assistive system and the palaeographer cooperate to generate a perfect transcription.
Multimodal feedback can be used to provide the assistive system with additional sources of information by using signals that represent the whole same sequence of words to transcribe (e.g. a text image, and the speech of the dictation of the contents of this text image), or that represent just a word or character to correct (e.g. an on-line handwritten word).
· Crowdsourcing: Open distributed collaboration emerges as a powerful tool for massive transcription at a relatively low cost, since the paleographer supervision effort may be dramatically reduced. Multimodal combination allows one to use the speech dictation of handwritten text lines in a multimodal crowdsourcing platform, where collaborators may provide their speech by using their own mobile device instead of using desktop or laptop computers, which makes it possible to recruit more collaborators. / El Procesamiento del Lenguaje Natural (PLN) es un campo de investigación interdisciplinar de las Ciencias de la Computación, Lingüística y Reconocimiento de Patrones que estudia, entre otros, el uso del lenguaje natural humano en la interacción Hombre-Máquina. La mayoría de las tareas de investigación del PLN se pueden aplicar para resolver problemas del mundo real. Este es el caso del reconocimiento y la traducción del lenguaje natural, que se pueden utilizar para construir sistemas automáticos para la transcripción y traducción de documentos.
En cuanto a los documentos manuscritos digitalizados, la transcripción se utiliza para facilitar el acceso digital a los contenidos, ya que la simple digitalización de imágenes sólo proporciona, en la mayoría de los casos, la búsqueda por imagen y no por contenidos lingüísticos. La transcripción es aún más importante en el caso de los manuscritos históricos, ya que la mayoría de estos documentos son únicos y la preservación de su contenido es crucial por razones culturales e históricas.
La transcripción de manuscritos históricos suele ser realizada por paleógrafos, que son personas expertas en escritura y vocabulario antiguos. Recientemente, los sistemas de Reconocimiento de Escritura (RES) se han convertido en una herramienta común para ayudar a los paleógrafos en su tarea, la cual proporciona un borrador de la transcripción que los paleógrafos pueden corregir con métodos más o menos sofisticados. Este borrador de transcripción es útil cuando presenta una tasa de error suficientemente reducida para que el proceso de corrección sea más cómodo que una completa transcripción desde cero. Por lo tanto, la obtención de un borrador de transcripción con una baja tasa de error es crucial para que esta tecnología de PLN sea incorporada en el proceso de transcripción.
El trabajo descrito en esta tesis se centra en la mejora del borrador de transcripción ofrecido por un sistema RES, con el objetivo de reducir el esfuerzo realizado por los paleógrafos para obtener la transcripción de manuscritos históricos digitalizados.
Este problema se enfrenta a partir de tres escenarios diferentes, pero complementarios:
· Multimodalidad: El uso de sistemas RES permite a los paleógrafos acelerar el proceso de transcripción manual, ya que son capaces de corregir en un borrador de la transcripción. Otra alternativa es obtener el borrador de la transcripción dictando el contenido a un sistema de Reconocimiento Automático de Habla. Cuando ambas fuentes están disponibles, una combinación multimodal de las mismas es posible y se puede realizar un proceso iterativo para refinar la hipótesis final.
· Interactividad: El uso de tecnologías asistenciales en el proceso de transcripción permite reducir el tiempo y el esfuerzo humano requeridos para obtener la transcripción correcta, gracias a la cooperación entre el sistema asistencial y el paleógrafo para obtener la transcripción perfecta. La realimentación multimodal se puede utilizar en el sistema asistencial para proporcionar otras fuentes de información adicionales con señales que representen la misma secuencia de palabras a transcribir (por ejemplo, una imagen de texto, o la señal de habla del dictado del contenido de dicha imagen de texto), o señales que representen sólo una palabra o carácter a corregir (por ejemplo, una palabra manuscrita mediante una pantalla táctil).
· Crowdsourcing: La colaboración distribuida y abierta surge como una poderosa herramienta para la transcripción masiva a un costo relativamente bajo, ya que el esfuerzo de supervisión de los paleógrafos puede ser drásticamente reducido. La combinación multimodal permite utilizar el dictado del contenido de líneas de texto manuscrito en una plataforma de crowdsourcing multimodal, donde los colaboradores pueden proporcionar las muestras de habla utilizando su propio dispositivo móvil en lugar de usar ordenadores, / El Processament del Llenguatge Natural (PLN) és un camp de recerca interdisciplinar de les Ciències de la Computació, la Lingüística i el Reconeixement de Patrons que estudia, entre d'altres, l'ús del llenguatge natural humà en la interacció Home-Màquina. La majoria de les tasques de recerca del PLN es poden aplicar per resoldre problemes del món real. Aquest és el cas del reconeixement i la traducció del llenguatge natural, que es poden utilitzar per construir sistemes automàtics per a la transcripció i traducció de documents.
Quant als documents manuscrits digitalitzats, la transcripció s'utilitza per facilitar l'accés digital als continguts, ja que la simple digitalització d'imatges només proporciona, en la majoria dels casos, la cerca per imatge i no per continguts lingüístics (paraules clau, expressions, categories sintàctiques o semàntiques). La transcripció és encara més important en el cas dels manuscrits històrics, ja que la majoria d'aquests documents són únics i la preservació del seu contingut és crucial per raons culturals i històriques.
La transcripció de manuscrits històrics sol ser realitzada per paleògrafs, els quals són persones expertes en escriptura i vocabulari antics. Recentment, els sistemes de Reconeixement d'Escriptura (RES) s'han convertit en una eina comuna per ajudar els paleògrafs en la seua tasca, la qual proporciona un esborrany de la transcripció que els paleògrafs poden esmenar amb mètodes més o menys sofisticats. Aquest esborrany de transcripció és útil quan presenta una taxa d'error prou reduïda perquè el procés de correcció siga més còmode que una completa transcripció des de zero. Per tant, l'obtenció d'un esborrany de transcripció amb un baixa taxa d'error és crucial perquè aquesta tecnologia del PLN siga incorporada en el procés de transcripció.
El treball descrit en aquesta tesi se centra en la millora de l'esborrany de la transcripció ofert per un sistema RES, amb l'objectiu de reduir l'esforç realitzat pels paleògrafs per obtenir la transcripció de manuscrits històrics digitalitzats.
Aquest problema s'enfronta a partir de tres escenaris diferents, però complementaris:
· Multimodalitat: L'ús de sistemes RES permet als paleògrafs accelerar el procés de transcripció manual, ja que són capaços de corregir un esborrany de la transcripció. Una altra alternativa és obtenir l'esborrany de la transcripció dictant el contingut a un sistema de Reconeixement Automàtic de la Parla. Quan les dues fonts (imatge i parla) estan disponibles, una combinació multimodal és possible i es pot realitzar un procés iteratiu per refinar la hipòtesi final.
· Interactivitat: L'ús de tecnologies assistencials en el procés de transcripció permet reduir el temps i l'esforç humà requerits per obtenir la transcripció real, gràcies a la cooperació entre el sistema assistencial i el paleògraf per obtenir la transcripció perfecta. La realimentació multimodal es pot utilitzar en el sistema assistencial per proporcionar fonts d'informació addicionals amb senyals que representen la mateixa seqüencia de paraules a transcriure (per exemple, una imatge de text, o el senyal de parla del dictat del contingut d'aquesta imatge de text), o senyals que representen només una paraula o caràcter a corregir (per exemple, una paraula manuscrita mitjançant una pantalla tàctil).
· Crowdsourcing: La col·laboració distribuïda i oberta sorgeix com una poderosa eina per a la transcripció massiva a un cost relativament baix, ja que l'esforç de supervisió dels paleògrafs pot ser reduït dràsticament. La combinació multimodal permet utilitzar el dictat del contingut de línies de text manuscrit en una plataforma de crowdsourcing multimodal, on els col·laboradors poden proporcionar les mostres de parla utilitzant el seu propi dispositiu mòbil en lloc d'utilitzar ordinadors d'escriptori o portàtils, la qual cosa permet ampliar el nombr / Granell Romero, E. (2017). Advances on the Transcription of Historical Manuscripts based on Multimodality, Interactivity and Crowdsourcing [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/86137
|
50 |
Application of multivariate image analysis to prostate cancer for improving the comprehension of the related physiological phenomena and the development and validation of new imaging biomarkersAguado Sarrió, Eric 07 January 2020 (has links)
[ES] El aumento de la esperanza de vida en la población con edad por encima de 50 años está generando un mayor número de casos detectados de cáncer de próstata (CaP). Por este motivo, los recursos se destinan al diagnóstico en etapas tempranas y al tratamiento efectivo. A pesar de la multitud de estudios basados en biomarcadores y discriminación histológica, es difícil diferenciar con efectividad los casos de CaP con baja agresividad de aquellos que progresarán y acabarán produciendo mortalidad o una disminución en la esperanza de vida del paciente. Con el objetivo de mejorar el diagnostico, localización y gradación de los tumores malignos, las técnicas de imagen por Resonancia Magnética (MRI) son las más adecuadas para el estudio del cáncer, proporcionando métodos de diagnóstico no-invasivos, sensibles y específicos, basados en secuencias morfológicas (T2w) y funcionales (perfusión de la sangre y difusión del agua). Las diferentes características y parámetros extraídos de estas secuencias, conocidos como biomarcadores de imagen, pueden evaluar las diferencias asociadas al desarrollo de los procesos tumorales, como los modelos farmacocinéticos para estudiar angiogénesis (perfusión) y los modelos mono- y bi-exponenciales para estudiar la caída de la señal en difusión con el objetivo de estudiar la celularización. Normalmente, estos biomarcadores de imagen se analizan de forma "univariante", sin aprovechar la información de las estructuras de correlación interna que existen entre ellos. Una manera de mejorar este análisis es mediante la aplicación de las técnicas estadísticas que ofrece el Análisis Multivariante de Imágenes (MIA), obteniendo estructuras (latentes) simplificadas que ayudan a entender la relación entre los parámetros (variables) y sus propios procesos fisiológicos, además de reducir la incertidumbre en la estimación de los biomarcadores. En esta tesis, se han desarrollado nuevos biomarcadores de imagen para perfusión y difusión con la aplicación de alguna de las herramientas de MIA como la Resolución Multivariante de Curvas con Mínimos Cuadrados Alternos (MCR-ALS), obteniendo parámetros que tienen interpretación clínica directa. A continuación, los métodos basados en mínimos cuadrados parciales (PLS) se aplicaron para estudiar la capacidad de clasificación de estos biomarcadores. En primer lugar, los biomarcadores de perfusión se utilizaron para la detección de tumores (control vs lesión). Posteriormente, la combinación de perfusión + difusión + T2 se empleó para estudiar agresividad tumoral con la aplicación de métodos PLS multibloque, en concreto (secuencial) SMB-PLS. Los resultados mostrados indican que los biomarcadores de perfusión obtenidos mediante MCR son mejores que los parámetros farmacocinéticos en la diferenciación de la lesión. Con lo que respecta al estudio de la agresividad tumoral, la combinación de los biomarcadores de difusión (empleando ambos métodos: modelos paramétricos y MCR) y los valores de T2w normalizados proporcionaron los mejores resultados.
En conclusión, MIA se puede aplicar a las secuencias morfológicas y funcionales de resonancia magnética para mejorar el diagnóstico y el estudio de la agresividad de los tumores en próstata. Obteniendo nuevos parámetros cuantitativos y combinándolos con los biomarcadores más ampliamente utilizados en el ambiente clínico. / [CA] El increment de la esperança de vida en la població per damunt dels 50 anys està generant un major nombre de casos detectats de càncer de pròstata (CaP). Per aquest motiu, els recursos es destinen al diagnòstic en etapes primerenques i al tractament efectiu. Tot i la multitud de estudis basats en biomarcadors y discriminació histològica, es difícil diferenciar amb efectivitat els casos de CaP que tenen baixa agressivitat dels que progressaran y acabaran produint mortalitat o una disminució en la esperança de vida del pacient. Amb el objectiu de millorar el diagnòstic, localització y gradació dels tumors malignes, les tècniques de imatge per Ressonància Magnètica (MRI) son els mètodes més adequats per al estudi del càncer, proporcionant metodologies de diagnòstic no-invasius, sensibles y específiques basades en seqüències morfològiques (T2w) y funcionals (perfusió de la sang y difusió del aigua). Les diferents característiques i paràmetres extrets de aquestes seqüències, coneguts com biomarcadors d'imatge, poden avaluar les diferències associades al desenvolupament dels processos tumorals. Primer, amb els models farmacocinétics per a estudiar angiogènesis (perfusió) y segon, amb els models mono- i bi-exponencials per a estudiar la caiguda de la senyal en difusió amb el objectiu de estudiar la cel·lularització. Normalment, aquests biomarcadors d'imatge s'analitzen de forma "univariant", sense aprofitar la informació de las estructures de correlació interna que existeixen entre ells. Una forma de millorar aquest anàlisis es mitjançant la aplicació de las tècniques estadístiques aportades pel Anàlisis Multivariant de Imatges (MIA), obtenint estructures (latents) simplificades què ajuden a entendre la relació entre els paràmetres (variables) i els seus processos fisiològics, a més de reduir la incertesa en la estimació dels biomarcadors. En aquesta tesis, s'han desenvolupat nous biomarcadors d'imatge per a perfusió i difusió amb la aplicació de alguna de las ferramentes de MIA com la Resolució Multivariant de Corbes i Mínims Quadrats Alterns (MCR-ALS), obtenint paràmetres què tenen interpretació clínica directa. A continuació, els mètodes basats en mínims quadrats parcials (PLS) s'han aplicat per a estudiar la capacitat de classificació d'aquests biomarcadors. En primer lloc, els biomarcadors de perfusió s'han utilitzat per a la detecció de tumors (control contra lesió). Posteriorment, la combinació de perfusió + difusió + T2 s'ha utilitzat per a estudiar agressivitat tumoral amb la aplicació de mètodes PLS multi-bloc, en concret (seqüencial) SMB-PLS. Els resultats mostren què els biomarcadors de perfusió obtinguts mitjançant MCR són millors què els paràmetres farmacocinètics en la diferenciació de la lesió. En lo què es refereix al estudi de la agressivitat tumoral, la combinació dels biomarcadors de difusió (utilitzant els dos mètodes: models paramètrics i MCR) i els valors de T2w normalitzats proporcionaren els millors resultats.
En conclusió, MIA es pot aplicar a les seqüències morfològiques i funcionals de ressonància magnètica per a millorar el diagnòstic i el estudi de l'agressivitat dels tumors en pròstata. Obtenint nous paràmetres quantitatius y combinant-los amb els biomarcadors més utilitzats en el ambient clínic. / [EN] The increase in life expectancy and population with age higher than 50 years is producing a major number of detected cases of prostate cancer (PCa). For this reason, the resources are focused in the early diagnosis and effective treatment. In spite of multiple studies with histologic discriminant biomarkers, it is hard to clearly differentiate the low aggressiveness PCa cases from those that will progress and produce mortality or rather a decrease in the life expectancy.
With the objective of improving the diagnosis, location and gradation of the malignant tumors, Magnetic Resonance Imaging (MRI) has come up as the most appropriate image acquisition technique for cancer studies, which provides a non-invasive, sensitive and specific diagnosis, based on morphological and functional (blood perfusion and water diffusion) sequences. The different characteristics and parameters extracted from these sequences, known as imaging biomarkers, can evaluate the different processes associated to tumor development, like pharmacokinetic modeling for angiogenesis assessment (perfusion) or mono- and bi-exponential signal decay modeling for cellularization (diffusion).
Normally, these imaging biomarkers are analyzed in a "univariate" way, without taking advantage of the internal correlation structures among them. One way to improve this analysis is by applying Multivariate Image Analysis (MIA) statistical techniques, obtaining simplified (latent) structures that help to understand the relation between parameters (variables) and the inner physiological processes, moreover reducing the uncertainty in the estimation of the biomarkers.
In this thesis, new imaging biomarkers are developed for perfusion and diffusion by applying MIA tools like Multivariate Curve Resolution Alternating Least Squares (MCR-ALS), obtaining parameters with direct clinical interpretation. Partial Least Squares (PLS) based methods are then used for studying the classification capability of these biomarkers. First, perfusion imaging biomarkers have been tested for tumor detection (control vs lesion). Then, diffusion + perfusion have been combined to study tumor aggressiveness by applying PLS-multiblock methods (SMB-PLS).
The results showed that MCR-based perfusion biomarkers performed better than state-of-the-art pharmacokinetic parameters for lesion differentiation. Regarding the assessment of tumor aggressiveness, the combination of diffusion-based imaging biomarkers (using both the parametric models and MCR) and normalized T2-weighted measurements provided the best discriminating outcome, while perfusion was not needed as it did not supply additional information.
In conclusion, MIA can be applied to morphologic and functional MRI to improve the diagnosis and aggressiveness assessment of prostate tumors by obtaining new quantitative parameters and combining them with state-of-the-art imaging biomarkers. / Aguado Sarrió, E. (2019). Application of multivariate image analysis to prostate cancer for improving the comprehension of the related physiological phenomena and the development and validation of new imaging biomarkers [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/134023
|
Page generated in 0.0941 seconds