Global ETD Search

81	Aplicaciones de los autómatas transductores finitos con pesos (WFST) en la corrección simbólica en interfaces persona-máquina Navarro Cerdán, José Ramón 18 April 2016 (has links) [EN] In this thesis a real application related to the string correction process from an OCR classifier in a form digitizing task is presented. These strings come from a classifier with a given error ratio that implies that some characters in the string have been potentially misclassified, producing erroneous words. This raises the need to introduce some kind of postprocess to improve the strings. The implementation of such postprocess takes into account all the available evidence in a given moment. In the case proposed here, these evidences are the charactersrecognized by the classifier with their posterior probabilities, the confusion matrix between symbols and the language model finally accepted. Each evidence is modelled independently by means of a WFST and then combined by means of the composition operation into a single integrated automata. From this automata, the path that maximizes the probability is selected. This path is the string, that belongs to the language model, that is the nearest string to the OCR hypothesis according to the confusion matrix. The final system offers two different results: on the one hand the corrected string, on the other hand the transformation cost produced during the string correction. Additionally, it is proposed a general method of error estimation using the input string transformation cost that establishes a threshold in terms of the cost and the proposed end-user parameter: the acceptable final error. This thesis presents a method for estimating adaptive rejection threshold estimation that allows for a certain percentage of error in a lot of strings from one language (sample) that presents several advantages. On the one hand, it is independent from transformation cost postprocessing distribution of such samples. On the other hand, it allows the user to set the threshold for a familiar and advantageous manner, as is setting the desired rate of sampling error. For this, first, and for a given language, a model that estimates the probability of error associated with the acceptation of postprocessed strings with a given transformation cost is defined. Then, the procedure that performs the rejection threshold estimation adaptively in order to achieve predefined rate error for a test batch is presented. In addition, an approach to obtain the above model is proposed when there are no real and supervised OCR hypothesis in the learning stage. The chapter is accompanied by experiments whose results demonstrate the utility of the proposed method. Next, linking in somehow with the search for an increased productivity in a possible string validation task, of previously strings rejected by the system through the foregoing error estimation method, a method of multimodal and interactive human-computer interaction that composes the above information with the prefix introduced by the user, while the validation process occurs, making use, for this, of WFST and the automata composition operation. The search for the most likely string for each new interaction offered by the user, in the composed automata, presented here, shows a clear increase in productivity by requiring fewer keystrokes in obtaining the correct string. Finally, a tolerant fault multimodal and interactive interface, using also WFST, is shown by making the composition of different information sources together with an error model related with the possible confusion caused due to the arrangement of keys on a keyboard. The application shown in this case is related to the introduction of a destination into a GPS device where is considered both the information related to the next destinations to a specific place, such as the information related to the entered prefix and errors that may occur due to the arrangement of keys on the input device considered. / [ES] En esta tesis se presenta inicialmente una aplicación real de corrección de cadenas procedentes de un clasificador OCR en una tarea de digitalización de formularios. Estas cadenas, proceden de un clasificador con cierta probabilidad de error, lo que implica la posibilidad de que alguno de los caracteres pertenecientes a una palabra sea erróneo, produciendo finalmente palabras incorrectas. Esto plantea la necesidad de introducir algún tipo de postproceso que mejore dichas cadenas. Para implementar dicho postproceso, se tienen en cuenta todas las evidencias disponibles en un momento dado. En el caso propuesto aquí serán los caracteres reconocidos por el propio clasificador con su probabilidad a posteriori, la matriz de confusión entre símbolos y el modelo de lenguaje finalmente aceptado. Cada una de estas evidencias se modela de manera independiente en forma de un WFST. Una vez modeladas se fusionan mediante la operación de composición de autómatas en un único autómata integrado. A partir de este autómata, se selecciona el camino que maximiza la probabilidad y que corresponde con la cadena perteneciente al lenguaje más cercana a la hipótesis OCR según la matriz de confusión entre símbolos. El sistema final ofrecerá dos resultados diferentes: por una parte la cadena corregida y por otra el coste de transformación de dicha corrección. Por otra parte, se plantea un método general de estimación del error frente a un coste de transformación de las cadenas de entrada que permite establecer un umbral dinámico en función de dicho coste y un parámetro propuesto por el usuario final: el error final asumible. Para ello en esta tesis se presenta un método adaptativo de estimación del umbral de rechazo que permite estimarlo para obtener un determinado porcentaje de error en un lote de cadenas de un lenguaje (muestra) que presenta diversas ventajas. Por un lado, es independiente de la distribución de los costes de transformación de dichas muestras. Por otro lado, permite al usuario establecer el umbral de una manera familiar y ventajosa, como es fijando la tasa de error deseada de la muestra. Para todo ello, en primer lugar, y para un lenguaje dado, se define un modelo que estima la probabilidad de error asociada a aceptar cadenas con un coste de transformación determinado. A continuación, se expone el procedimiento que lleva a cabo la estimación del umbral de rechazo de manera adaptativa con el objetivo de alcanzar la tasa de error predefinida para un lote de test. Además, se propone una aproximación para la obtención del modelo anterior cuando no se dispone de hipótesis OCR reales y supervisadas en la etapa de aprendizaje. Seguidamente y enlazando en cierta forma con la búsqueda de un incremento de productividad en una posible validación de las cadenas, previamente rechazadas por el sistema a través del método de estimación del error anteriormente expuesto, se presenta un método de interacción persona-máquina multimodal e interactivo que fusiona la información anterior junto al prefijo introducido, por el propio usuario, durante dicho proceso de validación, haciendo uso para ello de los WFST y la operación de composición de autómatas. Para finalizar, se muestra otra interfaz multimodal e interactiva tolerante a fallos, mediante la fusión de diferentes fuentes de información junto a un modelo de error relacionado con las posibles confusiones producidas debido a la disposición de las teclas de un teclado. Para ello, se hace uso también de WFST para su modelado. La aplicación mostrada en este caso está relacionada con la introducción de un destino en un dispositivo GPS y en ella se considera, tanto la información de los destinos próximos a un lugar concreto, como la información relativa al prefijo introducido y los errores que pueden aparecer debido a la propia disposición de las teclas en el dispositivo de entrada. / [CA] En aquesta tesi es presenta inicialment una aplicació real de correcció de cadenes procedents d'un classificador OCR en una tasca de digitalització de formularis. Aquestes cadenes, procedeixen d'un classificador amb una determinada probabilitat d'error, la qual cosa implica la possibilitat de que algun dels caràcters que pertanyen a una paraula siga erroni, produint finalment paraules incorrectes. Això planteja la necessitat d'introduir algun tipus de postprocés que millore aquestes cadenes. Per implementar aquest postprocés, es tenen en compte totes les evidències disponibles en un moment donat. En el cas proposat ací, seran els caràcters reconeguts pel propi classificador amb la seua probabilitat a posteriori, la matriu de confusió entre símbols i el model de llenguatge finalment acceptat. Cadascuna d'aquestes evidències es modela de manera independent en forma d'un WFST. Una vegada modelades es fusionen mitjançant l'operació de composició d'autòmats en un únic autòmat integrat. A partir d'aquest autòmat, es selecciona el camí que fa màxima la probabilitat i que es correspon amb la cadena més propera a la hipòtesi OCR que pertany al llenguatge segons la matriu de confusió entre símbols. El sistema final oferirà dos resultats diferents: d'una banda la cadena corregida, i d'una altra, el cost de transformació d'aquesta correcció. D'una altra banda, es planteja un mètode general d'estimació de l'error front al cost de transformació de les cadenes d'entrada que permet establir un llindar dinàmic en funció d'aquest cost i un paràmetre proposat per l'usuari final: l'error final assumible. Per això en aquesta tesi es presenta un mètode adaptatiu d'estimació de rebuig, amb la finalitat d'obtindre un determinat percentatge d'error en un lot de cadenes d'un llenguatge (mostra) que presenta diversos avantatges. D'una banda és independent de la distribució dels costos de transformació de les mostres esmentades. D'altra banda, permet l'usuari establir el llindar d'una manera familiar i avantatjosa, com és fixant la tasa d'error desitjada per la mostra. Per tot això, en primer lloc, i donat un llenguatge, es defineix un model que estima la probabilitat d'error associada a acceptar cadenes amb un cost de transformació determinat. A continuació, s'exposa el procediment que du a terme l'estimació del llindar de rebuig de manera adaptativa amb l'objectiu de arribar a la tasa d'error predefinida per a un lot de test. A més a més, es proposa una aproximació per a obtindre el model anterior quant no es disposa d'hipòtesi OCR reals i supervisades a l'etapa d'aprenentatge. Seguidament, i enllaçant amb la recerca d'un increment en la productivitat en una possible validació de cadenes prèviament rebutjades pel sistema a través del mètode d'estimació de l'error anteriorment exposat, es presenta un mètode d'interacció persona-màquina multimodal i interactiu que fusiona la informació anterior, juntament amb el prefix introduït pel propi usuari durant l'esmentat procés de validació, fent ús dels WFST i l'operació de composició d'autòmats. La recerca de la cadena més probable, en cada nova interacció oferida per l'usuari ens mostra un clar increment de la productivitat, al requerir un nombre menor de pulsacions de teclat per obtindre la cadena correcta. Per finalitzar, es mostra una altra interfície multimodal i interactiva tolerant a errades, mitjançant la fusió de diferents fonts d'informació juntament a un model d'error relacionat amb les possibles confusions produïdes a causa de la disposició de les lletres d'un teclat. En aquest cas es fa ús també dels WFST en el seu modelat. L'aplicació mostrada en aquest cas està relacionada amb la introducció d'una destinació en un dispositiu GPS i en aquesta es considera tant la informació pròxima a un lloc concret, com la informació relativa al prefix introduït, junt als errors que poden aparèixer a causa de la pròpia dispos / Navarro Cerdán, JR. (2016). Aplicaciones de los autómatas transductores finitos con pesos (WFST) en la corrección simbólica en interfaces persona-máquina [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/62688 Interacción persona-máquina Composición de autómatas Postproceso OCR Modelos de lenguaje Umbral de rechazo adaptativo Curva error vs. coste Curva acumulada error vs. coste. LENGUAJES Y SISTEMAS INFORMATICOS
82	Models, Algorithms and Digital Technologies for the Automation and Collaboration of Connected Smart Factories in an Industry 4.0 Environment Cañas Sánchez, Héctor Enrique 18 December 2025 (has links) Tesis por compendio / [ES] Los sistemas tradicionales de planificación y control de la producción (PPC) se centran en producir lo que demanda el mercado, con la calidad, el calendario y los volúmenes previstos al mínimo coste, ajustándose al mismo tiempo a las disrupciones de la cadena de suministro. La exploración e implementación de nuevos avances tecnológicos en el marco de la industria 4.0 (I4.0), como sistemas ciberfísicos (CPS), fabricación en la nube (CMfg), fabricación aditiva (AM), big data, inteligencia artificial y la Internet de las cosas (IoT), podrían cambiar aspectos organizativos tales como las responsabilidades de PPC. En este contexto, no se identificaron estudios sobre un sistema para la toma de decisiones, arquitecturas y marcos conceptuales para los nuevos sistemas inteligentes de PPC e I4.0. En este contexto de nuevos cambios tecnológicos y organizativos a los que tienen que hacer frente las pequeñas y medianas empresas (PYMEs), surge el problema de diseñar herramientas de PPC que permitan la integración y colaboración de las operaciones de producción. Así, basándose en las nuevas tecnologías de producción digital y en las herramientas organizativas que darán soporte a las fábricas inteligentes conectadas del futuro, se identificó la falta de un sistema integrado de PPC e I4.0. Esta tesis doctoral es un compendio de artículos que abordan una amplia revisión bibliográfica sobre la PPC en un entorno de I4.0. También, se propone un marco conceptual y el diseño de modelos y algoritmos para la toma de decisiones y dar soporte a las funciones de PPC en un contexto digital I4.0 basado en las nuevas tecnologías de producción digital y herramientas organizativas que darán soporte a las fábricas inteligentes colaborativas y conectadas del futuro. Los modelos matemáticos y algoritmos propuestos se centran en resolver el problema del diseño y planificación de una cadena de suministro sostenible y resiliente en la que las decisiones estratégicas y tácticas se toman de forma integrada. Los modelos, algoritmos y método de resolución se han programado en Python. Los modelos han sido validados mediante un software que genera instancias de datos sintéticos y permite evaluar la complejidad computacional de los mismos. El desarrollo de este tipo de modelos y algoritmos supone una contribución al ámbito académico e investigador y, concretamente, en el área de PPC. / [CA] En l'actualitat, els sistemes tradicionals de planificació i control de la producció (PPC) se centren en produir el que demanda el mercat, amb la qualitat, el calendari i els volums previstos al mínim cost, ajustant-se al mateix temps a les pertorbacions. L'exploració i implementació de nous avanços tecnològics, com CPS, fabricació en el núvol (CMfg), fabricació additiva (AM), big data, intelligència artificial i el IoT, podrien canviar aspectes organitzatius, com les responsabilitats de PPC. En aquest context, no es van identificar estudis sobre un sistema per a la presa de decisions, arquitectures i marcs conceptuals per als nous sistemes intelligents de PPC i I4.0. En aquest context de nous canvis tecnològics i organitzatius als quals han de fer front les petites i mitjanes empreses (PIME), sorgeix el problema de dissenyar eines de PPC que permeten la integració i collaboració de les operacions de producció. Així, basant-se en les noves tecnologies de producció digital i en les eines organitzatives que donaran suport a les fàbriques intelligents connectades del futur, es va identificar la falta d'un sistema integrat de la PPC i I4.0. Aquesta investigació és un compendi d'articles que aborden una àmplia revisió bibliogràfica sobre la PPC en un entorn I4.0. També proposa un marc conceptual i el disseny de models i algorismes per a la presa de decisions i per a donar suport a les funcions de PPC en un context digital I4.0 basat en les noves tecnologies de producció digital i eines organitzatives que donaran suport a les fàbriques intelligents col·laboratives i connectades del futur. Els models matemàtics i algorismes proposats se centren en resoldre el problema del disseny d'una cadena de subministrament sostenible i resistent en la qual les decisions estratègiques i tàctiques es prenen de forma integrada. Els models, algorismes i mètode de resolució s'han programat en Python. Els models han sigut validats mitjançant un programari que genera instàncies de dades sintètiques i permet avaluar la complexitat computacional dels models. El desenvolupament d'aquesta mena de models i algorismes suposa una important contribució a l'àmbit acadèmic. / [EN] Currently, traditional production planning and control (PPC) systems focus on producing what the market demands with the expected quality, schedule and volumes at a minimum cost, while adjusting for disruption. The exploration and implementation of new technological advances, such as CPS, cloud manufacturing (CMfg), additive manufacturing (AM), big data, artificial intelligence and the Internet of Things (IoT), could change organisational aspects like PPC responsibilities. In this context, no studies on a system for decision making, architectures and conceptual frameworks for the new intelligent systems of PPC and industry 4.0 (I4.0) have been identified. In this context of new technological and organisational changes that small-and medium-sized enterprises (SMEs) have to face, the problem of designing PPC tools that enable the integration and collaboration of production operations arises. Thus, based on the new digital production technologies and organisational tools that will support the connected smart factories of the future, lack of an integrated PPC and I4.0 system was identified. The present doctoral thesis is a compendium of articles addressing a comprehensive literature review on PPC in an I4.0 environment. It also proposes a conceptual framework and the design of models and algorithms for decision making and to support PPC functions in a digital I4.0 context based on the new digital production technologies and organisational tools that will support the collaborative and connected smart factories of the future. The proposed mathematical models and algorithms focus on solving the problem of designing a sustainable and resilient supply chain where strategic and tactical decisions are made in an integrated way. The models, algorithms and resolution method have been programmed in Python. The models have been validated by means of software that generates synthetic data instances and allows the models' computational complexity to be evaluated. The development of this type of models and algorithms is a significant contribution to the academic field. / I would like to thank the following projects and universities for having financed the publications included in this doctoral thesis: • European Commission Horizon 2020 project entitled "Crop diversification and low-input farming cross Europe: From practitioners' engagement and ecosystems services to increased revenues and value chain organisation' (Diverfarming), grant agreement 728003. • Spanish Ministry of Science, Innovation and Universities project entitled 'Optimization of zero-defect production technologies enabling supply chains 4.0 (CADS4.0)' (RTI2018-101344-B-I00). • European Union H2020 program with grant agreement no. 958205 "Industrial Data Services for Quality Control in Smart Manufacturing (i4Q)". • European Union H2020 Program with grant agreement nº 825631 "Zero- Defect Manufacturing Platform (ZDMP)". / Cañas Sánchez, HE. (2023). Models, Algorithms and Digital Technologies for the Automation and Collaboration of Connected Smart Factories in an Industry 4.0 Environment [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/202312 / Compendio Industry 4.0 Mixed Integer Linear Programming Optimisation RAMI 4.0 Resilience Strategic decision-making Supply chain network design Sustainability Tactical decision-making Toma de decisiones tácticas Cadenas de suministro Sostenibilidad Diseño de redes de suministro Toma de decisiones estratégicas Optimización Industria 4.0 Programación lineal entera mixta ORGANIZACION DE EMPRESAS

Search results

Aplicaciones de los autómatas transductores finitos con pesos (WFST) en la corrección simbólica en interfaces persona-máquina

Models, Algorithms and Digital Technologies for the Automation and Collaboration of Connected Smart Factories in an Industry 4.0 Environment