111 |
Arabic Text Recognition and Machine TranslationAlkhoury, Ihab 13 July 2015 (has links)
[EN] Research on Arabic Handwritten Text Recognition (HTR) and Arabic-English Machine Translation (MT) has been usually approached as two independent areas of study. However, the idea of creating one system that combines both areas together, in order to generate English translation out of images containing Arabic text, is still a very challenging task. This process can be interpreted as the translation of Arabic images. In this thesis, we propose a system that recognizes Arabic handwritten text images, and translates the recognized text into English. This system is built from the combination of an HTR system and an MT system.
Regarding the HTR system, our work focuses on the use of Bernoulli Hidden Markov Models (BHMMs). BHMMs had proven to work very well with Latin script. Indeed, empirical results based on it were reported on well-known corpora, such as IAM and RIMES. In this thesis, these results are extended to Arabic script, in particular, to the well-known IfN/ENIT and NIST OpenHaRT databases for Arabic handwritten text.
The need for transcribing Arabic text is not only limited to handwritten text, but also to printed text. Arabic printed text might be considered as a simple form of handwritten text version. Thus, for this kind of text, we also propose Bernoulli HMMs. In addition, we propose to compare BHMMs with state-of-the-art technology based on neural networks.
A key idea that has proven to be very effective in this application of Bernoulli HMMs is the use of a sliding window of adequate width for feature extraction. This idea has allowed us to obtain very competitive results in the recognition of both Arabic handwriting and printed text. Indeed, a system based on it ranked first at the ICDAR 2011 Arabic recognition competition on the Arabic Printed Text Image (APTI) database. Moreover, this idea has been refined by using repositioning techniques for extracted windows, leading to further improvements in Arabic text recognition.
In the case of handwritten text, this refinement improved our system which ranked first at the ICFHR 2010 Arabic handwriting recognition competition on IfN/ENIT. In the case of printed text, this refinement led to an improved system which ranked second at the ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text on APTI. Furthermore, this refinement was used with neural networks-based technology, which led to state-of-the-art results.
For machine translation, the system was based on the combination of three state-of-the-art statistical models: the standard phrase-based models, the hierarchical phrase-based models, and the N-gram phrase-based models. This combination was done using the Recognizer Output Voting Error Reduction (ROVER) method. Finally, we propose three methods of combining HTR and MT to develop an Arabic image translation system. The system was evaluated on the NIST OpenHaRT database, where competitive results were obtained. / [ES] El reconocimiento de texto manuscrito (HTR) en árabe y la traducción automática (MT) del árabe al inglés se han tratado habitualmente como dos áreas de estudio independientes. De hecho, la idea de crear un sistema que combine las dos áreas, que directamente genere texto en inglés a partir de imágenes que contienen texto en árabe, sigue siendo una tarea difícil. Este proceso se puede interpretar como la traducción de imágenes de texto en árabe. En esta tesis, se propone un sistema que reconoce las imágenes de texto manuscrito en árabe, y que traduce el texto reconocido al inglés. Este sistema está construido a partir de la combinación de un sistema HTR y un sistema MT.
En cuanto al sistema HTR, nuestro trabajo se enfoca en el uso de los Bernoulli Hidden Markov Models (BHMMs). Los modelos BHMMs ya han sido probados anteriormente en tareas con alfabeto latino obteniendo buenos resultados. De hecho, existen resultados empíricos publicados usando corpus conocidos, tales como IAM o RIMES. En esta tesis, estos resultados se han extendido al texto manuscrito en árabe, en particular, a las bases de datos IfN/ENIT y NIST OpenHaRT.
En aplicaciones reales, la transcripción del texto en árabe no se limita únicamente al texto manuscrito, sino también al texto impreso. El texto impreso se puede interpretar como una forma simplificada de texto manuscrito. Por lo tanto, para este tipo de texto, también proponemos el uso de modelos BHMMs. Además, estos modelos se han comparado con tecnología del estado del arte basada en redes neuronales.
Una idea clave que ha demostrado ser muy eficaz en la aplicación de modelos BHMMs es el uso de una ventana deslizante (sliding window) de anchura adecuada durante la extracción de características. Esta idea ha permitido obtener resultados muy competitivos tanto en el reconocimiento de texto manuscrito en árabe como en el de texto impreso. De hecho, un sistema basado en este tipo de extracción de características quedó en la primera posición en el concurso ICDAR 2011 Arabic recognition competition usando la base de datos Arabic Printed Text Image (APTI). Además, esta idea se ha perfeccionado mediante el uso de técnicas de reposicionamiento aplicadas a las ventanas extraídas, dando lugar a nuevas mejoras en el reconocimiento de texto árabe.
En el caso de texto manuscrito, este refinamiento ha conseguido mejorar el sistema que ocupó el primer lugar en el concurso ICFHR 2010 Arabic handwriting recognition competition usando IfN/ENIT. En el caso del texto impreso, este refinamiento condujo a un sistema mejor que ocupó el segundo lugar en el concurso ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text en el que se usaba APTI. Por otro lado, esta técnica se ha evaluado también en tecnología basada en redes neuronales, lo que ha llevado a resultados del estado del arte.
Respecto a la traducción automática, el sistema se ha basado en la combinación de tres tipos de modelos estadísticos del estado del arte: los modelos standard phrase-based, los modelos hierarchical phrase-based y los modelos N-gram phrase-based. Esta combinación se hizo utilizando el método Recognizer Output Voting Error Reduction (ROVER). Por último, se han propuesto tres métodos para combinar los sistemas HTR y MT con el fin de desarrollar un sistema de traducción de imágenes de texto árabe a inglés. El sistema se ha evaluado sobre la base de datos NIST OpenHaRT, donde se han obtenido resultados competitivos. / [CA] El reconeixement de text manuscrit (HTR) en àrab i la traducció automàtica (MT) de l'àrab a l'anglès s'han tractat habitualment com dues àrees d'estudi independents. De fet, la idea de crear un sistema que combine les dues àrees, que directament genere text en anglès a partir d'imatges que contenen text en àrab, continua sent una tasca difícil. Aquest procés es pot interpretar com la traducció d'imatges de text en àrab. En aquesta tesi, es proposa un sistema que reconeix les imatges de text manuscrit en àrab, i que tradueix el text reconegut a l'anglès. Aquest sistema està construït a partir de la combinació d'un sistema HTR i d'un sistema MT.
Pel que fa al sistema HTR, el nostre treball s'enfoca en l'ús dels Bernoulli Hidden Markov Models (BHMMs). Els models BHMMs ja han estat provats anteriorment en tasques amb alfabet llatí obtenint bons resultats. De fet, existeixen resultats empírics publicats emprant corpus coneguts, tals com IAM o RIMES. En aquesta tesi, aquests resultats s'han estès a la escriptura manuscrita en àrab, en particular, a les bases de dades IfN/ENIT i NIST OpenHaRT.
En aplicacions reals, la transcripció de text en àrab no es limita únicament al text manuscrit, sinó també al text imprès. El text imprès es pot interpretar com una forma simplificada de text manuscrit. Per tant, per a aquest tipus de text, també proposem l'ús de models BHMMs. A més a més, aquests models s'han comparat amb tecnologia de l'estat de l'art basada en xarxes neuronals.
Una idea clau que ha demostrat ser molt eficaç en l'aplicació de models BHMMs és l'ús d'una finestra lliscant (sliding window) d'amplària adequada durant l'extracció de característiques. Aquesta idea ha permès obtenir resultats molt competitius tant en el reconeixement de text àrab manuscrit com en el de text imprès. De fet, un sistema basat en aquest tipus d'extracció de característiques va quedar en primera posició en el concurs ICDAR 2011 Arabic recognition competition emprant la base de dades Arabic Printed Text Image (APTI).
A més a més, aquesta idea s'ha perfeccionat mitjançant l'ús de tècniques de reposicionament aplicades a les finestres extretes, donant lloc a noves millores en el reconeixement de text en àrab. En el cas de text manuscrit, aquest refinament ha aconseguit millorar el sistema que va ocupar el primer lloc en el concurs ICFHR 2010 Arabic handwriting recognition competition usant IfN/ENIT. En el cas del text imprès, aquest refinament va conduir a un sistema millor que va ocupar el segon lloc en el concurs ICDAR 2013 Competition on Multi-font and Multi-size Digitally Represented Arabic Text en el qual s'usava APTI. D'altra banda, aquesta tècnica s'ha avaluat també en tecnologia basada en xarxes neuronals, el que ha portat a resultats de l'estat de l'art.
Respecte a la traducció automàtica, el sistema s'ha basat en la combinació de tres tipus de models estadístics de l'estat de l'art: els models standard phrase-based, els models hierarchical phrase-based i els models N-gram phrase-based. Aquesta combinació es va fer utilitzant el mètode Recognizer Output Voting Errada Reduction (ROVER). Finalment, s'han proposat tres mètodes per combinar els sistemes HTR i MT amb la finalitat de desenvolupar un sistema de traducció d'imatges de text àrab a anglès. El sistema s'ha avaluat sobre la base de dades NIST OpenHaRT, on s'han obtingut resultats competitius. / Alkhoury, I. (2015). Arabic Text Recognition and Machine Translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/53029
|
112 |
Aportaciones al reconocimiento automático de texto manuscritoPastor Gadea, Moisés 06 May 2008 (has links)
En esta tesis se estudia el problema de la robustez en los sistemas de
reconocimiento automático de texto manuscrito off-line. Los sistemas de
reconocimiento automático de texto manuscrito estarán maduros para su uso
generalizado, cuando sean capaces de ofrecer a cualquier usuario, sin ningún
tipo de preparación o adiestramiento para su utilización, una productividad
razonable. Se hace necesario pues, construir sistemas flexibles y robustos en
cuanto a la entrada, de tal manera que no se requiera del escritor ningún
esfuerzo extra, que no haría si escribiese para ser leído por un humano.
La intención del preproceso de la señal es hacer el sistema invariante a
fuentes de variabilidad que no ayuden a la clasificación. En la actualidad no
hay definida una solución general para conseguir invariabilidad al estilo de
escritura, y cada sistema desarrolla la suya ad-hoc. En esta tesis se
explorarán diferentes métodos de normalización de la señal de entrada
off-line. Para ello se hace un amplio estudio de algoritmos de preproceso,
tanto a nivel de toda la imagen: umbralización, reducción del ruido y
corrección del desencuadre; como a nivel de texto: slope, slant y
normalización del tamaño de los caracteres.
Los sistemas dependientes del escritor obtienen mejores tasas de acierto
que los independientes del escritor. Por otra parte, los sistemas
independientes del escritor tienen más facilidad para reunir muestras de
entrenamiento. En esta tesis seestudiará la adaptación de sistemas
independientes del escritor para su utilizaciónpor un único escritor, con la
intención de que a partir de una pocas muestras producidas por este escritor
se mejore la productividad del sistema (para este escritor), o lo que es lo
mismo, que éste pueda escribir de manera más relajada sin que el
sistema pierda productividad. Los sistemas de reconocimiento de texto
manuscrito no están exentos de errores. No sólo interesa saber el número de
errores que producirá / Pastor Gadea, M. (2007). Aportaciones al reconocimiento automático de texto manuscrito [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1832
|
113 |
Recuperación de pasajes multilingües para la búsqueda de respuestasGómez Soriano, José Manuel 07 May 2008 (has links)
JAVA Information Retrieval System (JIRS) es un sistema de Recuperación de Información especialmente orientado a tareas de Búsqueda de Respuestas. Los tradicionales motores de búsqueda se basan en las palabras claves de la pregunta para obtener los documentos relevantes a una consulta. JIRS, por el contrario, intenta obtener trozos de texto, es decir pasajes, con mayor probabilidad de contener la respuesta. Para ello realiza una búsqueda basada en los n-gramas de la pregunta -efectuada en lenguaje natural- usando tres posibles modelos. Los modelos de n-gramas desarrollados son independientes del idioma, lo que hace de JIRS un sistema idóneo para trabajar en ambientes multilingües.
Por otra parte, JIRS incorpora un potente núcleo que permite una adaptación y escalabilidad sin precedentes en los modernos motores de búsqueda. Desde sus inicios fue diseñado para que fuera una herramienta potente que permitiese adaptarse sin dificultad a muy diferentes funciones. Esto permite ampliar o modificar aspectos de JIRS de forma muy fácil e intuitiva sin que el usuario final tenga que conocer el código desarrollado por otros. Además, permite generar nuevas aplicaciones con una estructura cliente/servidor, distribuida, etc. únicamente modificando el archivo de configuración.
Este trabajo presenta el estado del arte de la Recuperación de Información centrándose en la Búsqueda de Respuestas multilingüe, así como una descripción detallada de JIRS junto con sus modelos de búsqueda exponiendo, finalmente, los resultados obtenidos por este sistema en las competiciones del CLEF. / Gómez Soriano, JM. (2007). Recuperación de pasajes multilingües para la búsqueda de respuestas [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1930
|
114 |
Particionamiento y resolución distribuida multivariable de problemas de satisfacción de restriccionesAbril López, Montserrat 07 May 2008 (has links)
Hoy en día, muchos problemas reales pueden modelarse como problemas de satisfacción de restricciones (CSPs) y se resuelven usando técnicas específicas de satisfacción de restricciones.
Estos problemas pertenecen a áreas tales como Inteligencia Artificial, investigación operativa, sistemas de información, bases de datos, etc. La mayoría de estos problemas pueden modelarse de forma natural mediante CSPs. Sin embargo, algunos de estos problemas son de naturaleza distribuida, bien por motivos de
seguridad, por requerimientos de privacidad, o por restricciones espaciales. Ello requiere que este tipo de problemas sean modelados como problemas de satisfacción de restricciones distribuidos (DCSPs), donde el conjunto de variables y restricciones del problema está distribuido entre un conjunto de
agentes que se encargan de resolver su propio sub-problema y deben coordinarse con el resto de agentes para alcanzar una solución al problema global.
En la literatura de satisfacción de restricciones, la necesidad de manejar DCSP comenzó a tratarse a principios de los 90. No obstante, la mayoría de los investigadores que trabajan en este campo centran su atención en algoritmos en los que cada agente maneja una única variable. Estos algoritmos pueden ser
transformados para que cada agente maneje múltiples variables. Sin embargo, los algoritmos resultantes no son escalables para manejar grandes sub-problemas locales debido tanto a requerimientos
espaciales como a su coste computacional. Por lo tanto, la resolución de problemas reales mediante este tipo de algoritmos resulta prácticamente inviable.
En esta tesis presentamos nuevos algoritmos para la resolución de problemas de satisfacción de restricciones distribuidos capaces de manejar multiples variables por agente. Estos algoritmos realizan
un manejo eficiente de la información obtenida mediante la comunicación entre los agentes, consiguiendo con ello una mayor eficiencia durante el proceso de resolución. Además, sus requerimientos / Abril López, M. (2007). Particionamiento y resolución distribuida multivariable de problemas de satisfacción de restricciones [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1946
|
115 |
Desarrollo dirigido por modelos de aplicaciones web que integran datos y funcionalidad a partir se servicios webQuintero Meza, Ricardo Rafael 07 May 2008 (has links)
La capacidad de comunicación e integración que ofrece Internet, está facilitando
el establecimiento y automatización de relaciones entre los participantes de los nuevos
Modelos de Negocio electrónico. Aunque no existe una clasificación definitiva
de éstos, es posible distinguir la integración de datos y funcionalidad como un requisito
fundamental para la implementación de los mismos. Algunos de los casos
más significativos lo constituyen empresas como Google y Amazon que ofrecen a
sus socios sus plataformas tecnológicas a través de interfaces (APIs) basadas en
servicios Web. Estas compañías establecen contratos de negocio que brindan la
posibilidad de integración de sus plataformas con las aplicaciones Web de los socios.
Así, los diversos servicios que ofrecen les están disponibles y establecen con
ello una relación que redunda en beneficio mutuo.
Tres actores básicos se pueden distinguir para lograr esta integración: los servicios
Web, las aplicaciones Web y los procesos Negocio-a-Negocio. Los primeros, al
facilitar la producción y consumo de datos y funcionalidad independientemente de
la implementación tecnológica de los sistemas; los segundos, al ser el tipo más dominante
de aplicación que se ejecuta en Internet; y los terceros, al definir los pasos
necesarios para la realización de los diversos procesos del negocio.
Desde el punto de vista del modelado conceptual, se encuentran diversas propuestas,
la mayoría basadas en modelos UML, para la especificación de estos tres
actores. No obstante que en múltiples casos es necesaria su participación mutua, se
observa que en muchas de estas propuestas se focalizan en sólo alguno y escasamente
se encuentran opciones que los incluyan a los tres. Por ejemplo, desde el punto de
vista de la Ingeniería Web, se encuentra un número mínimo de métodos que consideran
de manera conjunta en sus propuestas los servicios Web y los procesos Negocio-
a-Negocio. La mayoría de los métodos se centran en aplicaciones Web que ofrecen
un espacio de navegación sobre grandes colecciones de datos, pero no permiten
la integración de datos y funcionalidad de aplicaciones externas, como tampoco la
exposición de su funcionalidad para consumo de otras. Por otro lado, desde el punto
de los servicios Web, la mayor parte de las aproximaciones considera su especificación
sin considerar su inclusión en aplicaciones Web o el papel que juega la interacción
humana.
La presente tesis ofrece una propuesta para el modelado conceptual de aplicaciones
Web que integran datos y funcionalidad a partir de servicios Web, con consideraciones
adicionales a los procesos Negocio-a-Negocio. La solución se expone en
el contexto del método de Ingeniería Web Object Oriented Web Solutions (OOWS).
Este método es la extensión para el modelado conceptual de aplicaciones Web del
método clásico OO-Method. En su concepción original, OOWS ha sido diseñado
para la consulta y actualización de datos, pero no para la integración de aplicaciones
externas. La propuesta de esta tesis incluye un conjunto de adecuaciones y extensiones
a sus primitivas conceptuales para la especificación de este tipo de aplicaciones. / Quintero Meza, RR. (2008). Desarrollo dirigido por modelos de aplicaciones web que integran datos y funcionalidad a partir se servicios web [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1988
|
116 |
OOWS: un mètode dirigit per models per al desanvolupament d'aplicacions webFons Cors, Joan Josep 07 May 2008 (has links)
Internet se ha convertido por méritos propios en el medio de comunicación por excelencia. La velocidad con la que se puede intercambiar información unida a la eliminación de las barreras geográ?cas y tecnológicas han convertido a Internet en la plataforma preferida para divulgar el conocimiento y hacer negocios.
Para llevar a cabo el desarrollo de aplicaciones software en estos entornos, han aparecido numerosas aproximaciones que aplican lo que se conoce como Ingeniería Web. Estas aproximaciones de?nen processos de desarrollo y extensiones conceptuales basadas en modelos, orientadas a la construcción de aplicaciones web.
Por otro lado están los principios del Desarrollo Dirigido por Modelos donde se proporcionan marcos conceptuales y entornos que permiten construir processos de desarrollo con generación de código a partir de modelos.
Bajo esta perspectiva se enmarca esta tesis, en la que se de?ne OOWS, un entorno de producción de software para la web que aplica los principios que se proponen en la Ingeniería Web y en el Desarrollo Dirigido por Modelos. Este entorno de?ne un proceso de desarrollo en base a unos modelos conceptuales extendidos con características web y una estrategia para obtener automáticamente la aplicación web a partir de estos modelos OOWS.
Para dar suporte a esta aproximación se ha construido una herramienta que permite editar y gestionar estos modelos conceptuales web, y que implementa las transformaciones que permiten obtener un prototipo de la aplicación web a partir de estos modelos. / Fons Cors, JJ. (2008). OOWS: un mètode dirigit per models per al desanvolupament d'aplicacions web [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1989
|
117 |
A requirements engineering approach for the development of web applicationsValderas Aranda, Pedro José 07 May 2008 (has links)
Uno de los problemas más importantes que se propuso solucionar cuando apareció la
Ingeniería Web fue la carencia de técnicas para la especificación de requisitos de
aplicaciones Web.
Aunque se han presentado diversas propuestas que proporcionan soporte metodológico
al desarrollo de aplicaciones Web, la mayoría de ellas se centran básicamente en definir
modelos conceptuales que permiten representar de forma abstracta una aplicación Web;
las actividades relacionadas con la especificación de requisitos son vagamente tratadas
por estas propuestas. Además, las técnicas tradicionales para la especificación de
requisitos no proporcionan un soporte adecuado para considerar características propias
de las aplicaciones Web como la Navegación.
En esta tesis, se presenta una aproximación de Ingeniería de Requisitos para especificar
los requisitos de las aplicaciones Web. Esta aproximación incluye mecanismos basados
en la metáfora de tarea para especificar no sólo los requisitos relacionados con aspectos
estructurales y de comportamiento de una aplicación Web sino también los requisitos
relacionados con aspectos navegacionales.
Sin embargo, una especificación de requisitos es poco útil si no somos capaces de
transformarla en los artefactos software adecuados. Este es un problema clásico que la
comunidad de Ingeniería del Software ha tratado de resolver desde sus inicios: cómo
pasar del espacio del problema (requisitos de usuario) al espacio de la solución (diseño
e implementación) siguiendo una guía metodológica clara y precisa.
En esta tesis, se presenta una estrategia que, basándose en transformaciones de grafos,
y estando soportada por un conjunto de herramientas, nos permite realizar de forma
automática transformaciones entre especificaciones de requisitos basadas en tareas y
esquemas conceptuales Web. Además, esta estrategia se ha integrado con un método
de Ingeniería Web con capacidades de generación automática de código. Esta
integración nos permite proporcionar un mecanis / Valderas Aranda, PJ. (2008). A requirements engineering approach for the development of web applications [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1997
|
118 |
Modelling adaptive web applications in OOWSRojas Durán, Gonzalo Eduardo 07 May 2008 (has links)
Las Aplicaciones Web Adaptativas son sistemas Web que plantean una solución a esta problemática, mediante la adaptación automática del acceso a ítems de información, servicios e hiperlinks, en base a las características de los usuarios. El desarrollo de estos sistemas exige adoptar una aproximación ingenieril que facilite la especificación de las funcionalidades adaptativas a proveer, junto con las características de los usuarios en las cuales se basan dichas funcionalidades.
La presente tesis introduce una aproximación al desarrollo de Aplicaciones Web Adaptativas desde una perspectiva dirigida por modelos. Esta aproximación integra prácticas tradicionales de desarrollo de Aplicaciones Web con conceptos de-nidos y probados por la comunidad de Hipermedia Adaptativa. Tomando como base el proceso de desarrollo de aplicaciones Web OOWS (Object Oriented Web Solutions), se defíne un conjunto de primitivas
conceptuales que permiten expresar técnicas adaptativas a un alto nivel de abstracción. La definición de estas primitivas es respaldada por una propuesta de Modelado de Usuarios. Además, un conjunto de estrategias de modelado
permite incorporar Métodos Adaptativos a los esquemas navegacionales de OOWS, en base a dichas primitivas. / Rojas Durán, GE. (2008). Modelling adaptive web applications in OOWS [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2000
|
119 |
Un sistema para el mantenimiento de almacenes de datosGarcía Gerardo, Clemente 04 July 2008 (has links)
Un almacén de datos es una base de datos diseñada para dar soporte al proceso de toma de decisiones en una organización. Un sistema de almacén de datos integra en un único repositorio, información
histórica procedente de distintas fuentes de datos operacionales de la organización o externas a ella. Para que el almacén de datos sea en todo momento un reflejo fiel de la organización a la que sirve, debe
ser actualizado periódicamente. Este proceso puede consumir muchos recursos, y en algunos casos inhabilitar el almacén de datos para los usuarios. En organizaciones donde el sistema debe estar disponible
para los analistas en todo momento, el mantenimiento del almacén se convierte en un punto crítico del sistema. Por este motivo la investigación en estrategias eficientes de mantenimiento de almacenes
de datos ha recibido la atención de los investigadores desde la aparición de esta tecnología.
El mantenimiento de un almacén de datos se realiza en tres fases: extracción de datos de las fuentes, transformación de los datos y actualización del almacén.
En este trabajo de tesis se han abordado, las fases de transformación y principalmente la fase de actualización. Para la fase de transformación se ha desarrollado un sistema que permite realizar tareas de limpieza
moderada de los datos, integración de formato e integración semántica.
Pero, el trabajo principal se ha centrado en la fase de actualización, para ella se han definido e implementado dos algoritmos que permiten realizar la actualización del almacén de datos de forma incremental y
en línea, es decir evitando inhabilitar el almacén de datos durante el mantenimiento. Los algoritmos se basan en una estrategia multiversión, que permite mantener un número ilimitado de versiones
de los datos actualizados, permitiendo de esta manera que los usuarios accedan a una misma versión del almacén mientras éste se está actualizando. / García Gerardo, C. (2008). Un sistema para el mantenimiento de almacenes de datos [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2505
|
120 |
A web engineering approach for the development of business process-driven web applicationsTorres Bosch, María Victoria 04 August 2008 (has links)
Actualmente, la World Wide Web se ha convertido en la plataforma más común para llevar a cabo el desarrollo de aplicaciones corporativas. Estas aplicaciones reciben el nombre de aplicaciones Web y entre otras funciones, deben de dar soporte a los Procesos de Negocio (PN) definidos por las corporaciones.
Esta tesis presenta un método de Ingeniería Web que permite el modelado y la construcción sistemática de aplicaciones Web que soportan la ejecución de PN. En este trabajo se conciben los PN desde un punto de vista más amplio que el abordado por otros métodos de Ingeniería Web. El tipo de PN abordados incluye tanto procesos cortos como largos. A grosso modo, esta concepción más amplia permite considerar procesos que involucran diferentes participantes (personas y/o sistemas) los cuales cooperan para llevar a cabo un objetivo particular. Además, dependiendo del tipo de proceso que se esté ejecutando (corto o largo), la interacción del usuario con el sistema deberá adaptarse a cada caso.
El método presentado en esta tesis ha sido desarrollado basándose en el Desarrollo de Software Dirigido por Modelos. De esta forma, el método propone un conjunto de modelos que permiten representar los diferentes aspectos que caracterizan las aplicaciones Web que soportan la ejecución de PN. Una vez el sistema ha sido representado en los modelos correspondientes, mediante la aplicación de transformación de modelos se obtiene otros modelos (transformaciones de modelo-a-modelo) e incluso el código que representa el sistema modelado en términos de un lenguaje de implementación (transformaciones de modelo-a-texto).
El método propuesto en esta tesis está soportado por una herramienta llamada BIZZY. Esta herramienta ha sido desarrollada en el entorno de Eclipse y cubre el proceso de desarrollo desde la fase de modelado hasta la generación de código. En particular, el código generado corresponde con el framework Web Tapestry (framework que genera aplicaciones Web en Java) y con WS-BPEL, / Torres Bosch, MV. (2008). A web engineering approach for the development of business process-driven web applications [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2933
|
Page generated in 0.7829 seconds