El objetivo de esta tesis es el desarrollo de métodos de particionamiento y análisis estructural de modelos matemáticos y estructuras de datos provenientes de distintas áreas del conocimiento. Los requerimientos que se desean cumplir son los siguientes: I. Manejo más eficiente de los modelos y las estructuras y II. Uso más extensivo de la información contenida en ellos. Como punto de partida para el análisis estructural de los diversos casos estudiados, se utilizó el Método Directo Extendido (MDE). Además, uno de los algoritmos sobre grafos que comprenden las distintas etapas de su funcionamiento fue utilizado sobre la estructura de un directorio web.
Con respecto a los temas abarcados en la investigación, esta tesis está concentrada en dos grandes campos de aplicación: I. Particionamiento estructural de modelos matemáticos provenientes de la Ingeniería Química, y II. Modelos estructurales que se utilizan como base para las Ciencias de la Información. En la primera sección se describe el trabajo realizado sobre distintos modelos matemáticos de Ingeniería de Sistemas de Proceso. Luego, la investigación fue enfocada en el tratamiento estructural de grandes volúmenes de datos que son utilizados para el cálculo de medidas de similitud semántica.
De acuerdo con las dos áreas de aplicación mencionadas, se enumeran las contribuciones del trabajo realizado:
- En Ingeniería de Sistemas de Proceso se perfeccionó el MDE, que genera un particionamiento de la estructura del sistema de ecuaciones. Con ello se hizo posible no sólo aumentar la cantidad de variables determinables en los modelos matemáticos implementados, sino también reducir la complejidad de cálculo. Esto último se logró con un mejor ordenamiento de las ecuaciones, poniendo énfasis en la selección guiada de ecuaciones con características deseables, como por ejemplo un bajo grado de no linealidad.
Tanto para problemas de simulación como de optimización, este algoritmo puede hacer más sencilla la tarea de su resolución y disminuir la cantidad de información inicial requerida en los modelos correspondientes.
- En Ciencias de la Información, fueron elaborados distintos modelos de propagación de relevancia sobre un directorio conocido de sitios de internet. Algunos se obtuvieron mediante la utilización de operaciones sobre matrices ralas de gran porte. Los otros fueron generados con un algoritmo sobre grafos que lleva a cabo la detección de componentes fuertemente conexas en un grafo dirigido. Este algoritmo está implementado en una de las etapas del MDE, descripto anteriormente. Además, estos modelos fueron validados experimentalmente en base a criterios estadísticos. Los mismos pueden aumentar la precisión en la determinación de valores de similitud semántica entre documentos, lo cual puede apreciarse en pruebas estadísticas llevadas a cabo a lo largo de la investigación. De acuerdo a los resultados obtenidos, su información sobre propagación de relevancia puede ser útil para diferentes propósitos en Ciencias de la Información. / The objective of this thesis is the development of structural partitioning and analysis methods for mathematical models and data structures that come up in different knowledge areas. The desired requirements to be fulfilled were: I. more efficient handling of the structures and models and II. wider usage of the information. As a starting point for the structural analysis of the various case studies, the Extended Direct Method (EDM) was employed. Besides, one of its graph-based algorithms that take part in some of EDM stages was applied to web-directory structures.
Regarding the research topics involved, this work concentrated in two big application fields: I. Structural partitioning of mathematical models from Chemical Engineering, and II. Structural models used as a basis in Information Sciences. In the first place, different mathematical models of Process Systems Engineering were analysed. Then, the research was focused on structural treatment of big data stores that are useful for semantic similarity measurements calculation.
According to these application areas, the contributions of this thesis are the following:
- In Process Systems Engineering the EDM algorithm, which generates a partitioning of the equations system structure, was improved. This improvement made it possible not only to augment the amount of determinable variables in the implemented mathematical models, but also to reduce the calculation complexity. The latter was achieved by means of a better equation ordering with emphasis on the guided selection of equations with desirable properties, e.g. a low degree of non-linearity. For both simulation and optimization problems, the improved algorithm can make their resolution task easier and diminish the amount of required initial information about the corresponding models.
- In Information Sciences various relevance propagation models over a known Web sites Directory were developed. Some of these models were obtained by using matrix operations on broad-range sparse matrices. The other ones were generated with a graph algorithm that performs the strongly connected components detection over a directed graph. This algorithm is implemented in one of the stages of the EDM, described previously. Besides, they were empirically proved, based on statistical criteria. The developed models can raise accuracy on determining semantic similarity between documents. They had an average accuracy of 65% in the implemented tests. According to this result, their information about relevance propagation could be useful for different purposes in Information Sciences.
Identifer | oai:union.ndltd.org:uns.edu.ar/oai:repositorio.bc.uns.edu.ar:123456789/2505 |
Date | 10 February 2015 |
Creators | Xamena, Eduardo |
Contributors | Brignole, Nélida Beatriz, Maguitman, Ana Gabriela |
Publisher | Universidad Nacional del Sur |
Source Sets | Universidad Nacional del Sur |
Language | Spanish |
Detected Language | Spanish |
Type | Electronic Thesis or Dissertation, Text |
Rights | 2 |
Page generated in 0.0179 seconds