1 |
El análisis estadístico de una base de datos geográfica : aprovechamiento de un S.I.G.Romero, Adelmo, Marín, Hugo, Maldonado, Henry 10 April 2018 (has links)
El uso de los Sistemas de Información Geográfica y, mediante la utilización del software "ARC/INFO", combinado con algunos programas para procesar estadísticamente los datos, permite realizar un "Análisis Exploratorio de los Datos" (A.E.D.) sobre los Suelos de la Región Zuliana para resaltar importantes atributos y rescatar las estructuras que permanecen en las bases de datos, de índole descriptivo, que expresan realidades estadísticas no ilustradas frecuentemente al aplicar un S.I.G. y de lo cual se quejan los usuarios. Con los datos de suelos, a nivel de Órdenes, se obtiene la lista de valores, tabla de frecuencias, representaciones gráficas, medidas de tendencia central y resumen numérico, para su análisis e interpretación, evidenciándose una dispersión de los polígonos de suelos según su Orden en toda la Región Zuliana y su concentración en pequeños polígonos según su tamaño.
|
2 |
Diseño de tablas de registro unificadas para el diagnóstico y estimación del indicador de riesgo del patrimonio culturalMastroiacovo, Tanja 19 July 2021 (has links)
[ES] La presente investigación expone los resultados obtenidos en el diseño e implementación de unas tablas de registro para el análisis, gestión y manejo de las fases preliminares de diagnóstico del patrimonio cultural. Este proyecto nace de la necesidad de encontrar un método operativo capaz de brindar un enfoque objetivo para la toma de decisiones inherentes a las evaluaciones diagnósticas y estudios específicos a realizarse sobre los bienes culturales en condiciones de recursos limitados y elevado número de obras o elementos. Debido a la abundancia de variables, factores y materiales que influyen en la conservación del patrimonio cultural, el diseño de una matriz de datos y de una metodología de muestreo unificados representan el primer paso para la comprensión de sus exigencias, además de poner las bases para el futuro desarrollo de estudios de tipo estadístico. Éstos representan un recurso óptimo siendo una rama de las matemáticas que estudia las correlaciones y dependencias entre los fenómenos físicos y naturales y han sido empleados en varias áreas del conocimiento entre las cuales destacan las ciencias sociales, la ecología, la medicina y el control de calidad en los procesos industriales. Entre las herramientas ofrecidas por las ciencias estadísticas, que se ocupan de estudiar una determinada población por medio de recolección, recopilación e interpretación de datos, el análisis exploratorio de datos (EDA) representa un medio de comprensión y formulación de hipótesis a partir de unas tablas definidas de contingencia. En este trabajo se exponen los resultados derivados del diseño e implementación de las fichas de registro y análisis de datos adaptadas para las exigencias del sector de la conservación, ofreciendo un acercamiento a sus posibilidades aplicativas, ventajas y limitaciones en relación a la resolución de casos de estudio reales tratados a lo largo de la experiencia de formación, investigación y docencia en diferentes realidades y contextos. / [CA] La present investigació exposa els resultats obtinguts en el disseny i implementació d'unes taules de registre per a l'anàlisi, gestió i maneig de les fases preliminars de diagnòstic del patrimoni cultural. Aquest projecte naix de la necessitat de trobar un mètode operatiu capaç de brindar un enfocament objectiu per a la presa de decisions inherents les avaluacions diagnòstiques i estudis específics a realitzar-se sobre els béns culturals en condicions de recursos limitats i elevat nombre d'obres o elements. A causa de l'abundància de variables, factors i materials que influeixen en la conservació del patrimoni cultural, el disseny d'una matriu de dades i d'una metodologia de mostreig unificats representen el primer pas per a la comprensió de les seues exigències, a més de posar les bases per al futur desenvolupament d'estudis de tipus estadístic. Aquests representen un recurs òptim sent una branca de les matemàtiques que estudia les correlacions i dependències entre els fenòmens físics i naturals i han sigut emprats en diverses àrees del coneixement entre les quals destaquen les ciències socials, l'ecologia, la medicina i el control de qualitat en els processos industrials. Entre les eines oferides per les ciències estadístiques, que s'ocupen d'estudiar una determinada població per mitjà de recol·lecció, recopilació i interpretació de dades, l'anàlisi exploratòria de dades (*EDA) representa un mitjà de comprensió i formulació d'hipòtesi a partir d'unes taules definides de contingència. En aquest treball s'exposen els resultats derivats del disseny i implementació de les fitxes de registre i anàlisi de dades adaptades per a les exigències del sector de la conservació, oferint un acostament a les seues possibilitats aplicatives, avantatges i limitacions en relació a la resolució de casos d'estudi reals tractats al llarg de l'experiència de formació, investigació i docència en diferents realitats i contextos. / [EN] This research presents the results obtained in the design and implementation of registration tables for the analysis, management and handling of the preliminary diagnostic phases of cultural heritage. This project arises from the need to find an operational method capable of providing an objective approach for making decisions inherent in diagnostic evaluations and specific studies to be carried out on cultural assets in conditions of limited resources and a high number of works or elements. Due to the abundance of variables, factors and materials that influence the conservation of cultural heritage, the design of a data matrix and a unified sampling methodology represent the first step towards understanding its requirements, in addition to laying the foundations for the future development of statistical studies. These represent an optimal resource, being a branch of mathematics that studies the correlations and dependencies between physical and natural phenomena and has been used in several areas of knowledge, among which the social sciences, ecology, medicine and quality control stand out. in industrial processes. Among the tools offered by statistical sciences, which deal with studying a certain population by means of data collection, compilation and interpretation, exploratory data analysis (EDA) represents a means of understanding and formulating hypotheses from tables defined contingency. This work presents the results derived from the design and implementation of the data registration and analysis sheets adapted to the demands of the conservation sector, offering an approach to its applicative possibilities, advantages and limitations in relation to the resolution of cases of real studies treated throughout the experience of training, research and teaching in different realities and contexts. / Mastroiacovo, T. (2021). Diseño de tablas de registro unificadas para el diagnóstico y estimación del indicador de riesgo del patrimonio cultural [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/170194
|
3 |
Machine Learning and Multivariate Statistical Tools for Football AnalyticsMalagón Selma, María del Pilar 05 October 2023 (has links)
[ES] Esta tesis doctoral se centra en el estudio, implementación y aplicación de técnicas de aprendizaje automático y estadística multivariante en el emergente campo de la analítica deportiva, concretamente en el fútbol. Se aplican procedimientos comunmente utilizados y métodos nuevos para resolver cuestiones de investigación en diferentes áreas del análisis del fútbol, tanto en el ámbito del rendimiento deportivo como en el económico. Las metodologías empleadas en esta tesis enriquecen las técnicas utilizadas hasta el momento para obtener una visión global del comportamiento de los equipos de fútbol y pretenden ayudar al proceso de toma de decisiones. Además, la metodología se ha implementado utilizando el software estadístico libre R y datos abiertos, lo que permite la replicabilidad de los resultados.
Esta tesis doctoral pretende contribuir a la comprensión de los modelos de aprendizaje automático y estadística multivariante para la predicción analítica deportiva, comparando su capacidad predictiva y estudiando las variables que más influyen en los resultados predictivos de estos modelos. Así, siendo el fútbol un juego de azar donde la suerte juega un papel importante, se proponen metodologías que ayuden a estudiar, comprender y modelizar la parte objetiva de este deporte. Esta tesis se estructura en cinco bloques, diferenciando cada uno en función de la base de datos utilizada para alcanzar los objetivos propuestos.
El primer bloque describe las áreas de estudio más comunes en la analítica del fútbol y las clasifica en función de los datos utilizados. Esta parte contiene un estudio exhaustivo del estado del arte de la analítica del fútbol. Así, se recopila parte de la literatura existente en función de los objetivos alcanzados, conjuntamente con una revisión de los métodos estadísticos aplicados. Estos modelos son los pilares sobre los que se sustentan los nuevos procedimientos aquí propuestos.
El segundo bloque consta de dos capítulos que estudian el comportamiento de los equipos que alcanzan la Liga de Campeones o la Europa League, descienden a segunda división o permanecen en mitad de la tabla. Se proponen varias técnicas de aprendizaje automático y estadística multivariante para predecir la
posición de los equipos a final de temporada. Una vez realizada la predicción, se selecciona el modelo con mejor precisión predictiva para estudiar las acciones de juego que más discriminan entre posiciones. Además, se analizan las ventajas de las técnicas propuestas frente a los métodos clásicos utilizados hasta el momento.
El tercer bloque consta de un único capítulo en el que se desarrolla un código de web scraping para facilitar la recuperación de una nueva base de datos con información cuantitativa de las acciones de juego realizadas a lo largo del tiempo en los partidos de fútbol. Este bloque se centra en la predicción de los resultados de los partidos (victoria, empate o derrota) y propone la combinación de una técnica de aprendizaje automático, random forest, y la regresión Skellam, un método clásico utilizado habitualmente para predecir la diferencia de goles en el fútbol. Por último, se compara la precisión predictiva de los métodos clásicos utilizados hasta ahora con los métodos multivariantes propuestos.
El cuarto bloque también comprende un único capítulo y pertenece al área económica del fútbol. En este capítulo se aplica un novedoso procedimiento para desarrollar indicadores que ayuden a predecir los precios de traspaso. En concreto, se muestra la importancia de la popularidad a la hora de calcular el valor de mercado de los jugadores, por lo que este capítulo propone una nueva metodología para la recogida de información sobre la popularidad de los jugadores.
En el quinto bloque se revelan los aspectos más relevantes de esta tesis para la investigación y la analítica en el fútbol, incluyendo futuras líneas de trabajo. / [CA] Aquesta tesi doctoral se centra en l'estudi, implementació i aplicació de tècniques d'aprenentatge automàtic i estadística multivariant en l'emergent camp de l'analítica esportiva, concretament en el futbol. S'apliquen procediments comunament utilitzats i mètodes nous per a resoldre qu¿estions d'investigació en diferents àrees de l'anàlisi del futbol, tant en l'àmbit del rendiment esportiu com en l'econòmic. Les metodologies emprades en aquesta tesi enriqueixen les tècniques utilitzades fins al moment per a obtindre una visió global del comportament dels equips de futbol i pretenen ajudar al procés de presa de decisions. A més, la metodologia s'ha implementat utilitzant el programari estadístic lliure R i dades obertes, la qual cosa permet la replicabilitat dels resultats.
Aquesta tesi doctoral pretén contribuir a la comprensió dels models d'aprenentatge automàtic i estadística multivariant per a la predicció analítica esportiva, comparant la seua capacitat predictiva i estudiant les variables que més influeixen en els resultats predictius d'aquests models. Així, sent el futbol un joc d'atzar on la sort juga un paper important, es proposen metodologies que ajuden a estudiar, comprendre i modelitzar la part objectiva d'aquest esport. Aquesta tesi s'estructura en cinc blocs, diferenciant cadascun en funció de la base de dades utilitzada per a aconseguir els objectius proposats.
El primer bloc descriu les àrees d'estudi més comuns en l'analítica del futbol i les classifica en funció de les dades utilitzades. Aquesta part conté un estudi exhaustiu de l'estat de l'art de l'analítica del futbol. Així, es recopila part de la literatura existent en funció dels objectius aconseguits, conjuntament amb una revisió dels mètodes estadístics aplicats. Aquests models són els pilars sobre els quals se sustenten els nous procediments ací proposats.
El segon bloc consta de dos capítols que estudien el comportament dels equips que aconsegueixen la Lliga de Campions o l'Europa League, descendeixen a segona divisió o romanen a la meitat de la taula. Es proposen diverses tècniques d'aprenentatge automàtic i estadística multivariant per a predir la posició dels
equips a final de temporada. Una vegada realitzada la predicció, se selecciona el model amb millor precisió predictiva per a estudiar les accions de joc que més discriminen entre posicions. A més, s'analitzen els avantatges de les tècniques proposades enfront dels mètodes clàssics utilitzats fins al moment.
El tercer bloc consta d'un únic capítol en el qual es desenvolupa un codi de web scraping per a facilitar la recuperació d'una nova base de dades amb informació quantitativa de les accions de joc realitzades al llarg del temps en els partits de futbol. Aquest bloc se centra en la predicció dels resultats dels partits (victòria, empat o derrota) i proposa la combinació d'una tècnica d'aprenentatge automàtic, random forest, i la regressió Skellam, un mètode clàssic utilitzat habitualment per a predir la diferència de gols en el futbol. Finalment, es compara la precisió predictiva dels mètodes clàssics utilitzats fins ara amb els mètodes multivariants proposats.
El quart bloc també comprén un únic capítol i pertany a l'àrea econòmica del futbol. En aquest capítol s'aplica un nou procediment per a desenvolupar indicadors que ajuden a predir els preus de traspàs. En concret, es mostra la importància de la popularitat a l'hora de calcular el valor de mercat dels jugadors, per la qual cosa aquest capítol proposa una nova metodologia per a la recollida d'informació sobre la popularitat dels jugadors.
En el cinqué bloc es revelen els aspectes més rellevants d'aquesta tesi per a la investigació i l'analítica en el futbol, incloent-hi futures línies de treball. / [EN] This doctoral thesis focuses on studying, implementing, and applying machine learning and multivariate statistics techniques in the emerging field of sports analytics, specifically in football. Commonly used procedures and new methods are applied to solve research questions in different areas of football analytics, both in the field of sports performance and in the economic field. The methodologies used in this thesis enrich the techniques used so far to obtain a global vision of the behaviour of football teams and are intended to help the decision-making process. In addition, the methodology was implemented using the free statistical software R and open data, which allows for reproducibility of the results.
This doctoral thesis aims to contribute to the understanding of the behaviour of machine learning and multivariate models for analytical sports prediction, comparing their predictive capacity and studying the variables that most influence the predictive results of these models. Thus, since football is a game of chance where luck plays an important role, this document proposes methodologies that help to study, understand, and model the objective part of this sport. This thesis is structured into five blocks, differentiating each according to the database used to achieve the proposed objectives.
The first block describes the most common study areas in football analytics and classifies them according to the available data. This part contains an exhaustive study of football analytics state of the art. Thus, part of the existing literature is compiled based on the objectives achieved, with a review of the statistical methods applied. These methods are the pillars on which the new procedures proposed here are based.
The second block consists of two chapters that study the behaviour of teams concerning the ranking at the end of the season: top (qualifying for the Champions League or Europa League), middle, or bottom (relegating to a lower division). Several machine learning and multivariate statistical techniques are proposed to predict the teams' position at the season's end. Once the prediction has been made, the model with the best predictive accuracy is selected to study the game actions that most discriminate between positions. In addition, the advantages of our proposed techniques compared to the classical methods used so far are analysed.
The third block consists of a single chapter in which a web scraping code is developed to facilitate the retrieval of a new database with quantitative information on the game actions carried out over time in football matches. This block focuses on predicting match outcomes (win, draw, or loss) and proposing the combination of a machine learning technique, random forest, and Skellam regression model, a classical method commonly used to predict goal difference in football. Finally, the predictive accuracy of the classical methods used so far is compared with the proposed multivariate methods.
The fourth block also comprises a single chapter and pertains to the economic football area. This chapter applies a novel procedure to develop indicators that help predict transfer fees. Specifically, it is shown the importance of popularity when calculating the players' market value, so this chapter is devoted to propose a new methodology for collecting players' popularity information.
The fifth block reveals the most relevant aspects of this thesis for research and football analytics, including future lines of work. / Malagón Selma, MDP. (2023). Machine Learning and Multivariate Statistical Tools for Football Analytics [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/197630
|
Page generated in 0.0629 seconds