• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 28
  • 3
  • 2
  • Tagged with
  • 33
  • 33
  • 12
  • 12
  • 12
  • 12
  • 12
  • 10
  • 9
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Implementación de una aplicación para el análisis y visualización de eventos en español usando extracción automática de ontologías

Valeriano Loli, Enrique 12 February 2019 (has links)
La globalización y la aparición de diferentes tecnologías como las redes sociales han ocasionado que la información relacionada a noticias y eventos se propague de una manera más rápida. Ahora las empresas deben estar siempre pendientes a los datos generados para así ser más eficaces en su relación con ellos. Sin embargo, esta es una tarea difícil debido a la gran cantidad de datos y a la falta de procesos automáticos para analizar estos, sobre todo en el idioma español. Como objetivo de este proyecto, se busca brindar una aplicación la cual de manera automática pueda realizar análisis de datos de eventos en español y permitan visualizar los aspectos más importantes relacionados a estos datos. Para esto se implementarán algoritmos de Análisis de Formal de Conceptos y Análisis de Patrones Léxico-Sintácticos. Además, se usarán ontologías para poder estructurar la información recolectada a partir de los algoritmos. Se concluye que los algoritmos desarrollados permiten obtener las entidades y relaciones más relevantes encontradas en los datos con porcentajes relativamente altos de precisión y exhaustividad sobre todo usando datos limpios. Además, es posible mostrar la información recolectada de manera adecuada debido a la flexibilidad de las ontologías. / Tesis
2

Análisis multivariado enfocado al marketing. Guía práctica para posicionamiento, imagen y segmentación utilizando herramientas de Excel

Galaz Arce, Isabel, Maldonado Olea, Pamela, Vergara Soto, Paula January 2003 (has links)
No description available.
3

Entwicklung und anwendung eines verfahrens zur bestimmung des dynamischen verhaltens carpaler vibrissen von Ratten (Rattus norvegicus)

Fliegner, Caroline 09 March 2017 (has links)
Viele S augetiere nutzen Vibrissen als taktile Sinnesorgane, um sich in ihrer Umwelt zurechtzu nden. Besonders Nagetiere, die ihre Vordergliedma en neben dem Laufen auch zum Greifen nutzen, weisen h au g nahe des Handgelenks carpale Vibrissen auf. Uber diese ist bisher wenig bekannt. Damit technische Systeme mit taktilen Sensoren nach dem Vorbild carpaler Vibrissen ausgestattet werden k onnen, m ussen die Eigenschaften letzterer bekannt sein. Im Rahmen dieser Arbeit wird ein Beitrag zur dynamischen Charakterisierung der Vibrissen geleistet. Es werden zun achst ein analytisches Modell und ein Finite-Elemente-Modell zur Beschreibung der Vibrissenschwingung entwickelt. Sie dienen der Uberpr ufung der Messwerte und der Parameteridenti kation. Eine Modalanalyse konnte erfolgreich durchgef uhrt und die Ergebnisse mit den Messdaten verglichen werden. Anschlie end werden verschiedene Verfahren getestet und hinsichtlich ihrer Eignung bewertet, die dynamischen Eigenschaften carpaler und mystacialer Vibrissen zu bestimmen. Die Vibrissenauslenkung wird optisch mit einer Hochgeschwindigkeitskamera bzw. mittels Makrofotogra e dokumentiert. Die Auswertung der Daten erfolgt in Matlab. Ergebnisse lassen sich zum einen mittels einer einmaligen Auslenkung der Vibrisse mit einem Festk orper erzielen: Aus der freien, ged ampften Schwingung des Haars werden die Eigenfrequenz und der D ampfungsgrad ermittelt. Zum anderen kann mit der Anregung durch einen Schwingerreger der Amplitudengang bestimmt werden. / Many mammals use whiskers to acquire information about their environment. Especially those rodents that use their forelimps not only for walking but also for climbing and handling food possess tactile hair near their wrists. Little is knwon about these so-called carpal vibrissae. In order to successfully implement vibrissa-like sensors in engineering applications, it is necessary to characterize the biological model. Within this thesis, an analytical and a nite element model are being developed in order to describe the oscillation of the vibrissa. Furtheron, they are to be used as reference for experimental data. A modal analysis is successfully implemented and the results were then compared to experimental data. In order to derive the ideal experimental setup for the characterization of carpal vibrissae, several approaches to the excitation of a single vibrissa are tested and evaluated. All experiments are documented optically, using either a high-speed camera or macro photography. Analysis of the data is conducted in Matlab. Two setups show promising performance: A one-time de ection of the vibrissa resulting in a free damped oscillation yields good results for both eigenfrequency and damping ratio while an excitation of the vibrissa via a vibration system leads to the amplitude response of the hair. / Tesis
4

Marco de lealtad hacia los juegos de azar en Chile

Balmaceda Delgado, Paloma, Cantín Segura, Catalina, Cofré González, Susana January 2009 (has links)
En la actualidad, muchas empresas destinan parte importante de sus esfuerzos y recursos para fidelizar a sus clientes, generando una relación estrecha, duradera y comprometida con éstos. Esta investigación esquematiza un marco de lealtad para los juegos de azar, planteando que la satisfacción influye en la confianza, ésta en el compromiso, y éste último en la lealtad. Además, detalla que el monto y los sesgos influyen en la ilusión, la cual a su vez, influye en la satisfacción. Por su parte, la comunicación, la familiaridad y la reputación influyen en la confianza; y la participación en los valores en el compromiso. Efectuamos una investigación de mercado a través de una encuesta realizada a 400 personas, de la RM, que jugaran Loto o Kino, al menos dos veces al mes, estratificando la muestra en base a la proporción que cada grupo socioeconómico tiene en la región. En lo que respecta a los resultados obtenidos, en el análisis de unidimensionalidad de los datos, se observa que las variables integradas dentro de cada dimensión efectivamente se agrupan en un único componente, explicando más del 60% de la varianza total. Con respecto al análisis de fiabilidad, se observa que para todos los constructos se obtiene un alpha de Cronbach mayor a 0,7. Luego de efectuar los análisis Chi-Cuadrado, destacamos los constructos que tienen un verdadero grado de asociación con las variables demográficas y conductuales, y los que carecen de esta relación. Al realizar el análisis ANOVA logramos comparar las medias de varios grupos, pudiendo determinar diferencias significativas entre los constructos, y las variables conductuales y demográficas de nuestra muestra. Al regresionar el modelo se asegura la consistencia del mismo, puesto que cada variable es relevante e influye de manera positiva en su respectivo vínculo, determinado por las diferentes hipótesis. De esta forma, los resultados muestran que el modelo planteado se cumple en su totalidad.
5

Development of algorithms of statistical signal processing for the detection and pattern recognitionin time series. Application to the diagnosis of electrical machines and to the features extraction in Actigraphy signals.

Iglesias Martínez, Miguel Enrique 08 June 2020 (has links)
[ES] En la actualidad, el desarrollo y aplicación de algoritmos para el reconocimiento de patrones que mejoren los niveles de rendimiento, detección y procesamiento de datos en diferentes áreas del conocimiento resulta un tema de gran interés. En este contexto, y específicamente en relación con la aplicación de estos algoritmos en el monitoreo y diagnóstico de máquinas eléctricas, el uso de señales de flujo es una alternativa muy interesante para detectar las diferentes fallas. Asimismo, y en relación con el uso de señales biomédicas, es de gran interés extraer características relevantes en las señales de actigrafía para la identificación de patrones que pueden estar asociados con una patología específica. En esta tesis, se han desarrollado y aplicado algoritmos basados en el procesamiento estadístico y espectral de señales, para la detección y diagnóstico de fallas en máquinas eléctricas, así como su aplicación al tratamiento de señales de actigrafía. Con el desarrollo de los algoritmos propuestos, se pretende tener un sistema dinámico de indicación e identificación para detectar la falla o la patología asociada que no depende de parámetros o información externa que pueda condicionar los resultados, sólo de la información primaria que inicialmente presenta la señal a tratar (como la periodicidad, amplitud, frecuencia y fase de la muestra). A partir del uso de los algoritmos desarrollados para la detección y diagnóstico de fallas en máquinas eléctricas, basados en el procesamiento estadístico y espectral de señales, se pretende avanzar, en relación con los modelos actualmente existentes, en la identificación de fallas mediante el uso de señales de flujo. Además, y por otro lado, mediante el uso de estadísticas de orden superior, para la extracción de anomalías en las señales de actigrafía, se han encontrado parámetros alternativos para la identificación de procesos que pueden estar relacionados con patologías específicas. / [CAT] En l'actualitat, el desenvolupament i aplicació d'algoritmes per al reconeixement de patrons que milloren els nivells de rendiment, detecció i processament de dades en diferents àrees del coneixement és un tema de gran interés. En aquest context, i específicament en relació amb l'aplicació d'aquests algoritmes a la monitorització i diagnòstic de màquines elèctriques, l'ús de senyals de flux és una alternativa molt interessant per tal de detectar les diferents avaries. Així mateix, i en relació amb l'ús de senyals biomèdics, és de gran interés extraure característiques rellevants en els senyals d'actigrafia per a la identificació de patrons que poden estar associats amb una patologia específica. En aquesta tesi, s'han desenvolupat i aplicat algoritmes basats en el processament estadístic i espectral de senyals per a la detecció i diagnòstic d'avaries en màquines elèctriques, així com la seua aplicació al tractament de senyals d'actigrafia. Amb el desenvolupament dels algoritmes proposats, es pretén obtindre un sistema dinàmic d'indicació i identificació per a detectar l'avaria o la patologia associada, el qual no depenga de paràmetres o informació externa que puga condicionar els resultats, només de la informació primària que inicialment presenta el senyal a tractar (com la periodicitat, amplitud, freqüència i fase de la mostra). A partir de l'ús dels algoritmes desenvolupats per a la detecció i diagnòstic d'avaries en màquines elèctriques, basats en el processament estadístic i espectral de senyals, es pretén avançar, en relació amb els models actualment existents, en la identificació de avaries mitjançant l'ús de senyals de flux. A més, i d'altra banda, mitjançant l'ús d'estadístics d'ordre superior, per a l'extracció d'anomalies en els senyals d'actigrafía, s'han trobat paràmetres alternatius per a la identificació de processos que poden estar relacionats amb patologies específiques. / [EN] Nowadays, the development and application of algorithms for pattern recognition that improve the levels of performance, detection and data processing in different areas of knowledge is a topic of great interest. In this context, and specifically in relation to the application of these algorithms to the monitoring and diagnosis of electrical machines, the use of stray flux signals is a very interesting alternative to detect the different faults. Likewise, and in relation to the use of biomedical signals, it is of great interest to extract relevant features in actigraphy signals for the identification of patterns that may be associated with a specific pathology. In this thesis, algorithms based on statistical and spectral signal processing have been developed and applied to the detection and diagnosis of failures in electrical machines, as well as to the treatment of actigraphy signals. With the development of the proposed algorithms, it is intended to have a dynamic indication and identification system for detecting the failure or associated pathology that does not depend on parameters or external information that may condition the results, but only rely on the primary information that initially presents the signal to be treated (such as the periodicity, amplitude, frequency and phase of the sample). From the use of the algorithms developed for the detection and diagnosis of failures in electrical machines, based on the statistical and spectral signal processing, it is intended to advance, in relation to the models currently existing, in the identification of failures through the use of stray flux signals. In addition, and on the other hand, through the use of higher order statistics for the extraction of anomalies in actigraphy signals, alternative parameters have been found for the identification of processes that may be related to specific pathologies. / Iglesias Martínez, ME. (2020). Development of algorithms of statistical signal processing for the detection and pattern recognitionin time series. Application to the diagnosis of electrical machines and to the features extraction in Actigraphy signals [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/145603 / TESIS
6

El modelo de larga duración Weibull-Geométrica

Torres Salinas, Karina Hesi 20 March 2019 (has links)
Los modelos de larga duración son una extensión de los modelos de supervivencia tradicional y nos permiten modelar una proporción de la población que no llegan a experimentar un evento de interés, incluso después de un largo periodo de seguimiento. En este trabajo se presenta y deduce la distribución de larga duración Weibull-Geométrica y su proceso de estimación e inferencia. Se desarrolló un estudio de simulación con el un de evaluar el desempeño de las estimaciones y determinar si se recuperan los parámetros. Asimismo el modelo fue aplicado a una muestra de clientes que adquirieron y activaron una tarjeta de crédito entre enero a diciembre del año 2015 y donde el principal objetivo del análisis era entender el comportamiento del tiempo hasta la cancelación de la tarjeta de crédito del cliente. Comparamos al modelo de larga duración Weibull-Geométrica con otros modelos de larga duración, Exponencial-Geométrica y Weibull. Los resultados indican que nuestro modelo muestra un mejor ajuste en los datos. / Tesis
7

Redes neuronales artificiales aplicadas al análisis de datos

Montaño Moreno, Juan José 13 September 2002 (has links)
Este trabajo describe tres líneas de investigación desarrolladas en los últimos cinco años en torno a la aplicación de las Redes Neuronales Artificiales (RNA) en el ámbito del análisis de datos. Los campos de aplicación tratados son: el análisis de datos aplicado a conductas adictivas, el análisis de supervivencia, y el estudio del efecto de las variables de entrada en una red neuronal. Los resultados obtenidos ponen de manifiesto, en primer lugar, que las RNA son capaces de predecir el consumo de éxtasis con un margen de error pequeño a partir de las respuestas dadas a un cuestionario. Desde una perspectiva explicativa, el análisis de sensibilidad aplicado al modelo de red ha identificado los factores asociados al consumo de esta sustancia. En segundo lugar, los modelos de redes jerárquicas y secuenciales permiten el manejo de datos de supervivencia superando en algunos aspectos el rendimiento del modelo que tradicionalmente ha sido utilizado hasta el momento, el modelo de regresión de Cox. Por último, el análisis de sensibilidad numérico propuesto por nosotros es el procedimiento que permite evaluar con mayor exactitud la importancia o efecto de las variables de entrada de una red Perceptrón Multicapa. Por su parte, el programa informático Sensitivity Neural Network 1.0, desarrollado por nuestro equipo, permite simular el comportamiento de una red Perceptrón Multicapa e incorpora un conjunto de procedimientos numéricos y gráficos que han demostrado ser de utilidad en el análisis del efecto de las variables de entrada de una RNA. / This work describes three lines of research developed in the last five years around the application of Artificial Neural Networks (ANN) in the field of the data analysis. The aplication fields are: the data analysis applied to addictive behaviors, the survival analysis, and the study of the effect of the input variables in a neural network. The results show, in the first place, that the ANN is able to predict the ecstasy consumption with a good accuracy through the answers given to a questionnaire. From an explanatory perspective, the sensitivity analysis applied to the network model has identified the factors associated to the consumption of this substance. In second place, the hierarchical and sequential network models allow to manage the survival data overcoming in some aspects the performance of the model that traditionally has been used until the moment, Cox regression model. Lastly, the numeric sensitivity analysis proposed by us is the procedure that allows to evaluate with more accuracy the importance or effect of the input variables in a Multilayer Perceptron network. On the other hand, the computer program Sensitivity Neural Network 1.0, developed by our team, allows to simulate the behavior of a Multilayer Perceptron and it incorporates a series of numeric and graphics procedures that have demonstrated being of utility in the analysis of the effect of the input variables in ANN.
8

Use of multivariate statistical methods for the analysis of metabolomic data

Hervás Marín, David 12 November 2019 (has links)
[ES] En las últimas décadas los avances tecnológicos han tenido como consecuencia la generación de una creciente cantidad de datos en el campo de la biología y la biomedicina. A día de hoy, las así llamadas tecnologías "ómicas", como la genómica, epigenómica, transcriptómica o metabolómica entre otras, producen bases de datos con cientos, miles o incluso millones de variables. El análisis de datos ómicos presenta una serie de complejidades tanto metodoló-gicas como computacionales que han llevado a una revolución en el desarrollo de nuevos métodos estadísticos específicamente diseñados para tratar con este tipo de datos. A estas complejidades metodológicas hay que añadir que, en la mayor parte de los casos, las restricciones logísticas y/o económicas de los proyectos de investigación suelen conllevar que los tamaños muestrales en estas bases de datos con tantas variables sean muy bajos, lo cual no hace sino empeorar las dificultades de análisis, ya que se tienen muchísimas más variables que observaciones. Entre las técnicas desarrolladas para tratar con este tipo de datos podemos encontrar algunas basadas en la penalización de los coeficientes, como lasso o elastic net, otras basadas en técnicas de proyección sobre estructuras latentes como PCA o PLS y otras basadas en árboles o combinaciones de árboles como random forest. Todas estas técnicas funcionan muy bien sobre distintos datos ómicos presentados en forma de matriz (IxJ). Sin embargo, en ocasiones los datos ómicos pueden estar expandidos, por ejemplo, al tomar medidas repetidas en el tiempo sobre los mismos individuos, encontrándonos con estructuras de datos que ya no son matrices, sino arrays tridimensionales o three-way (IxJxK). En estos casos, la mayoría de las técnicas citadas pierden parte de su aplicabilidad, quedando muy pocas opciones viables para el análisis de este tipo de estructuras de datos. Una de las técnicas que sí es útil para el análisis de estructuras three-way es N-PLS, que permite ajustar modelos predictivos razonablemente precisos, así como interpretarlos mediante distintos gráficos. Sin embargo, relacionado con el problema de la escasez de tamaño muestral relativa al desorbitado número de variables, aparece la necesidad de realizar una selección de variables relacionadas con la variable respuesta. Esto es especialmente cierto en el ámbito de la biología y la biomedicina, ya que no solo se quiere poder predecir lo que va a suceder, sino entender por qué sucede, qué variables están implicadas y, a poder ser, no tener que volver a recoger los cientos de miles de variables para realizar una nueva predicción, sino utilizar unas cuantas, las más importantes, para poder diseñar kits predictivos coste/efectivos de utilidad real. Por ello, el objetivo principal de esta tesis es mejorar las técnicas existentes para el análisis de datos ómicos, específicamente las encaminadas a analizar datos three-way, incorporando la capacidad de selección de variables, mejorando la capacidad predictiva y mejorando la interpretabilidad de los resultados obtenidos. Todo ello se implementará además en un paquete de R completamente documentado, que incluirá todas las funciones necesarias para llevar a cabo análisis completos de datos three-way. El trabajo incluido en esta tesis por tanto, consta de una primera parte teórico-conceptual de desarrollo de la idea del algoritmo, así como su puesta a punto, validación y comprobación de su eficacia; de una segunda parte empírico-práctica de comparación de los resultados del algoritmo con otras metodologías de selección de variables existentes, y de una parte adicional de programación y desarrollo de software en la que se presenta todo el desarrollo del paquete de R, su funcionalidad y capacidades de análisis. El desarrollo y validación de la técnica, así como la publicación del paquete de R, ha permitido ampliar las opciones actuales para el análisis / [CAT] En les últimes dècades els avançaments tecnològics han tingut com a conseqüència la generació d'una creixent quantitat de dades en el camp de la biologia i la biomedicina. A dia d'avui, les anomenades tecnologies "òmiques", com la genòmica, epigenòmica, transcriptòmica o metabolòmica entre altres, produeixen bases de dades amb centenars, milers o fins i tot milions de variables. L'anàlisi de dades 'òmiques' presenta una sèrie de complexitats tant metodolò-giques com computacionals que han portat a una revolució en el desenvolupament de nous mètodes estadístics específicament dissenyats per a tractar amb aquest tipus de dades. A aquestes complexitats metodològiques cal afegir que, en la major part dels casos, les restriccions logístiques i / o econòmiques dels projectes de recerca solen comportar que les magnituts de les mostres en aquestes bases de dades amb tantes variables siguen molt baixes, el que no fa sinó empitjorar les dificultats d'anàlisi, ja que es tenen moltíssimes més variables que observacions Entre les tècniques desenvolupades per a tractar amb aquest tipus de dades podem trobar algunes basades en la penalització dels coeficients, com lasso o elastic net, altres basades en tècniques de projecció sobre estructures latents com PCA o PLS i altres basades en arbres o combinacions d'arbres com random forest. Totes aquestes tècniques funcionen molt bé sobre diferents dades 'òmiques' presentats en forma de matriu (IxJ), però, en ocasions les dades òmiques poden estar expandits, per exemple, cuan ni ha mesures repetides en el temps sobre els mateixos individus, trobant-se amb estructures de dades que ja no són matrius, sinó arrays tridimensionals o three-way (IxJxK). En aquestos casos, la majoria de les tècniques mencionades perden tota o bona part de la seua aplicabilitat, quedant molt poques opcions viables per a l'anàlisi d'aquest tipus d'estructures de dades. Una de les tècniques que sí que és útil per a l'anàlisi d'estructures three-way es N-PLS, que permet ajustar models predictius raonablement precisos, així com interpretar-los mitjançant diferents gràfics. No obstant això, relacionat amb el problema de l'escassetat de mostres relativa al desorbitat nombre de variables, apareix la necessitat de realitzar una selecció de variables relacionades amb la variable resposta. Això és especialment cert en l'àmbit de la biologia i la biomedicina, ja que no només es vol poder predir el que va a succeir, sinó entendre per què passa, quines variables estan implicades i, si pot ser, no haver de tornar a recollir els centenars de milers de variables per realitzar una nova predicció, sinó utilitzar unes quantes, les més importants, per poder dissenyar kits predictius cost / efectius d'utilitat real. Per això, l'objectiu principal d'aquesta tesi és millorar les tècniques existents per a l'anàlisi de dades òmiques, específicament les encaminades a analitzar dades three-way, incorporant la capacitat de selecció de variables, millorant la capacitat predictiva i millorant la interpretabilitat dels resultats obtinguts. Tot això s'implementarà a més en un paquet de R completament documentat, que inclourà totes les funcions necessàries per a dur a terme anàlisis completes de dades three-way. El treball inclòs en aquesta tesi per tant, consta d'una primera part teorica-conceptual de desenvolupament de la idea de l'algoritme, així com la seua posada a punt, validació i comprovació de la seua eficàcia, d'una segona part empíric-pràctica de comparació dels resultats de l'algoritme amb altres metodologies de selecció de variables existents i d'una part adicional de programació i desenvolupament de programació en la qual es presenta tot el desenvolupament del paquet de R, la seua funcionalitat i capacitats d'anàlisi. El desenvolupament i validació de la tècnica, així com la publicació del paquet de R, ha permès ampliar les opcions actuals per a l'anàlis / [EN] In the last decades, advances in technology have enabled the gathering of an increasingly amount of data in the field of biology and biomedicine. The so called "-omics" technologies such as genomics, epigenomics, transcriptomics or metabolomics, among others, produce hundreds, thousands or even millions of variables per data set. The analysis of 'omic' data presents different complexities that can be methodological and computational. This has driven a revolution in the development of new statistical methods specifically designed for dealing with these type of data. To this methodological complexities one must add the logistic and economic restrictions usually present in scientific research projects that lead to small sample sizes paired to these wide data sets. This makes the analyses even harder, since there is a problem in having many more variables than observations. Among the methods developed to deal with these type of data there are some based on the penalization of the coefficients, such as lasso or elastic net, others based on projection techniques, such as PCA or PLS, and others based in regression or classification trees and ensemble methods such as random forest. All these techniques work fine when dealing with different 'omic' data in matrix format (IxJ), but sometimes, these IxJ data sets can be expanded by taking, for example, repeated measurements at different time points for each individual, thus having IxJxK data sets that raise more methodological complications to the analyses. These data sets are called three-way data. In this cases, the majority of the cited techniques lose all or a good part of their applicability, leaving very few viable options for the analysis of this type of data structures. One useful tool for analyzing three-way data, when some Y data structure is to be predicted, is N-PLS. N-PLS reduces the inclusion of noise in the models and obtains more robust parameters when compared to PLS while, at the same time, producing easy-to-understand plots. Related to the problem of small sample sizes and exorbitant variable numbers, comes the issue of variable selection. Variable selection is essential for facilitating biological interpretation of the results when analyzing 'omic' data sets. Often, the aim of the study is not only predicting the outcome, but also understanding why it is happening and also what variables are involved. It is also of interest being able to perform new predictions without having to collect all the variables again. Because all of this, the main goal of this thesis is to improve the existing methods for 'omic' data analysis, specifically those for dealing with three-way data, incorporating the ability of variable selection, improving predictive capacity and interpretability of results. All this will be implemented in a fully documented R package, that will include all the necessary functions for performing complete analyses of three-way data. The work included in this thesis consists in a first theoretical-conceptual part where the idea and development of the algorithm takes place, as well as its tuning, validation and assessment of its performance. Then, a second empirical-practical part comes where the algorithm is compared to other variable selection methodologies. Finally, an additional programming and software development part is presented where all the R package development takes place, and its functionality and capabilities are exposed. The development and validation of the technique, as well as the publication of the R package, has opened many future research lines. / Hervás Marín, D. (2019). Use of multivariate statistical methods for the analysis of metabolomic data [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/130847 / TESIS
9

Aplicación de Data Science Specialist

Ccora Camarena, Yuli, Jeri De La Cruz, Nélida, Enriquez Yance, Rosario Grace 14 January 2020 (has links)
El trabajo de investigación que se presenta a continuación constituye el análisis de la problemática planteada sobre la empresa Travico Perú S.A.C, la cual ha reportado un descenso en sus ventas de sus diferentes servicios que ofrece. Para este desarrollo de este trabajo se ha aplicado la metodología de la ciencia de datos, con la cual se logró identificar las variables que influyeron en las ventas de todos los servicios durante los años 2016 al 2018, el conjunto de datos se obtuvo a través de plataformas con las que la empresa trabaja y los reportes de control interno, con ello, se identificaron 12 variables con 6429 datos. Así mismo, se empleó la técnica de aprendizaje automático no supervisado, basado en particiones: K means, las cual permitió segmentar y agrupar las variables que fueron seleccionadas. Finalmente, para el análisis, se presentaron distintas gráficas con los resultados de las ventas de la empresa y se hicieron comparaciones con los resultados de los clústeres. / The research work presented below constitutes the analysis of the problem raised about the company Travico Perú S.A.C, which has reported a decrease in its sales of its different services offered. For this development of this work, the methodology of data science has been applied, with which it has been identified to identify the variables that influenced the sales of all services during the years 2016 to 2018, the data set was achieved through of platforms with which the company works and internal control reports, thereby identifying 12 variables with 6429 data. Furthermore, we use a technique machine learning without supervised, based on partitions: K means the qualified segment and group the variables that were selected. Finally, for the analysis, different graphs are shown with the results of the company's sales and comparisons were made with the results of the clusters. / Trabajo de investigación
10

Estudio bibliométrico de artículos científicos de Psicología sobre adicción al trabajo recogidos de la base de datos Redalyc.org en el periodo 2009-2019 / Bibliometric study of scientific psychology articles on work addiction from the Redalyc.org database

Córdova Ventocilla, Dora Milagros, Cortijo Garay, Rosario Valentina, Matassini Rosas, Maria de Fatima, Mosquera Huaman, Samantha Milagros, Vargas Dávila, Abigail 15 September 2020 (has links)
El objetivo del estudio fue realizar un análisis bibliométrico de las publicaciones científicas de la base de datos Redalyc.org, para establecer información actual sobre los artículos científicos de Psicología sobre adicción al trabajo. Primero, se realizó una búsqueda de la variable en la base de datos elegida, utilizando como criterios: idioma portugués, español e inglés y antigüedad de 10 años (2009-2019), encontrándose un total de 19 artículos, de los cuales se eliminaron 10 por no ser de metodología cuantitativa y no tener una muestra constituida en América, quedando cuatro artículos relacionados a la variable, los cuales conformaron la muestra del presente estudio. Posteriormente, se llevó a cabo el análisis de datos haciendo un cálculo de frecuencias y porcentajes, y se desarrolló un análisis de la información obtenida. En los resultados se resalta que el cien por ciento de estudios contienen resumen, abstract, palabras claves, introducción y objetivos. De esta manera, se puede concluir que la bibliometría es una herramienta valiosa y útil, haciendo tangible la información de investigaciones previas con el objetivo de contribuir al desarrollo y avance de la ciencia en el Perú. / The aim of the study was to carry out a bibliometric analysis of the scientific publications from the Redalyc.org database to determine current information on scientific articles in Psychology about work addiction. First, we research the variable using the following criteria: Portuguese, Spanish and English with 10-year seniority (2009-2019), finding a total of 19 articles, which 10 were removed for not belong to the quantitative methodology and not having a sample placed in America. This left us four articles related to the variable, which are part of the sample of this study. Then, the data analysis was performed by calculating frequencies, percentages, and an analysis of the information obtained. The results show us that one hundred percent of studies contain abstract in two different languages, keywords, introduction and objectives. We conclude that bibliometrics is a valuable and useful tool, making information from previous research noticeable in order to contribute to the development and advance of Peruvian's science. / Trabajo de investigación

Page generated in 0.0554 seconds