Spelling suggestions: "subject:"ciencia dde datos"" "subject:"ciencia dee datos""
21 |
Habilidades del equipo de ciencia de datos en la empresa modernaLoayza Castañeda, Flor de María Micaela, Rubio Rodríguez, Estefanía Yuvel 28 November 2021 (has links)
En esta investigación se presentan postulados que diversos autores exponen sobre las habilidades del equipo de ciencia de datos en la empresa moderna; por ello, es importante conocer los antecedentes de la ciencia de datos, sus características relevantes, las habilidades blandas y técnicas del científico de datos, y la productividad científica que aporta a las organizaciones y sociedad, a fin de entender cómo esta ciencia contribuye a la mejora de las relaciones en el nivel empresarial y social. El trabajo se divide en seis partes: en primer lugar, se presenta de manera detallada cuál ha sido el método de investigación utilizado para recopilar la información. En el segundo apartado, se aborda los puntos relacionados a la ciencia de datos. El tercer apartado describe los rasgos que componen al denominado científico de datos: sus roles y funciones. En cuarto lugar, se presenta a la empresa moderna como el principal receptor de la denominada 4a Revolución Industrial. El quinto apartado se muestran los análisis y resultados de la presente investigación. Por último, en sexto lugar, se expone las conclusiones a las que se han arribado luego de reflexiones y debates, tanto individuales como grupales. / In this work, postulates that various authors expose about the skills of the data science team in modern companies are presented. Therefore, it is important to know the background of data science, its relevant characteristics, soft and technical skills of the data scientist and the scientific productivity it brings to organizations and society, to understand how this science contributes to the improvement of relationships at the business and social level. This work is divided into six parts. In the first place, the research method used to collect the work information is presented in detail. In the second section, the points related to data science are addressed. The third section describes the traits that make up the so-called data scientist: their roles and functions. Fourth, the modern company is presented as the main recipient of the so-called 4th Industrial Revolution. The fifth section shows the analysis and results of our research are presented. Finally, in sixth place, exposes the conclusions reached after reflections and debates, both individual and group. / Trabajo de Suficiencia Profesional
|
22 |
Towards Data Wrangling Automation through Dynamically-Selected Background KnowledgeContreras Ochando, Lidia 04 February 2021 (has links)
[ES] El proceso de ciencia de datos es esencial para extraer valor de los datos. Sin embargo, la parte más tediosa del proceso, la preparación de los datos, implica una serie de formateos, limpieza e identificación de problemas que principalmente son tareas manuales. La preparación de datos todavía se resiste a la automatización en parte porque el problema depende en gran medida de la información del dominio, que se convierte en un cuello de botella para los sistemas de última generación a medida que aumenta la diversidad de dominios, formatos y estructuras de los datos.
En esta tesis nos enfocamos en generar algoritmos que aprovechen el conocimiento del dominio para la automatización de partes del proceso de preparación de datos. Mostramos la forma en que las técnicas generales de inducción de programas, en lugar de los lenguajes específicos del dominio, se pueden aplicar de manera flexible a problemas donde el conocimiento es importante, mediante el uso dinámico de conocimiento específico del dominio. De manera más general, sostenemos que una combinación de enfoques de aprendizaje dinámicos y basados en conocimiento puede conducir a buenas soluciones. Proponemos varias estrategias para seleccionar o construir automáticamente el conocimiento previo apropiado en varios escenarios de preparación de datos. La idea principal se basa en elegir las mejores primitivas especializadas de acuerdo con el contexto del problema particular a resolver.
Abordamos dos escenarios. En el primero, manejamos datos personales (nombres, fechas, teléfonos, etc.) que se presentan en formatos de cadena de texto muy diferentes y deben ser transformados a un formato unificado. El problema es cómo construir una transformación compositiva a partir de un gran conjunto de primitivas en el dominio (por ejemplo, manejar meses, años, días de la semana, etc.). Desarrollamos un sistema (BK-ADAPT) que guía la búsqueda a través del conocimiento previo extrayendo varias meta-características de los ejemplos que caracterizan el dominio de la columna. En el segundo escenario, nos enfrentamos a la transformación de matrices de datos en lenguajes de programación genéricos como R, utilizando como ejemplos una matriz de entrada y algunas celdas de la matriz de salida. También desarrollamos un sistema guiado por una búsqueda basada en árboles (AUTOMAT[R]IX) que usa varias restricciones, probabilidades previas para las primitivas y sugerencias textuales, para aprender eficientemente las transformaciones.
Con estos sistemas, mostramos que la combinación de programación inductiva, con la selección dinámica de las primitivas apropiadas a partir del conocimiento previo, es capaz de mejorar los resultados de otras herramientas actuales específicas para la preparación de datos. / [CA] El procés de ciència de dades és essencial per extraure valor de les dades. No obstant això, la part més tediosa del procés, la preparació de les dades, implica una sèrie de transformacions, neteja i identificació de problemes que principalment són tasques manuals. La preparació de dades encara es resisteix a l'automatització en part perquè el problema depén en gran manera de la informació del domini, que es converteix en un coll de botella per als sistemes d'última generació a mesura que augmenta la diversitat de dominis, formats i estructures de les dades.
En aquesta tesi ens enfoquem a generar algorismes que aprofiten el coneixement del domini per a l'automatització de parts del procés de preparació de dades. Mostrem la forma en què les tècniques generals d'inducció de programes, en lloc dels llenguatges específics del domini, es poden aplicar de manera flexible a problemes on el coneixement és important, mitjançant l'ús dinàmic de coneixement específic del domini. De manera més general, sostenim que una combinació d'enfocaments d'aprenentatge dinàmics i basats en coneixement pot conduir a les bones solucions. Proposem diverses estratègies per seleccionar o construir automàticament el coneixement previ apropiat en diversos escenaris de preparació de dades. La idea principal es basa a triar les millors primitives especialitzades d'acord amb el context del problema particular a resoldre.
Abordem dos escenaris. En el primer, manegem dades personals (noms, dates, telèfons, etc.) que es presenten en formats de cadena de text molt diferents i han de ser transformats a un format unificat. El problema és com construir una transformació compositiva a partir d'un gran conjunt de primitives en el domini (per exemple, manejar mesos, anys, dies de la setmana, etc.). Desenvolupem un sistema (BK-ADAPT) que guia la cerca a través del coneixement previ extraient diverses meta-característiques dels exemples que caracteritzen el domini de la columna. En el segon escenari, ens enfrontem a la transformació de matrius de dades en llenguatges de programació genèrics com a R, utilitzant com a exemples una matriu d'entrada i algunes dades de la matriu d'eixida. També desenvolupem un sistema guiat per una cerca basada en arbres (AUTOMAT[R]IX) que usa diverses restriccions, probabilitats prèvies per a les primitives i suggeriments textuals, per aprendre eficientment les transformacions.
Amb aquests sistemes, mostrem que la combinació de programació inductiva amb la selecció dinàmica de les primitives apropiades a partir del coneixement previ, és capaç de millorar els resultats d'altres enfocaments de preparació de dades d'última generació i més específics. / [EN] Data science is essential for the extraction of value from data. However, the most tedious part of the process, data wrangling, implies a range of mostly manual formatting, identification and cleansing manipulations. Data wrangling still resists automation partly because the problem strongly depends on domain information, which becomes a bottleneck for state-of-the-art systems as the diversity of domains, formats and structures of the data increases.
In this thesis we focus on generating algorithms that take advantage of the domain knowledge for the automation of parts of the data wrangling process. We illustrate the way in which general program induction techniques, instead of domain-specific languages, can be applied flexibly to problems where knowledge is important, through the dynamic use of domain-specific knowledge. More generally, we argue that a combination of knowledge-based and dynamic learning approaches leads to successful solutions. We propose several strategies to automatically select or construct the appropriate background knowledge for several data wrangling scenarios. The key idea is based on choosing the best specialised background primitives according to the context of the particular problem to solve.
We address two scenarios. In the first one, we handle personal data (names, dates, telephone numbers, etc.) that are presented in very different string formats and have to be transformed into a unified format. The problem is how to build a compositional transformation from a large set of primitives in the domain (e.g., handling months, years, days of the week, etc.). We develop a system (BK-ADAPT) that guides the search through the background knowledge by extracting several meta-features from the examples characterising the column domain. In the second scenario, we face the transformation of data matrices in generic programming languages such as R, using an input matrix and some cells of the output matrix as examples. We also develop a system guided by a tree-based search (AUTOMAT[R]IX) that uses several constraints, prior primitive probabilities and textual hints to efficiently learn the transformations.
With these systems, we show that the combination of inductive programming with the dynamic selection of the appropriate primitives from the background knowledge is able to improve the results of other state-of-the-art and more specific data wrangling approaches. / This research was supported by the Spanish MECD Grant FPU15/03219;and partially by the Spanish MINECO TIN2015-69175-C4-1-R (Lobass) and RTI2018-094403-B-C32-AR (FreeTech) in Spain; and by the ERC Advanced Grant Synthesising Inductive Data Models (Synth) in Belgium. / Contreras Ochando, L. (2020). Towards Data Wrangling Automation through Dynamically-Selected Background Knowledge [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/160724
|
23 |
Uso transdisciplinar del análisis sistémico en la ecología y en la creación de arte contemporáneo. Cambios de paradigma en la Valencia del siglo XXIMéndez Gallart, María José 18 April 2023 (has links)
[ES] La presente investigación ha tenido como objetivo explorar el de modo en que el arte
contemporáneo, puede contribuir a la adaptación biológica de los seres humanos desde
la transición a la sostenibilidad de los complejos sistemas sociotécnicos.
Debido al hecho de que el cerebro siempre está preparando hipótesis a futuro y
conociendo en parte, como emerge la conciencia en él, nos preguntamos de qué forma
la ciencia en toda su complejidad y las intersecciones que emergen entre diferentes
disciplinas al analizarse contextos reales, el uso de las tecnologías y los diferentes
sistemas de innovación contribuyen y pueden mejorar la adaptación cognitiva de los
seres humanos ante posibles disrupciones sociales y medioambientales en los
ecosistemas. En concreto se ha querido conocer de qué modo podemos aportar
información de valor, a través de la pedagogía, el modelado de sistemas y la ciencia de
sistemas. Al estudiar las estructuras emergentes en la autoorganización social, que
intervienen en la continua transformación de los diferentes regímenes del paisaje
dominante o Statu Quo del metabolismo socioeconómico global. A través de una
triangulación de metodologías la investigación presupone la capacidad creativa de los
seres humanos para abstraer la realidad y percibirla como totalidades, desde las que
poner conciencia de nuestras interdependencias biológicas con los ecosistemas. Y situar
en el contexto de investigación, la creencia de que, la clave de la sostenibilidad está en
la organización de lo vivo, en el código orgánico y en las dinámicas relacionales. Creemos
que el acceso al conocimiento es un fenómeno dinámico, espontáneo que se crea y se
destruye infinitamente, como lo es el fenómeno de la conciencia.
Al estudiar el contexto como agente crítico se ha elaborado una propuesta de
cambio a nivel institucional, destacando que es posible, a futuro, que la ciencias de la
complejidad integren el sistema valenciano de innovación. Para partir de una posición
justificada desde un punto de vista de método científico se ha acotado el objeto de
investigación y recurrido a la investigación de acción participativa de realismo crítico y
como marco de trabajo o enfoque, la perspectiva multinivel (MLP), que estudia la
complejidad de la transición a la sostenibilidad de los sistemas sociotécnicos de forma
agregada, desde el campo de la sociología y esta se ha anclado como punto de partida
en la sociología de los sistemas complejos adaptativos (SACS) / [CA] La present recerca ha tingut com a objectiu explorar la forma en què l'art contemporani, pot contribuir a l'adaptació biològica dels éssers humans des de la transició a la sostenibilitat dels complexos sistemes sociotècnics. Degut al fet fet de que el cervell sempre està preparant hipòtesi a futur i coneixent en part, com emergeix la consciència en ell, ens preguntem de quina forma la ciència en tota la seva complexitat i les interseccions que emergeixen de entreteixir l¿us de diferents disciplines en analitzar-se contextos reals, l'ús de les tecnologies i els diferents sistemes d'innovació contribueixen i poden millorar l'adaptació cognitiva dels éssers humans davant possibles disrupcions socials i mediambientals als ecosistemes. En concret s'ha volgut conèixer de quina manera podem aportar informació de valor, a través de la pedagogia, el modelatge de sistemes i la ciència de sistemas, de dades i la inteligencia artificial. En estudiar les estructures emergents en l'autoorganització social, que intervenen en la contínua transformació dels diferents règims del paisatge dominant o Statu quo del metabolisme socioeconòmic global, a través del nostre contexte local. Emprant una triangulació de metodologies , la recerca pressuposa la capacitat creativa dels éssers humans per a abstreure la realitat i percebre-la com a totalitats, des de les quals posar consciència de les nostres interdependències biològiques amb els ecosistemes. I situar a l'entorn de estudi , la creença, de que la clau de la sostenibilitat està en l'organització del viu, en el codi orgànic, en les dinàmiques relacionals. Creiem que l'accés al coneixement és un fenomen dinàmic, espontani que es crea i es destrueix infinitament, com ho és el fenomen de la consciència. En estudiar el context com a agent crític s'ha elaborat una proposta de canvi a nivell institucional, destacant que és possible, a futur, que la ciències de la complexitat integrin el Sistema Valencià d'Innovació (SVI), i el nacional. Per a partir d'una posició justificada des d'un punt de vista de mètode científic s'ha delimitat l'objecte de recerca i recorregut a la recerca d'acció participativa de realisme crític i com a marc de treball o enfocament, la Perspectiva Multi Nivell (MLP), que estudia la complexitat de forma agregada i com a punt de unió en el campo de estudi de la Sociología dels Sistemes Complexos Adaptatius (SACS) / [EN] The aim of this academic research is to explore how contemporary art can contribute to the biological adaptation of human beings in the transition to sustainability of complex socio-technical systems. Owing to the fact that the brain is always hypothesizing about the future and knowing to some extent how consciousness emerges, the question is raised of how science, technologies and different systems of innovation in all their complexity, and what emerges from the intersections between different disciplines when real contexts are analyzed, can contribute and can improve human beings' cognitive adaptation in the face of social and environmental disruption in ecosystems. Specifically, the intention has been to ascertain how we can contribute information of value in the following ways: By means of pedagogy, systems modelling and systems science. By studying the emerging structures in social self-organization which intervene in the ongoing transformation of the different regimes of the dominant landscape or the Statu quo of the global socio-economic metabolism. By means of the triangulation of methodologies, this study presupposes the creative capacity of human beings to abstract reality and to perceive it as totalities, thereby making us aware of our biological interdependence with ecosystems. This situates in a setting of discovery, the belief, that the key to sustainability is in the organization of the living, the organic code, and relational dynamics. We believe that the access to knowledge is a phenomenon which is both dynamic and spontaneous and which is created and destroyed in one neverending process, as is the phenomenon of consciousness. In the process of studying the context as the critical agent, a proposal for institutional change has been drawn up, a proposal which posits that in the future the Valencian system of innovation could be integrated in the sciences of complexity, a case in point could be UPV and more in particular the experience of a pre-doctoral student. In order to start from a position which can be justified from the point of view of the scientific method the object of this research has been limited, and the approach has been that of participatory action research and critical realism, while the framework or focus adopted was the Multi-Level Perspective (MLP), which studies complexities in aggregate form, connected across Sociology with Adaptative Complex Sytems (SACS) field of study. . / Méndez Gallart, MJ. (2023). Uso transdisciplinar del análisis sistémico en la ecología y en la creación de arte contemporáneo. Cambios de paradigma en la Valencia del siglo XXI [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/192757
|
24 |
Statistical Machine Learning in Biomedical EngineeringGonzález Cebrián, Alba 15 April 2024 (has links)
[ES] Esta tesis, desarrollada bajo una beca de formación de personal investigador de la Universitat Politècnica de València, tiene como objetivo proponer y aplicar metodologías de Statistical Machine Learning en contextos de Ingeniería Biomédica. Este concepto pretende aunar el uso de modelos de aprendizaje automático junto con la búsqueda de comprensión e interpretabilidad clásica del razonamiento estadístico, dando lugar a soluciones tecnológicas de problemas biomédicos que no pasen únicamente por el objetivo de optimizar el desempeño predictivo de los modelos. Para ello, se han dibujado dos objetivos principales que vertebran además el documento: proponer metodologías novedosas dentro del paraguas del Statistical Machine Learning, y aplicar soluciones a problemas biomédicos reales manteniendo esta filosofía en mente. Estos objetivos se han materializado en contribuciones metodológicas para la simulación de valores atípicos y la imputación de datos faltantes en presencia de datos atípicos, y en contribuciones aplicadas a casos reales para la mejora de procesos de atención médica, la mejora en el diagnóstico y pronóstico de enfermedades, y la estandarización de procedimientos de medición en entornos biotecnológicos. Dichas contribuciones se han artículado en capítulos correspondientes a las dos partes principales ya mencionadas. Finalmente, las conclusiones y líneas futuras cierran el documento, recalcando los mensajes principales de las contribuciones de la tesis doctoral en general, y sentando además las bases para líneas futuras que se han dibujado a consecuencia del trabajo realizado a lo largo del doctorado. / [CA] Aquesta tesi, desenvolupada sota una beca de formació de personal investigador de la Universitat Politècnica de València, té com a objectiu proposar i aplicar metodologies de Statistical Machine Learning en contextos d'Enginyeria Biomèdica. Aquest concepte pretén unir l'ús de models d'aprenentatge automàtic juntament amb la cerca de comprensió i interpretació clàssica del raonament estadístic, donant lloc a solucions tecnològiques de problemes biomèdics que no passen únicament per l'objectiu d'optimitzar el rendiment predictiu dels models. Per a això, s'han dibuixat dos objectius principals que vertebren a més el document: proposar metodologies noves dins del paraigua del Statistical Machine Learning, i aplicar solucions a problemes biomèdics reals mantenint aquesta filosofia en ment. Aquests objectius s'han materialitzat en contribucions metodològiques per a la simulació de valors atípics i la imputació de dades mancants en presència de valors atípics, i en contribucions aplicades a casos reals per a la millora de processos d'atenció mèdica, la millora en el diagnòstic i pronòstic de malalties, i l'estandardització de procediments de mesurament en entorns biotecnològics. Aquestes contribucions s'han articulat en capítols corresponents a les dues parts principals ja esmentades. Finalment, les conclusions i línies futures tanquen el document, recalant els missatges principals de les contribucions, de la tesi doctoral en general, i assentant a més les bases per a línies futures que s'han dibuixat com a consequència del treball realitzat al llarg del doctorat. / [EN] This thesis, developed under a research personnel formation grant from the Universitat Politècnica de València, aims to propose and apply methodologies of Statistical Machine Learning in Biomedical Engineering contexts. This concept seeks to combine machine learning models with the classic understanding and interpretability of statistical reasoning, resulting in technological solutions for biomedical problems that go beyond solely optimizing the predictive performance of models. To achieve this, two main objectives have been outlined, which also structure the document: proposing novel methodologies within the umbrella of Statistical Machine Learning and applying solutions to real biomedical problems while keeping this philosophy in mind. These objectives have materialized into methodological contributions for simulating outliers and imputing missing data in the presence of outliers and applied contributions to real cases for improving healthcare processes, enhancing disease diagnosis and prognosis, and standardizing measurement procedures in biotechnological environments. These contributions are articulated in chapters corresponding to the aforementioned two main parts. Finally, the conclusions and future lines of research conclude the document, reiterating the main messages of the contributions and the overall doctoral thesis and laying the groundwork for future lines of inquiry stemming from the work conducted throughout the doctorate. / González Cebrián, A. (2024). Statistical Machine Learning in Biomedical Engineering [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/203529
|
Page generated in 0.0487 seconds