• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • 3
  • Tagged with
  • 7
  • 7
  • 7
  • 6
  • 5
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] A FRAMEWORK TO AUTOMATE DATA SCIENCE TASKS THROUGH PERSONALIZED CHATBOTS / [pt] UM FRAMEWORK PARA AUTOMATIZAR TAREFAS DE CIENCIA DE DADOS ATRAVéS DE INTERFACES CONVERSACIONAIS

JEFRY SASTRE PEREZ 31 January 2022 (has links)
[pt] Diversas soluções foram criadas para automatizar cenários específicos de ciência de dados e implementações de conteúdo personalizado em interfaces de conversação. No entanto, o entendimento geral dessas interfaces de conversação que fornecem sugestões personalizadas para cientistas de dados ainda é pouco explorado. Identificamos a necessidade de automatizar procedimentos de ciência de dados até diferentes níveis de automação. Nossa pesquisa se concentra em ajudar os cientistas de dados durante a automação desses procedimentos usando interfaces conversacionais. Propomos um framework para a criação de um sistema chat-bot para facilitar a automação de cenários comuns de ciência de dados. Além disso, instanciamos a solução em dois cenários diferentes de ciência de dados. O primeiro cenário se concentra na detecção de valores discrepantes e o segundo na limpeza de dados. Conduzimos um estudo com 28 participantes para demonstrar que os cientistas de dados podem usar a solução proposta. Todos os participantes concluíram as atividades corretamente e 75 a 80 por cento acharam o framework relativamente fácil de estender e usar. Nossa análise sugere que o uso de interfaces conversacionais pode facilitar a automação de tarefas de ciência de dados. / [en] Several solutions have been created for automating specific data science scenarios and implementations of personalized content in conversational interfaces. However, the overall understanding of these conversational interfaces that provide personalized suggestions for data scientists is still poorly explored. We identify the need to automate data science procedures up to different levels of automation. Our research focuses on helping data scientists during the automation of these procedures by using conversational interfaces. We propose a framework for creating a chat-bot system to facilitate the automation of data science common scenarios. In addition, we instantiate the framework in two different data science scenarios. The first scenario focuses on outlier detection, and the second scenario on data cleaning. We conducted a study with 28 participants to demonstrate that data scientists can use the proposed framework. All participants completed the activities correctly, and 75 to 80 percent found the framework relatively easy to extend and use. Our analysis suggests that the use of conversational interfaces can facilitate the automation of data science tasks.
2

[en] A DATA SCIENCE AND ACTUARIAL APPROACH FOR GROUNDING RISK DILUTION STRATEGIES INVOLVING EXTREME WINDS IN SOUTHERN BRAZIL / [pt] UMA ABORDAGEM DE CIÊNCIAS DE DADOS E ATUARIA PARA FUNDAMENTAÇÃO DE ESTRATÉGIAS DE DILUIÇÃO DE RISCOS ENVOLVENDO VENTOS EXTREMOS NO SUL DO BRASIL

TAYLOR OLIVEIRA FIDELIS 29 June 2023 (has links)
[pt] Aumento de eventos climáticos extremos está colocando empresas de seguros em risco, com perdas que chegam a bilhões de dólares. No Sul do Brasil, municípios sofreram perdas devido a eventos climáticos, incluindo um ciclone bomba que causou prejuízos próximos a 2 bilhões de reais. As perdas são em grande parte seguradas, mas avaliar a probabilidade de perdas devido a desastres naturais é difícil devido à dependência intrínseca entre os riscos expostos. Essa dissertação busca estudar ventos extremos na região Sul do Brasil, visando entender como precificar e diluir o risco em áreas de alto impacto. A pesquisa envolve a análise de dados meteorológicos, econômicos, sinistros reportados por seguradoras, prêmios reportados por seguradoras, estrutura populacional, PIB, relevo e outras variáveis relevantes para a pesquisa. O objetivo é estimar cenários de perdas decorrentes de eventos extremos e oferecer informações relevantes para avaliar estratégias de diluição de risco de perdas econômicas. A dissertação mistura distintas áreas, incluindo Economia, Atuária, Ciência de Dados, Estatística e Matemática. / [en] Increasing extreme weather events are putting insurance companies at risk,with losses reaching billions of dollars. In the South of Brazil, municipalities have suffered losses due to climate events, including a bomb cyclone that caused losses of around 2 billion of reais. These losses are largely insured, but evaluating the probability of losses due to natural disasters is difficult due to the intrinsic dependence between exposed risks. This dissertation seeks to study extreme winds in the Southern region of Brazil, aiming to understand how to price and dilute risk in high impact areas. The research involves the analysis of meteorological and economic data, insurance claims reported by insurers, premiums reported by insurers, population structure, GDP, topography, and other relevant variables for the research. The objective is to estimate loss scenarios resulting from extreme events and offer relevant information to evaluate strategies for diluting the risk of economic losses. The dissertation blends distinct areas, including Economics, Actuarial Science, Data Science, Statistics, and Mathematics.
3

[en] A VISUAL ANALYSIS OF BUS GPS DATA IN RIO / [pt] UMA ANÁLISE VISUAL DOS DADOS DE GPS DOS ÔNIBUS NO RIO

BRUNO GUBERFAIN DO AMARAL 19 July 2016 (has links)
[pt] O tema Cidades Inteligentes é um assunto de interesse para gestores públicos e pesquisadores. Desenvolver cidades mais inteligentes é um dos desafios para o futuro próximo devido à crescente demanda por serviços públicos. Em particular, o transporte público é um dos aspectos mais visíveis de uma cidade viva e, portanto, a sua implementação deve ser muito eficiente. O sistema de transporte público da cidade do Rio de Janeiro é historicamente deficiente, principalmente porque ele é baseado em um antigo sistema de ônibus. Para melhorá-lo, a Prefeitura tomou algumas ações, como o desenvolvimento de um projeto de dados aberto que mostra, a quase a cada minuto, a posição instantânea de todos os ônibus na cidade. Embora não seja uma nova tecnologia, esta é a primeira iniciativa a ser desenvolvida no Rio. Neste trabalho, são aprsentadas ferramentas simples para a exploração visual deste grande conjunto de dados com base em informações históricas, que chega a um total de mais de um bilhão de amostras. Com essas ferramentas, um usuário será capaz de verificar as tendências, identificar padrões e localizar anomalias nesta grande quantidade de dados de GPS dos ônibus. / [en] Smart cities is a current subject of interest for public administrators and researchers. Getting the cities smarter is one of the challenges for the near future, due to the growing demand for public services. In particular, public transportation is one of most visible aspects of a living city and, therefore, its implementation must be very efficient. The public transportation system of the City of Rio de Janeiro is historically deficient, mostly because it is based on an old bus system. To change it, the City Hall took some actions, such as the development of an open data project that shows, at about every minute, the GPS instant position of all buses in the city. Although it is not a new technology, it is the first initiative to be developed in Rio. This work presents simple tools for the visual exploration of this big dataset based on the historical information from this service, which reaches a total of more than one billion samples. With these tools one is able to discover trends, identify patterns, and locate abnormalities within the massive collection of the buses GPS data.
4

[pt] ENSAIOS EM PREDIÇÃO DO TEMPO DE PERMANÊNCIA EM UNIDADES DE TERAPIA INTENSIVA / [en] ESSAYS ON LENGTH OF STAY PREDICTION IN INTENSIVE CARE UNITS

IGOR TONA PERES 28 June 2021 (has links)
[pt] O tempo de permanência (LoS) é uma das métricas mais utilizadas para avaliar o uso de recursos em Unidades de Terapia Intensiva (UTI). Esta tese propõe uma metodologia estruturada baseada em dados para abordar três principais demandas de gestores de UTI. Primeiramente, será proposto um modelo de predição individual do LoS em UTI, que pode ser utilizado para o planejamento dos recursos necessários. Em segundo lugar, tem-se como objetivo desenvolver um modelo para predizer o risco de permanência prolongada, o que auxilia na identificação deste tipo de paciente e assim uma ação mais rápida de intervenção no mesmo. Finalmente, será proposto uma medida de eficiência ajustada por case-mix capaz de realizar análises comparativas de benchmark entre UTIs. Os objetivos específicos são: (i) realizar uma revisão da literatura dos fatores que predizem o LoS em UTI; (ii) propor uma metodologia data-driven para predizer o LoS individual do paciente na UTI e o seu risco de longa permanência; e (iii) aplicar essa metodologia no contexto de um grande conjunto de UTIs de diferentes tipos de hospitais. Os resultados da revisão da literatura apresentaram os principais fatores de risco que devem ser considerados em modelos de predição. Em relação ao modelo preditivo, a metodologia proposta foi aplicada e validada em um conjunto de dados de 109 UTIs de 38 diferentes hospitais brasileiros. Este conjunto continha um total de 99.492 internações de 01 de janeiro a 31 de dezembro de 2019. Os modelos preditivos construídos usando a metodologia proposta apresentaram resultados precisos comparados com a literatura. Estes modelos propostos têm o potencial de melhorar o planejamento de recursos e identificar precocemente pacientes com permanência prolongada para direcionar ações de melhoria. Além disso, foi utilizado o modelo de predição proposto para construir uma medida não tendenciosa para benchmarking de UTIs, que também foi validada no conjunto de dados estudado. Portanto, esta tese propôs um guia estruturado baseado em dados para gerar predições para o tempo de permanência em UTI ajustadas ao contexto em que se deseja avaliar. / [en] The length of stay (LoS) in Intensive Care Units (ICU) is one of the most used metrics for resource use. This thesis proposes a structured datadriven methodology to approach three main demands of ICU managers. First, we propose a model to predict the individual ICU length of stay, which can be used to plan the number of beds and staff required. Second, we develop a model to predict the risk of prolonged stay, which helps identifying prolonged stay patients to drive quality improvement actions. Finally, we build a case-mix-adjusted efficiency measure (SLOSR) capable of performing non-biased benchmarking analyses between ICUs. To achieve these objectives, we divided the thesis into the following specific goals: (i) to perform a literature review and meta-analysis of factors that predict patient s LoS in ICUs; (ii) to propose a data-driven methodology to predict the numeric ICU LoS and the risk of prolonged stay; and (iii) to apply this methodology in the context of a big set of ICUs from mixed-type hospitals. The literature review results presented the main risk factors that should be considered in future prediction models. Regarding the predictive model, we applied and validated our proposed methodology to a dataset of 109 ICUs from 38 different Brazilian hospitals. The included dataset contained a total of 99,492 independent admissions from January 01 to December 31, 2019. The predictive models to numeric ICU LoS and to the risk of prolonged stay built using our data-driven methodology presented accurate results compared to the literature. The proposed models have the potential to improve the planning of resources and early identifying prolonged stay patients to drive quality improvement actions. Moreover, we used our prediction model to build a non-biased measure for ICU benchmarking, which was also validated in our dataset. Therefore, this thesis proposed a structured data-driven guide to generating predictions to ICU LoS adjusted to the specific environment analyzed.
5

[pt] MINERANDO O PROCESSO DE UM COQUEAMENTO RETARDADO ATRAVÉS DE AGRUPAMENTO DE ESTADOS / [en] MINING THE PROCESS OF A DELAYED COKER USING CLUSTERED STATES

RAFAEL AUGUSTO GASETA FRANCA 25 November 2021 (has links)
[pt] Procedimentos e processos são essenciais para garantir a qualidade de qualquer operação. Porém, o processo realizado na prática nem sempre está de acordo com o processo idealizado. Além disso, uma análise mais refinada de gargalos e inconsistências só é possível a partir do registro de eventos do processo (log). Mineração de processos (process mining) é uma área que reúne um conjunto de métodos para reconstruir, monitorar e aprimorar um processo a partir de seu registro de eventos. Mas, ao aplicar as soluções já existentes no log de uma unidade de coqueamento retardado, os resultados foram insatisfatórios. O núcleo do problema está na forma como o log está estruturado, carecendo de uma identificação de casos, essencial para a mineração do processo. Para contornar esse problema, aplicamos agrupamento hierárquico aglomerativo no log, separando as válvulas em grupos que exercem uma função na operação. Desenvolvemos uma ferramenta (PLANTSTATE) para avaliar a qualidade desses grupos no contexto da planta e ajustar conforme a necessidade do domínio. Identificando os momentos de ativação desses grupos no log chegamos a uma estrutura de sequência e paralelismo entre os grupos. Finalmente, propomos um modelo capaz de representar as relações entre os grupos, resultando em um processo que representa a operações em uma unidade de coqueamento retardado. / [en] Procedures and processes are essential to guarantee the quality of any operation. However, processes carried out in the real world are not always in accordance with the imagined process. Furthermore, a more refined analysis of obstacles and inconsistencies is only possible from the process events record (log). Process mining is an area that brings together a set of methods to rebuild, monitor and improve processes from their log. Nevertheless, when applying existing solutions to the log of a delayed coker unit, the results were unsatisfactory. The core of the problem is how the log is structured, lacking a case identification, essential for process mining. To deal with this issue, we apply agglomerative hierarchical clustering in the log, separating the valves into groups that perform a task in an operation. We developed a tool (PLANTSTATE) to assess the quality of these groups in the context of the plant and to adjust in accord to the needs of the domain. By identifying the moments of activation of these groups in the log we arrive at a structure of sequence and parallelism between the groups. Finally, we propose a model capable of representing the relationships between groups, resulting in a process that represents the operations in a delayed coker unit.
6

[en] A CLOUD COMPUTING PLATFORM FOR STORING GEOREFERENCED MOBILITY DATA / [pt] UMA PLATAFORMA NA NUVEM PARA ARMAZENAMENTO DE DADOS GEORREFERENCIADOS DE MOBILIDADE URBANA

RAFAEL BARBOSA NASSER 15 December 2016 (has links)
[pt] A qualidade de vida nos grandes centros urbanos tem sido motivo de preocupação para governantes, empresários e para a população residente em geral. Os serviços de transporte público coletivo exercem papel central nessa discussão, uma vez que determinam, sobretudo para aquela camada da sociedade de menor poder aquisitivo, o tempo desperdiçado diariamente em seus deslocamentos. Nas metrópoles brasileiras, os ônibus municipais são predominantes no transporte coletivo. Os usuários deste serviço – passageiros – não dispõem de informações atualizadas sobre os ônibus e linhas de ônibus em operação. Oferecer essa natureza de informação contribui para uma melhor experiência de uso diário deste modal e, consequentemente, proporciona maior qualidade de vida aos seus usuários. Em uma visão mais abrangente, os ônibus podem ser considerados sensores que viabilizam a compreensão dos padrões e identificação de anomalias no tráfego de veículos nas áreas urbanas, possibilitando galgar benefícios para toda população. O presente trabalho apresenta uma plataforma na nuvem que captura, enriquece, armazena e disponibiliza os dados dos dispositivos de GPS instalados nos ônibus, permitindo a extração de conhecimento a partir deste valioso e volumoso conjunto de informações. Experimentos são realizados com os ônibus do Município do Rio de Janeiro, com aplicações focadas no passageiro e na sociedade. As metodologias, discussões e técnicas empregadas ao longo do trabalho poderão ser reutilizados para diferentes cidades, modais e perspectivas. / [en] The quality of life in urban centers has been a concern for governments, business and the resident population in general. Public transportation services perform a central role in this discussion, since they determine, especially for that layer of lower-income society, the time wasted daily in their movements. In Brazilian cities, city buses are predominant in public transportion. Users of this service - passengers - do not have updated information of buses and lines. Offer this kind of information contributes to a better everyday experience of this modal and therefore provides greater quality of life for its users. In a broader view, the bus can be considered sensors that enable the understanding of the patterns and identify anomalies in vehicle traffic in urban areas, allowing benefits for the whole population. This work presents a platform in the cloud computing environment that captures, enriches, stores and makes available the data from GPS devices installed on buses, allowing the extraction of knowledge from this valuable and voluminous set of information. Experiments are performed with the buses of the Municipality of Rio de Janeiro, with applications focused on passenger and society. The methodologies, discussions and techniques used throughout the work can be reused for different cities, modal and perspectives.
7

[en] DATA SCIENCE AND SOLID STATE CHEMISTRY: A PLATFORM FOR THE COMPETITIVENESS OF THE PHARMACEUTICAL INDUSTRY IN EMERGING MARKETS / [pt] CIÊNCIA DE DADOS E QUÍMICA DO ESTADO SÓLIDO: UMA PLATAFORMA PARA COMPETITIVIDADE DA INDÚSTRIA FARMOQUÍMICA E FARMACÊUTICA EM MERCADO EMERGENTES

RONALDO PEDRO DA SILVA 28 November 2018 (has links)
[pt] A área de química do estado sólido ocupa uma posição cada vez mais importante nas atividades de pesquisa e desenvolvimento farmacêuticas. A compreensão das propriedades do estado sólido de um insumo farmacêutico ativo (IFA) mostra-se crítica no desenvolvimento de formulações em função de seus impactos na biodisponibilidade e solubilidade dos fármacos, sendo essencial para garantir o benefício terapêutico, otimizar o desenvolvimento e garantir a proteção da propriedade intelectual. Esta tese investiga indicadores científicos e tecnológicos na área de química do estado sólido utilizando ferramentas de ciência dos dados a partir de publicações científicas e depósitos de patentes, visando contribuir para o aumento da competitividade da indústria farmoquímica e farmacêutica brasileira e de outros mercados emergentes. A partir da utilização de ferramentas de ciência dos dados é proposta uma metodologia baseada em técnicas de text mining associadas a relações fuzzy. Essa metodologia de identificação de competências específicas aplicada na área de química do estado sólido tem como estudo de caso a descoberta de uma nova forma polimórfica para o IFA acetato de dexametasona. Os resultados revelam que existem competências científicas em química do estado sólido no Brasil. Contudo, quando comparada com a interação universidade-empresa mundial, a indústria farmoquimica e farmacêutica local perde em estágio de competitividade e desenvolvimento. Por outro lado, os resultados demonstram a robustez da metodologia e sua capacidade de identificar pesquisadores em área específicas, oferecendo soluções para apoio a tomada de decisão e identificação de pesquisadores relevantes para o desenvolvimento do setor farmoquímico e farmacêutico. / [en] The solid-state chemistry area has received increased attention in the pharmaceutical research and development activities. The comprehension of the solid-state properties of an active pharmaceutical ingredient (API) is critical in the development of formulations due to their impact on the bioavailability and solubility of the final drug, being essential to ensure therapeutic benefit, optimize development and allow a proper intellectual property protection. This research investigates science and technology indicators in the solid-state chemistry area using data science tools applied to scientific publications and patent documents, aiming to contribute to the increase of the competitiveness of the pharmaceutical industry in Brazil and in other emerging markets. Through data science tools, a methodology based on text mining techniques associated to fuzzy relations is proposed. This methodology for identifying specific competencies is applied in the solid-state chemistry area exploring a case study of the discovery of a new polymorphic form of the API dexamethasone acetate. The results reveal the existence of scientific competencies in solid-state chemistry in Brazil. However, when compared to the global university-company interaction, the local pharmaceutical industry shows a lower stage of competitiveness and development. On the other hand, the results indicates the robustness of the methodology and its ability to identify researchers in specific areas, offering solutions to support the decision making and identification of researchers relevant to the development of the pharmaceutical sector.

Page generated in 0.0363 seconds