Return to search

[en] A FRAMEWORK TO AUTOMATE DATA SCIENCE TASKS THROUGH PERSONALIZED CHATBOTS / [pt] UM FRAMEWORK PARA AUTOMATIZAR TAREFAS DE CIENCIA DE DADOS ATRAVéS DE INTERFACES CONVERSACIONAIS

[pt] Diversas soluções foram criadas para automatizar cenários específicos de
ciência de dados e implementações de conteúdo personalizado em interfaces de
conversação. No entanto, o entendimento geral dessas interfaces de conversação
que fornecem sugestões personalizadas para cientistas de dados ainda é pouco
explorado. Identificamos a necessidade de automatizar procedimentos de ciência de dados até diferentes níveis de automação. Nossa pesquisa se concentra
em ajudar os cientistas de dados durante a automação desses procedimentos
usando interfaces conversacionais. Propomos um framework para a criação de
um sistema chat-bot para facilitar a automação de cenários comuns de ciência de dados. Além disso, instanciamos a solução em dois cenários diferentes
de ciência de dados. O primeiro cenário se concentra na detecção de valores
discrepantes e o segundo na limpeza de dados. Conduzimos um estudo com 28
participantes para demonstrar que os cientistas de dados podem usar a solução
proposta. Todos os participantes concluíram as atividades corretamente e 75 a
80 por cento acharam o framework relativamente fácil de estender e usar. Nossa análise sugere que o uso de interfaces conversacionais pode facilitar a automação
de tarefas de ciência de dados. / [en] Several solutions have been created for automating specific data science
scenarios and implementations of personalized content in conversational interfaces. However, the overall understanding of these conversational interfaces
that provide personalized suggestions for data scientists is still poorly explored. We identify the need to automate data science procedures up to different
levels of automation. Our research focuses on helping data scientists during the
automation of these procedures by using conversational interfaces. We propose
a framework for creating a chat-bot system to facilitate the automation of data
science common scenarios. In addition, we instantiate the framework in two
different data science scenarios. The first scenario focuses on outlier detection,
and the second scenario on data cleaning. We conducted a study with 28 participants to demonstrate that data scientists can use the proposed framework.
All participants completed the activities correctly, and 75 to 80 percent found the
framework relatively easy to extend and use. Our analysis suggests that the
use of conversational interfaces can facilitate the automation of data science
tasks.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:57219
Date31 January 2022
CreatorsJEFRY SASTRE PEREZ
ContributorsHELIO CORTES VIEIRA LOPES
PublisherMAXWELL
Source SetsPUC Rio
LanguageEnglish
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.0017 seconds