Return to search

Redes Bayesianas aplicada à predição de vendas em uma grande rede de fast-food brasileira / Bayesian Networks applied to the prediction of sales in a large Brazilian fast food chain

O segmento de fast-food tornou-se um mercado muito concorrido e com empresas bem conhecidas, tais como: Subway, McDonalds, Burguer King, Bobs e Habibs. Técnicas de inteligência artificial e ciência de dados podem oferecer inúmeros benefícios para este mercado, como por exemplo, permitir o desenvolvimento de modelos computacionais para tomada de decisões. No contexto de finanças onde envolvam a comercialização de determinados produtos, é muito comum deparar-se com cenários que envolvam incerteza, principalmente quando se deseja realizar projeções financeiras, avaliar riscos e estimativas. O objetivo deste trabalho consiste em desenvolver modelos probabilísticos baseados em Redes Bayesianas (RB) para realizar predições em vendas e análise de causalidade entre variáveis que influenciam no processo de comercialização de determinados grupos de produtos no seguimento de fast-food. Nesta análise foram avaliadas Redes Bayesianas com aprendizado de estrutura baseado em restrições, através do algoritmo Grow Shrink (GS), e Redes Bayesianas com aprendizado de estrutura baseado em pontuação, através do algoritmo Hill-Climbing (HC), posteriormente foram comparadas com um modelo de série temporal baseado em Generalized Additive Model (GAM). Os dados para análise foram adquiridos de uma rede de fast-food brasileira que possui cerca de 1100 lojas associadas, destas, foram utilizadas lojas que pertencem ao estado de São Paulo, assim como avaliado variáveis de grupos de vendas no período de 2010 à 2017. Os resultados foram avaliados através da métrica Mean Absolute Percentage Error (MAPE), que considera valores reais alimentados em modelos e valores ajustados a partir do modelo e calcula a diferença absoluta entre os dois como porcentagem do valor real, com base neste cálculo é possível obter a acurácia de cada modelo. A Rede Bayesiana (RB) com aprendizagem de estrutura baseada em pontuação, utilizando o algoritmo Hill Climbing (HC), foi escolhida como o melhor modelo, pois apresentou relações causais mais coerentes entre os vértices que influenciam o processo de venda, bem como combinações de vértices que resultam em combos de produtos, além disso, resultou em 97.60% de acurácia na previsão de vendas das lojas do estado de São Paulo (SP) na amostra de teste avaliada, com base na métrica Mean Absolute Percentage Error (MAPE). / The fast-food segment has become a busy market with well-known companies such as: Subway, McDonalds, Burger King, Bobs and Habibs. Artificial intelligence and data science techniques can offer innumerable benefits to this market, such as allowing the development of computational models for decision making. In the context of finances involving the marketing of certain products, it is very common to come across scenarios where uncertainty is involved, especially when financial projections are desired, to evaluate risks and estimation. The objective of this work is to develop probabilistic models based on Bayesian Networks (BN) to make sales predictions and causality analysis among variables that influence the commercialization process of certain product groups in the fast-food segment. In this analysis we evaluated Bayesian networks with learning of structure based on constraints, through the algorithm Grow Shrink (GS), and Bayesian Networks with learning of structure based on score, through the algorithm Hill-Climbing (HC), later were compared with a model time series based on Generalized Additive Model (GAM). The data for analysis were acquired from a Brazilian fast-food chain with approximately 1100 associated stores, of which stores were used that belong to the state of São Paulo, as well as evaluated variables of sales groups in the period from 2010 to 2017. The results were evaluated by using the Mean Absolute Percentage Error (MAPE), which considers real values fed in models and values adjusted from the model and calculates the absolute difference between the two as a percentage of the real value, based on this calculation it is possible to obtain the accuracy of each model. The Bayesian Network (BN) with scoring based structure learning, using the Hill Climbing (HC) algorithm, was chosen as the best model because it presented more coherent causal relationships between vertices that influence the sales process, as well as combinations of vertices that result in product combos, in addition, achieved a 97.60% accuracy in the sales forecast of stores in the state of Sao Paulo (SP) in the test sample evaluated, based on the Mean Absolute Percentage Error (MAPE) metric.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-21082019-112654
Date18 February 2019
CreatorsSilva, Robson Fernandes da
ContributorsLopes, Alneu de Andrade
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeDissertação de Mestrado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0027 seconds