Food waste in the food industry is often a result from the complex nature of food production. Uncertainty is always present as yields vary and as there is a chain of consumer demand from stores to producers. Food waste is a waste of both natural and economic resources affecting both the planet and the producer. The environmental impact is further affected as excessive production that leads to waste correlates to an excessive carbon footprint from excessive farming, transports, and processing. Additional environmental impacts are excessive land usage and overfertilization. In order to aid in the reduction of food waste in the food industry, this thesis evaluates a machine learning approach to predicting commercial waste. This thesis evaluates 11 predictive machine learning models on their predictability on commercial food waste at a large product producing company in the dairy industry. The models are evaluated according to the two metrics; Root Mean Squared Error (RMSE) and Mean Absolute Error (MAE). Based on the models’ RMSE and MAE metrics, the Random Forest model proved to be the most suitable model. It presented the best and statistically significant RMSE. It also produced the best MAE but without statistical significance to gradient boost and Support Vector Regression (SVR), indicating that the difference in performance between the models, according to MAE, are within a variation span that can occur due to chance. / Matsvinn inom matrindustirn är ofta ett resultat av komplexiteten inom matproduktion. Variation i skördar och efterfrågan genom hela kedjan av kunder och konsumenter är alla bidragande faktorer. Matsvinn är ett slöseri på både naturliga och ekonomiska resurser som påverkar både miljön och produktionsbolagets ekonomi negativt. Miljöpåverkan påverkas ytterligare då överproduktion som leder till avfall korrelerar med överdrivet utsfläpp av koldioxid från överdrivet jordbruk, transporter, och tillverkning. Överproduktion av mat leder även till överdriven använding av mark och övergödning. För att bidra till minskat matsvinn i matindustrin, utvärderar denna avhandling 11 prediktiva regressionsmodeller om deras förmåga att förutse matsvinn inom produktion vid en mejeriproducent. Modellerna utvärderas enligt två mått; RMSE och MAE. Baserat på modellernas RMSE-mått visade sig Random Forest vara den mest lämpliga modellen. Den producerade bäst och statistiskt signifikant RMSE. Modellen producerade även bäst MAE men icke signifikanta resultat till gradient boost och SVR indikerar skillnaden mellan dessa modellers prestanda, enligt MAE, ligger inom ramen för slumpmässig varians.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-338359 |
Date | January 2023 |
Creators | Carlsson, Alexander |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2023:252 |
Page generated in 0.0016 seconds