Return to search

Classification of Wi-Fi Sensor Data for a Smarter City : Probabilistic Classification using Bayesian Statistics

As cities are growing with an increasing number of residents, problems with the traffic such as congestion and larger emission arise. The city planners have challenges with making it as easy as possible for the residents to commute and in as large scale as possible to avoid vehicles. Before any improvements or reconstructions can be made, the traffic situation has to be mapped. The results from a probabilistic classification on Wi-Fi sensor data collected in an area in the southern part of Stockholm showed that some streets are more likely to be trafficked by cyclists than pedestrians while other streets showed the opposite. The goal of this thesis was to classify observations as either pedestrians or as cyclists. To do that, Bayesian statistics was applied to perform a classification. Results from a cluster analysis performed with K-means algorithm were used as prior information to a probabilistic classification model. To be able to validate the results from this unsupervised statistical learning problem, several model diagnostic methods were used. The final model passes all limits of what is considered to be a stable model and shows clear signs of convergence. The data was collected using Wi-Fi sensors which detect a device passing by when the device is searching the area for a network to connect to. This thesis will focus on data from three months. Using Wi-Fi sensors as a data collection method makes it possible to track a device. However, many manufacturers produce network interface controllers that generate randomized addresses when the device is connecting to a network, which makes it difficult to track the majority of the devices. Therefore, Wi-Fi sensor data could be seen as not suitable for this type of study. Hence it is suggested that other methods should be used in the future. / I takt med att städer växer med ökat antal invånare uppståar det problem i trafiken såsom trängsel och utsläpp av partiklar. Trafikplanerare ställs inför utmaningar i form av hur de kan underlätta pendling för invånarna och hur de, i så stor utsträckning som möjligt, kan minska fordon i tätorten. Innan potentiella förbättringar och ombyggnationer kan genomföras måste trafiken kartläggas. Resultatet från en sannolikhetsklassificering på Wi-Fi sensordata insamlat i ett område i södra delen av Stockholm visar att vissa gator är mer trafikerade av cyclister än fotgängare medan andra gator visar på motsatt föhållande. Resultatet ger en indikation på hur proportionen mellan de två grupperna kan se ut. Målet var att klassificera varje observation som antingen fotgängare eller cyklist. För att göra det har Bayesiansk statistik applicerats i form av en sannolikhetsklassifikation. Reslutatet från en klusteranalys genomförd med ”K-means clustering algorithm” användes som prior information till klassificeringsmodellen. För att kunna validera resultatet från detta ”unsupervised statistical learning” -problem, användes olika metoder för modelldiagnostik. Den valda modellen uppfyller alla krav för vad som anses vara rimligt f ̈or en stabil modell och visar tydliga tecken på konvergens. Data samlades in med Wi-Fi sensorer som upptäcker förbipasserande enheter som söker efter potentiella nätverk att koppla upp sig mot. Denna metod har visat sig inte vara den mest optimala, eftersom tillverkare idag producerar nätverkskort som genererar en slumpad adress varje gång en enhet försöker ansluta till ett nätverk. De slumpade adresserna gör det svårt att följa majoriteten av enheterna mellan sensorera, vilket gör denna typ av data olämplig för denna typ av studie. Därf ̈or föreslås att andra metoder för att samla in data används i framtiden.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-159797
Date January 2019
CreatorsTyni, Elin, Wikberg, Johanna
PublisherUmeå universitet, Institutionen för matematik och matematisk statistik, Umeå universitet, Institutionen för matematik och matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds