• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Variablen-Verdichtung und Clustern von Big Data – Wie lassen sich die Free-Floating-Carsharing-Nutzer typisieren?

Harz, Jonas 21 September 2016 (has links) (PDF)
In den letzten Jahren hat die Verbreitung von stationsungebundenem Carsharing (Free- Floating-Carsharing) weltweit stark zugenommen. Aufgrund dessen wurden verschiedene Studien, welche die verkehrliche Wirkung von Free-Floating-Carsharing beschreiben, erstellt. Bisher unzureichend unter-sucht wurden jedoch die Nutzer von Free-Floating-Carsharing- Systemen. Im Rahmen der Mitarbeit der TU Dresden am Evaluationsbericht Carsharing in der Landeshauptstadt München standen für sämtliche Münchener Carsharinganbieter Daten zu Buchungen und Kunden zur Verfügung. Ziel dieser Arbeit war es nun, für die zwei Anbieter von Free-Floating-Carsharing eine Typisierung der Nutzer vorzunehmen. Für die Einteilung der Nutzer in Gruppen wurden zunächst Input-Variablen ausgewählt und erzeugt. Neben den zeitlichen Häufigkeiten der Nutzung für Monate, Wochentage und Zeitscheiben wurden zudem Gini-Faktoren berechnet, welche die Regelmäßigkeit der Nutzung abbilden. Außerdem wurden verschiedene Variablen aus den Buchungsdaten erzeugt. Dazu zählen Untersuchungen wie viele Fahrten amWohnort der Nutzer beginnen und/oder enden, ob Fahrten am gleichen Ort beginnen und enden und bei wie vielen Fahrten der Parktarif der Anbieter zum Einsatz kommt. Des Weiteren wurde untersucht, wie viele Fahrten den Flughafen als Start oder Ziel haben, wie der Einfluss des Wetters auf die Anzahl der Buchungen ist und wie hoch die mittlere Fahrtzeit pro Buchung je Nutzer ist. Alle Variablen dienten nun als Input für die Typisierung der Nutzer. Für die Typisierung wurde das Verfahren der Clusteranalyse ausgewählt. Dabei sind jedoch 30 Variablen eine zu große Anzahl, weswegen zuerst eine Verdichtung der Input-Variablen durchgeführt wurde. Dabei kam eine sogenannte Hauptkomponentenanalyse zum Einsatz. Diese bietet die Möglichkeit, verschieden stark korrelierende Variablen zusammenzufassen und dabei den Informationsgehalt dieser zu erhalten. Aus den 30 einfließenden Variablen ergaben sich mit Hilfe der Hauptkomponentenanalyse vier Faktoren, welche anschließend für die Clusteranalyse genutzt wurden. Jeder Nutzer lässt sich durch die vier Faktoren in einem vierdimensionalen Koordinatensystem ein-tragen. Anschließend kann in diesem Raum eine Clusterung durchgeführt werden. Für diese Arbeit wurde sich für das k-Means-Verfahren entschieden. Mit diesem wurden fünf Cluster bestimmt, welche die 13 000 Nutzer abbilden. Jeder Cluster lässt sich durch die Mittelwerte der eingeflossenen sowie durch soziodemografische Variablen wie Alter und Geschlecht und die Wohnorte der Nutzer hinsichtlich seiner Aussage interpretieren. Die fünf Cluster können in zwei Cluster mit einer niedrigen (Nr. 1 und 2), einen mit einer mittleren (Nr. 3) und zwei mit einer hohen Nutzungsintensität einteilen werden (Nr. 4 und 5). Cluster 1 vereint Nutzer, die selten aber spontane Fahrten unternehmen. Dabei sind überdurchschnittliche viele Fahrten am Wochenende und abends zu verzeichnen. In Cluster 2 finden sich Nutzer, die vorwiegend Fahrten mit langen Fahrtzeiten unternehmen. Dabei werden innerhalb einer Buchung mehrere Wege zurückgelegt, was sich an der hohen Nutzung des Parktarifs zeigt und daran, dass der größte Teil der Fahrten am Ausgangsort wieder enden. Diese Gruppe besitzt unter allen Gruppen einen überdurchschnittlich hohen Anteil an Frauen. Cluster 3 beschreibt den normalen Nutzer hinsichtlich der Nutzungsintensität und der zeitlichen Nutzung. Er ist mit 41,4% der Kunden der größte aller Cluster. Cluster 4 und 5 vereinen Kunden mit einer hohen Nutzungsintensität. Obwohl nur ca. 5% der Kunden in diesen beiden Gruppen zu finden sind, werden jedoch ein Drittel aller Fahrten von diesen Nutzern zurückgelegt. Cluster 4 beschreibt Nutzer mit einem typischen Pendlerverhalten. Dabei werden Fahrten vorwiegend Werktags und während der Hauptverkehrszeiten unternommen. Eine abnehmende Nutzung von Januar zu Juni lässt vermuten, dass andere Verkehrsmittel wie das Fahrrad genutzt werden. In Cluster 5 finden sich Kunden, die häufig Carsharing in der Nacht nutzen. Dies lässt vermuten, dass Aktivitäten des Nachtlebens besucht werden. Dieser Cluster hat im Vergleich zum Durchschnitt den geringsten Anteil an Frauen. Da die Ergebnisse ausschließlich auf den Anbieterdaten basieren, ist es nicht möglich, konkrete Aus-sagen über Effekte und Wirkungen von Free-Floating-Carsharing zu treffen und zu bewerten. Dafür wäre weitere Daten zum Beispiel aus Umfragen notwendig. Die klar abgrenzbaren und gut interpre-tierbaren Nutzergruppen zeigen jedoch, dass die gewählte Methodik sich zur Typisierung von Carsha-ringnutzern eignet. Eine Wiederholung des Verfahrens mit anderen Daten, zum Beispiel aus einem späteren Untersuchungszeitraum oder einer anderen Stadt, ist zu empfehlen.
2

Variablen-Verdichtung und Clustern von Big Data – Wie lassen sich die Free-Floating-Carsharing-Nutzer typisieren?

Harz, Jonas 21 September 2016 (has links)
In den letzten Jahren hat die Verbreitung von stationsungebundenem Carsharing (Free- Floating-Carsharing) weltweit stark zugenommen. Aufgrund dessen wurden verschiedene Studien, welche die verkehrliche Wirkung von Free-Floating-Carsharing beschreiben, erstellt. Bisher unzureichend unter-sucht wurden jedoch die Nutzer von Free-Floating-Carsharing- Systemen. Im Rahmen der Mitarbeit der TU Dresden am Evaluationsbericht Carsharing in der Landeshauptstadt München standen für sämtliche Münchener Carsharinganbieter Daten zu Buchungen und Kunden zur Verfügung. Ziel dieser Arbeit war es nun, für die zwei Anbieter von Free-Floating-Carsharing eine Typisierung der Nutzer vorzunehmen. Für die Einteilung der Nutzer in Gruppen wurden zunächst Input-Variablen ausgewählt und erzeugt. Neben den zeitlichen Häufigkeiten der Nutzung für Monate, Wochentage und Zeitscheiben wurden zudem Gini-Faktoren berechnet, welche die Regelmäßigkeit der Nutzung abbilden. Außerdem wurden verschiedene Variablen aus den Buchungsdaten erzeugt. Dazu zählen Untersuchungen wie viele Fahrten amWohnort der Nutzer beginnen und/oder enden, ob Fahrten am gleichen Ort beginnen und enden und bei wie vielen Fahrten der Parktarif der Anbieter zum Einsatz kommt. Des Weiteren wurde untersucht, wie viele Fahrten den Flughafen als Start oder Ziel haben, wie der Einfluss des Wetters auf die Anzahl der Buchungen ist und wie hoch die mittlere Fahrtzeit pro Buchung je Nutzer ist. Alle Variablen dienten nun als Input für die Typisierung der Nutzer. Für die Typisierung wurde das Verfahren der Clusteranalyse ausgewählt. Dabei sind jedoch 30 Variablen eine zu große Anzahl, weswegen zuerst eine Verdichtung der Input-Variablen durchgeführt wurde. Dabei kam eine sogenannte Hauptkomponentenanalyse zum Einsatz. Diese bietet die Möglichkeit, verschieden stark korrelierende Variablen zusammenzufassen und dabei den Informationsgehalt dieser zu erhalten. Aus den 30 einfließenden Variablen ergaben sich mit Hilfe der Hauptkomponentenanalyse vier Faktoren, welche anschließend für die Clusteranalyse genutzt wurden. Jeder Nutzer lässt sich durch die vier Faktoren in einem vierdimensionalen Koordinatensystem ein-tragen. Anschließend kann in diesem Raum eine Clusterung durchgeführt werden. Für diese Arbeit wurde sich für das k-Means-Verfahren entschieden. Mit diesem wurden fünf Cluster bestimmt, welche die 13 000 Nutzer abbilden. Jeder Cluster lässt sich durch die Mittelwerte der eingeflossenen sowie durch soziodemografische Variablen wie Alter und Geschlecht und die Wohnorte der Nutzer hinsichtlich seiner Aussage interpretieren. Die fünf Cluster können in zwei Cluster mit einer niedrigen (Nr. 1 und 2), einen mit einer mittleren (Nr. 3) und zwei mit einer hohen Nutzungsintensität einteilen werden (Nr. 4 und 5). Cluster 1 vereint Nutzer, die selten aber spontane Fahrten unternehmen. Dabei sind überdurchschnittliche viele Fahrten am Wochenende und abends zu verzeichnen. In Cluster 2 finden sich Nutzer, die vorwiegend Fahrten mit langen Fahrtzeiten unternehmen. Dabei werden innerhalb einer Buchung mehrere Wege zurückgelegt, was sich an der hohen Nutzung des Parktarifs zeigt und daran, dass der größte Teil der Fahrten am Ausgangsort wieder enden. Diese Gruppe besitzt unter allen Gruppen einen überdurchschnittlich hohen Anteil an Frauen. Cluster 3 beschreibt den normalen Nutzer hinsichtlich der Nutzungsintensität und der zeitlichen Nutzung. Er ist mit 41,4% der Kunden der größte aller Cluster. Cluster 4 und 5 vereinen Kunden mit einer hohen Nutzungsintensität. Obwohl nur ca. 5% der Kunden in diesen beiden Gruppen zu finden sind, werden jedoch ein Drittel aller Fahrten von diesen Nutzern zurückgelegt. Cluster 4 beschreibt Nutzer mit einem typischen Pendlerverhalten. Dabei werden Fahrten vorwiegend Werktags und während der Hauptverkehrszeiten unternommen. Eine abnehmende Nutzung von Januar zu Juni lässt vermuten, dass andere Verkehrsmittel wie das Fahrrad genutzt werden. In Cluster 5 finden sich Kunden, die häufig Carsharing in der Nacht nutzen. Dies lässt vermuten, dass Aktivitäten des Nachtlebens besucht werden. Dieser Cluster hat im Vergleich zum Durchschnitt den geringsten Anteil an Frauen. Da die Ergebnisse ausschließlich auf den Anbieterdaten basieren, ist es nicht möglich, konkrete Aus-sagen über Effekte und Wirkungen von Free-Floating-Carsharing zu treffen und zu bewerten. Dafür wäre weitere Daten zum Beispiel aus Umfragen notwendig. Die klar abgrenzbaren und gut interpre-tierbaren Nutzergruppen zeigen jedoch, dass die gewählte Methodik sich zur Typisierung von Carsha-ringnutzern eignet. Eine Wiederholung des Verfahrens mit anderen Daten, zum Beispiel aus einem späteren Untersuchungszeitraum oder einer anderen Stadt, ist zu empfehlen.

Page generated in 0.0718 seconds