Since its emergence, user generated content (UGC) has become the driving force in the growth of Internet traffic. As one of the most successful and popular UGC systems, YouTube contributes a great share of Internet traffic volume and has attracted a lot of academic interest. The continuously increasing amount of IP traffic motivates the need for better network design, more efficient content distribution mechanisms, and more sustainable system development. Web caching is one of the widely used techniques to reduce the inter Internet Service Provider (ISP) traffic. Web caching is considered an important part in the design of a content distribution infrastructure. This master’s thesis utilizes a one month trace of YouTube traffic in two residential networks in Sweden. Based upon a systematic and in-depth measurement we focus on analyzing the geographic locality of traffic patterns within small areas for these two networks. We summarize the YouTube traffic characteristics and user replay patterns, and then discuss why caching can be useful for YouTube-like systems. We present the optimal caching gain on a per area basis and also divide users into two groups: PC and mobile device users to show the caching gain for these two groups. Overall, an infinite capacity proxy cache for each small area could reduce the YouTube streaming data traffic by 30% to 45%. The result presented in this paper help us to understand YouTube traffic and user behaviors and provides valuable information for the ISPs to enable them to design more efficient caching mechanisms. When this work began we thought that a reduction of backhaul traffic (especially for mobile operators) may delay the need to make investments in upgrading their network capacity. However, an important conclusion from this thesis project is that the cache efficiency depends on the terminal type. For mobile terminals (smart phones, iPads, etc) a terminal cache solution is found to be the most efficient. For PCs in fixed networks, a network cache would be more efficient. It should be noted that the mobile terminals covered in the project are connected through home Wi-Fi, so further research is needed in order to draw definite conclusions for caching solutions for cellular networks. / Sedan dess tillkomst har användargenererat innehåll (på engelska: User Generated Content UGC) blivit den drivande kraften bakom ökningen av internettrafiken. Ett av de mest använda och populära UGC-systemen är Youtube, som bidrar med en stor del av volymen i internettrafiken, och har på så sätt lockat till sig ett stort akademiskt intresse. Den konstant ökande mängden av IP-trafik motiverar behovet av bättre nätverksdesign, effektivare mekanismer för delning av data, och en mer långsiktig system utveckling. Mellanlagring i nätet (network caching) är en av de mer använda teknikerna för att reducera trafiken för Internetoperatörer. Mellanlagring i nätet anses vara en viktig del i designen av den framtida media-distributionens infrastruktur. Det här examensarbetet använder en månads data från Youtube-trafik i två lokala nätverk i Sverige. Baserat på en systematisk och detaljerad mätning, fokuserar vi på att analysera specifika trafikmönster geografisk små områden för dessa två nätverk. Vi analyserar Youtube-trafikens egenskaper och karakteristik och användarnas beteende mönster. Baserat på dessa analyserar vi om mellanlagring kan vara en nyttig lösning för att reducera trafiken för Youtube-liknande system. Vi presenterar den optimala lagringsvinsten (cache gain) för geografiskt definierade populationer och vi delar även upp användare i två grupper: PC och mobila enheter, för att visa lagringsvinsten individuellt för dessa grupper. Generellt sett, om man hade en oändlig lagringskapacitet hos en proxy cache inom ett visst område, så skulle man kunna reducera Youtube-trafiken med 30-45%. Resultaten som presenterats i detta dokument, hjälper oss att förstå Youtube trafik och användar beteende, och ger värdefull information till operatörer, så att de kan designa effektivare lagringsmekanismer. Some utgångspunkt för detta arbete antog vi att en minskning av backhaultrafiken (särskilt för mobiloperatörer) kan fördröja behovet av att göra investeringar för att uppgradera kapaciteten i nätet. En viktig slutsats av detta examensarbete är att effektiviteten hos en proxy cache beror av terminaltypen. För mobila terminaler (smarta telefoner, iPads, etc) ger terminal-cache högre effektivitet, medan en nätverks-cache är effektivare för PCs. Det bör dock nämnas att mätningarna i detta arbete är från terminaler uppkopplade via fast bredband. Det behövs vidare analys för att dra konkreta slutsatser för användarbeteende och cache-lösningar i mobilnät.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-104195 |
Date | January 2012 |
Creators | Du, Manxing |
Publisher | KTH, Kommunikationssystem, CoS |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | Trita-ICT-EX ; 2012:246 |
Page generated in 0.0025 seconds