<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule"
>

<channel>
	<title>Wikipedistik &#187; Traffic</title>
	<atom:link href="http://wikipedistik.de/tag/traffic/feed/" rel="self" type="application/rss+xml" />
	<link>http://wikipedistik.de</link>
	<description>Nutzung von Wikis als Wissensmanagement unterstützende Systeme in Unternehmen</description>
	<lastBuildDate>Sun, 22 Nov 2009 22:46:01 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
		<item>
		<title>Hoher Bedarf an der Wikipedia-DVD</title>
		<link>http://wikipedistik.de/2006/12/07/hoher-bedarf-an-der-wikipedia-dvd/</link>
		<comments>http://wikipedistik.de/2006/12/07/hoher-bedarf-an-der-wikipedia-dvd/#comments</comments>
		<pubDate>Thu, 07 Dec 2006 14:33:49 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Wikipedia-News]]></category>
		<category><![CDATA[DVD]]></category>
		<category><![CDATA[Leon Weber]]></category>
		<category><![CDATA[Manuel Schneider]]></category>
		<category><![CDATA[Michael Diederich]]></category>
		<category><![CDATA[Mirror]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Torrent]]></category>
		<category><![CDATA[Traffic]]></category>
		<category><![CDATA[Wikipedia]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/12/07/hoher-bedarf-an-der-wikipedia-dvd/</guid>
		<description><![CDATA[<p>Gestern kurz nach 12:00 Uhr habe ich die <a href="http://de.wikipedia.org/wiki/Wikipedia:DVD/Download" rel="nofollow" class="liwikipedia">Download-Seite</a> der <a href="http://wikipedistik.de/2006/12/06/wikipedia-dvd-20062007/" class="liinternal">Wikipedia-DVD</a> mit den aktuellen Daten der Wikipedia-DVD bestückt. Etwas mehr als 24 Stunden später ist ein guter Zeitpunkt um mal zu schauen, wie denn der Bedarf an der Wikipedia-DVD aussieht. Man darf guten Gewissens sagen, dass die Verteilung dieses mal deutlich besser geklappt hat als in der Vergangenheit.</p>
<p><!--more--></p>
<p>Insgesamt haben wir mit etwa 35 potentiellen Mirror-Betreibern Kontakt aufgenommen und an ~15 davon im Vorfeld über einen Distributionsserver die DVD-Dateien per HTTP, FTP, rsync und BitTorrent verteilt. <a href="http://de.wikipedia.org/wiki/Benutzer:80686" rel="nofollow" class="liwikipedia">Manuel Schneider</a> hatte über verschiedene Fachlisten (GUUG, Linux-Verband, WilhelmTux, PingoS&#8230;) angefragt und ich die ehemaligen Mirror-Betreiber und einige weitere &#8220;typische&#8221; Mirror-Anbieter angeschrieben.</p>
<p>Der Zähler der FTP- und HTTP-Downloads, die über das Download-Rotations-Skript von Manuel gestartet wurden, liegt momentan bei 35.000. Dazu muss man sagen, dass vermutlich nicht alle Downloads auf Nutzerseite bis zum Ende durchgeführt wurden.</p>
<p>Zum Gebrauch der DVD benötigt man zwingend die Basisdatei <tt>wikipedia.zeno</tt>. Dieser Download wurde 10.000 mal gestartet. Von den Mirrors haben wir gehört, dass sie ordentlich ausgelastet sind:</p>
<blockquote><p>Perfekt. Wir schieben z.Z. 50MBit/s raus mit der DVD.</p></blockquote>
<blockquote><p>Also läuft wunderbar mit dem download, seitdem es in den heise news war hab ich durchgänig ca 180-250 Mbit outgoing und 250 user. Wollte euch nur mal einen kurzen überblick geben.</p></blockquote>
<p>Aufgrund der geringen Anzahl an HTTP-Mirrorn (wir stocken gerade noch um einen weiteren auf: <em>&#8220;Der Mirror sind zwei redundante SunServer, mit RAID und einer schnellen Anbindung (2x 2,4GB / 100BaseT) direkt im Rechenzentrum.&#8221;</em>) waren diese auch schon mal platt &#8211; <a href="http://de.wikipedia.org/wiki/Benutzer:MichaelDiederich" rel="nofollow" class="liwikipedia">Michael Diederich</a>, der einen davon anbietet, kann davon ein Liedchen singen.</p>
<p>An der <acronym title="Peer To Peer">P2P</acronym>-Front sieht es auch ganz gut aus. Wir hatten vorab dafür gesorgt, dass ~10 komplette Seeds zur Verfügung standen &#8211; dies hat den Einfall der Sauger-Horden nach der Veröffentlichung bei <a href="http://www.heise.de/newsticker/meldung/82123" class="liexternal">Heise</a> und <a href="http://golem.de/0612/49328.html" class="liexternal">Golem</a> etwas abgefangen. Momentan haben wir 150 Peers (=Rechner die downloaden) und 36 Seeds (=Rechner, die 100% der Dateien anbieten). Diese Nacht waren es über 550 Peers und 45 Seeds. Die .torrent-Datei wurde 3.700 mal downgeloaded.</p>
<p>Alleine der Distributionsserver hat mehr als 100 GB Traffic erzeugt. Michael hat per BT über 200 GB geseeded und noch mal deutlich mehr per HTTP verteilt.</p>
<p>Ein paar schöne Bildchen können dank Leon Weber hier bestaunt werden:<br />
<a href="http://vserver152.masterssystems.com/graphs/dvd/dvd-daily.png" class="liexternal">DVD-Verteilung (Tag)</a><br />
<a href="http://vserver152.masterssystems.com/graphs/dvd/dvd-hourly.png" class="liexternal">DVD-Verteilung (Stunde)</a></p>
<p>Und Webzugriffs-Statistiken finden sich <a href="http://statistik.mastersadmin.com/awstats.pl?config=u00008" class="liexternal">hier</a>.</p>
<p>Soviel der Zahlenspielerei, in ein paar Tagen noch mal mehr dazu&#8230;</p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/12/07/hoher-bedarf-an-der-wikipedia-dvd/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
		<item>
		<title>Israel, Libanon, Sex und die Tour de France &#8211; Die beliebtesten Seiten in der deutschsprachigen Wikipedia</title>
		<link>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/</link>
		<comments>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/#comments</comments>
		<pubDate>Fri, 28 Jul 2006 19:49:52 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Wikipedia-News]]></category>
		<category><![CDATA[Wissenschaftliches]]></category>
		<category><![CDATA[Alexa]]></category>
		<category><![CDATA[Counter]]></category>
		<category><![CDATA[Infrastruktur]]></category>
		<category><![CDATA[Leon Weber]]></category>
		<category><![CDATA[Proxy]]></category>
		<category><![CDATA[Server]]></category>
		<category><![CDATA[Squid]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Toolserver]]></category>
		<category><![CDATA[Traffic]]></category>
		<category><![CDATA[Wikipedia]]></category>
		<category><![CDATA[Wikipedistik]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/</guid>
		<description><![CDATA[<p>Der 19. Oktober 2004 gilt als schwärzester Tag für alle Wikipedia-Forscher. Das ist zwar etwas pathetisch formuliert, trifft es aber ziemlich genau. An diesem Datum &#8211; vor genau 647 Tagen &#8211; wurde aufgrund der verursachten Serverlast der in der WikiMedia-Software implementierte Aufrufzähler pro Artikel deaktiviert.</p>
<p>Seitdem ist es nicht mehr auf einfache Weise möglich herauszufinden, welche Artikel bei den Wikipedia-Nutzern besonders beliebt sind (genauer: besonders häufig aufgerufen werden).</p>
<p>Grundsätzlich muss man sich im klaren darüber sein, dass die auf diese Art erhobenen Zahlen nicht korrekt wären &#8211; sie könnten nur einen Anhaltspunkt liefern. Seit ihrem Start im Januar 2001 ist die <a href="http://wikipedia.org/" rel="nofollow" class="liwikipedia">Wikipedia</a> von einer kleinen unbekannte Webseite nach Angaben von <a href="http://www.alexa.com/" class="liexternal">Alexa</a> in die Top20-Webseiten weltweit aufgestiegen &#8211; in Deutschland gehört sie zu den Top5-Webseiten.</p>
<p>Dies führt dazu, dass es nicht mehr möglich ist, das Webangebot auf einem &#8220;einfachen Server&#8221; zu hosten. Die <a href="http://de.wikipedia.org/wiki/Wikipedia:Server" rel="nofollow" class="liwikipedia">Infrastruktur</a> ist momentan auf mehr als 240 Server verteilt, die über vier Standorte auf drei Kontinenten verteilt sind. Der Kauf von <a href="http://wikimediafoundation.org/wiki/Resolution:Hardware_Purchase_Jul-06" class="liexternal">20 weiteren Servern</a> wurde von der Wikimedia Foundation gerade beschlossen.</p>
<p>Dies ist einer der weltweit größten Server-Cluster, der komplett mit <a href="http://de.wikipedia.org/wiki/Freie_Software" rel="nofollow" class="liwikipedia">Freier Software</a> betrieben wird und vermutlich der einzige, der fast ausschliesslich von etwa einem Dutzend ehrenamtlicher Administratoren aus aller Welt &#8211; USA, Australien, Großbritannien, Deutschland, Island, Frankreich und Litauen &#8211; betreut wird.</p>
<div class="caption center"><a href="http://de.wikipedia.org/wiki/Bild:Wikimedia_server.jpg" class="imagelink" title="Weltkarte: Wikimedia-Server" rel="nofollow"><img id="image136" src="http://wikipedistik.de/wp-content/uploads/2006/07/Wikimedia_server-klein.jpg" alt="Weltkarte: Wikimedia-Server" /></a><br />Weltkarte: Wikimedia-Server (ohne Frankreich)<br />Autor: Sansculotte / Lizenz: CC-BY-SA</div>
<p><!--more--><br />
Zu Spitzenzeiten verzeichnet die Wikipedia 16.000 Zugriffe pro Sekunde (!). Würden diese alle direkt auf die 12 Datenbank-Server durchgereicht, käme es aufgrund der Überlast unweigerlich zu einem <a href="http://de.wikipedia.org/wiki/Denial_of_Service" rel="nofollow" class="liwikipedia">Denial of Service</a> &#8211; die Wikipedia würde nicht mehr antworten.</p>
<p>Die Lösung besteht darin, häufige und wiederholte Anfragen in großen <a href="http://de.wikipedia.org/wiki/Proxy" rel="nofollow" class="liwikipedia">Proxy-Caches</a> (Zwischenspeichern) &#8211; den <a href="http://de.wikipedia.org/wiki/Squid" rel="nofollow" class="liwikipedia">Squids</a> &#8211; vorzuhalten und diese nicht an die Apache-Webserver oder die Datenbank-Server weiterzuleiten.Ein Großteil der Seitenabrufe nicht-angemeldeter Benutzer wird von den Squids bedient: Momentan liegt die &#8220;hit-rate&#8221; (eine Anfrage wird aus dem Cache bedient) bei etwa 75 Prozent. Besonders bei Ereignissen wie z.B. der Fussball-Weltmeisterschaft bringen die Squids eine enorme Lasterleichterung.</p>
<p>Hier sieht man aber gleich das nächste große Problem, wenn man Zugriffsstatistiken erfassen möchte &#8211; da die durch die Proxy-Server bedienten Abfragen gar nicht mehr bis zur Datenbank durchkommen, können Sie auch einen dort aktiven Artikelzugriffszähler nicht erhöhen.</p>
<p>Eine Möglichkeit wäre nun, zusätzlich auf den Squids Abfragestatistiken zu erfassen und diese über die Gesamtzahl der Rechner zu aggregieren. Auch dies ist aus Performance-Gründen keine Option.</p>
<p>Eine clevere Idee &#8211; wenn auch inspiriert durch die russischsprachige Wikipedia &#8211; hat vor zwei Wochen <a href="http://de.wikipedia.org/wiki/Benutzer:LeonWeber" rel="nofollow" class="liwikipedia">Leon Weber</a> umgesetzt. Sein Tool <a href="http://de.wikipedia.org/wiki/Benutzer:LeonWeber/WikiCharts" rel="nofollow" class="liwikipedia">WikiCharts</a> ist seit heute allgemein zugänglich. Eine Ankündigung und Diskussion findet sich <a href="http://thread.gmane.org/gmane.science.linguistics.wikipedia.deutsch/19600/focus=19600" class="liexternal">in der Mailingliste</a> der deutschsprachigen Wikipedia.</p>
<p>Durch eine Ergänzung der für alle Benutzer verwendete JavaScript-Vorlage um einen <a href="http://de.wikipedia.org/wiki/MediaWiki:Pagecounter.js" rel="nofollow" class="liwikipedia">Pagecounter-Teil</a> wird der Name des aufgerufenen Artikels (das Lemma) an den <a href="http://tools.wikimedia.de/" class="liexternal">Toolserver</a> übergeben und dort gespeichert. Diese Vorgehensweise belastet die Wikimedia-Server kaum und berücksichtigt fast alle Artikelaufrufe &#8211; auch solche, die durch die Squids bedient werden.</p>
<p>Um eine Überlastung des Toolservers zu vermeiden wird nicht jeder einzelne Artikelaufruf gelogged, sondern nur jeder 750ste. Nach zwei Wochen kann man sich nun erste Ergebnisse der <a href="http://tools.wikimedia.de/~leon/stats/wikicharts/" class="liexternal">Top 100</a> aufgerufenen Artikel ansehen.</p>
<p>Leider löst das Tool von Leon immer noch nicht das Problem, zu einem gegebenen Artikel eine ungefähre Schätzung der Aufrufe zu bekommen, wenn sich dieser nicht in den Top 100 befindet.<br />
<img src="http://vg02.met.vgwort.de/na/e56ed8940f229b847b1b87dc6edddc" width="1" height="1" alt=""/></p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
		<item>
		<title>Enzyklopädie &#8211; Fußball 0:1</title>
		<link>http://wikipedistik.de/2006/07/01/enzyklopaedie-fussball-01/</link>
		<comments>http://wikipedistik.de/2006/07/01/enzyklopaedie-fussball-01/#comments</comments>
		<pubDate>Sat, 01 Jul 2006 07:19:19 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Wikipedia-News]]></category>
		<category><![CDATA[Fußball]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Traffic]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/07/01/enzyklopaedie-fussball-01/</guid>
		<description><![CDATA[<p>Gestern im Viertelfinale der <a href="http://de.wikipedia.org/wiki/Fu%C3%9Fball-Weltmeisterschaft_2006" rel="nofollow" class="liwikipedia">Fußball-Weltmeisterschaft 2006</a> (Deutschland &#8211; <strike>Ecuador</strike>Argentinien) konnte man schön etwas beobachten, was bereits in geringerem Ausmaße seit den Vorrunden-Spielen in den Statistiken abzulesen ist: Wenn die Straßen sich leeren, leeren sich auch die Computerbildschirme.</p>
<p>Die folgende Grafik zeigt gestrige Anfragen an die Wikipedia in bits/s (die Zeiteinteilung ist UTC &#8211; man muss also zwei Stunden addieren):</p>
<div align="center"><img id="image117" src="http://wikipedistik.de/wp-content/uploads/2006/07/wp-req-viertelfinale.png" alt="Zugriffsstatistik Wikipedia 30.06.2006" /></div>
<p><!--more--><br />
Gelb dargestellt ist der YASEO-Cluster &#8211; das sind die Rechner von Yahoo! in Seoul. Grün sind die Rechner von KennisNet in Amsterdam und blau die Rechner von Powermedium in Tampa, Florida.</p>
<p>Während die Amis weniger interessiert sind, fällt der Traffic zum Anstoss sowohl in Asien, als auch in Europa um 100 MBit/s ab.</p>
<p>Im folgenden Bild sind noch einmal explizit 1) Anstoss, 2) Beginn 2. Halbzeit und 3) Elfmeterschießen eingezeichnet:</p>
<div align="center"><a href="http://wikipedistik.de/2006/07/01/enzyklopaedie-fussball-01/detailansicht-zugriffsstatistik/" id="p118" rel="attachment" class="imagelink" title="Detailansicht Zugriffsstatistik"><img id="image118" src="http://wikipedistik.de/wp-content/uploads/2006/07/wp-req-detail.png" alt="Detailansicht Zugriffsstatistik" /></a></div>
<p>Schön zu beobachten ist auch der Anstieg in der Halbzeit.</p>
<p><small>(<a href="http://fx3.org/blog/2006/07/01/wm-ist-11/" class="liexternal">Olaf</a> bloggt einfach schneller als ich.)</small></p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/07/01/enzyklopaedie-fussball-01/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
	</channel>
</rss>
