<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule"
>

<channel>
	<title>Wikipedistik &#187; Alexa</title>
	<atom:link href="http://wikipedistik.de/tag/alexa/feed/" rel="self" type="application/rss+xml" />
	<link>http://wikipedistik.de</link>
	<description>Nutzung von Wikis als Wissensmanagement unterstützende Systeme in Unternehmen</description>
	<lastBuildDate>Thu, 02 Jun 2011 21:06:26 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
		<item>
		<title>Israel, Libanon, Sex und die Tour de France &#8211; Die beliebtesten Seiten in der deutschsprachigen Wikipedia</title>
		<link>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/</link>
		<comments>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/#comments</comments>
		<pubDate>Fri, 28 Jul 2006 19:49:52 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Wikipedia-News]]></category>
		<category><![CDATA[Wissenschaftliches]]></category>
		<category><![CDATA[Alexa]]></category>
		<category><![CDATA[Counter]]></category>
		<category><![CDATA[Infrastruktur]]></category>
		<category><![CDATA[Leon Weber]]></category>
		<category><![CDATA[Proxy]]></category>
		<category><![CDATA[Server]]></category>
		<category><![CDATA[Squid]]></category>
		<category><![CDATA[Statistik]]></category>
		<category><![CDATA[Toolserver]]></category>
		<category><![CDATA[Traffic]]></category>
		<category><![CDATA[Wikipedia]]></category>
		<category><![CDATA[Wikipedistik]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/</guid>
		<description><![CDATA[<p>Der 19. Oktober 2004 gilt als schwärzester Tag für alle Wikipedia-Forscher. Das ist zwar etwas pathetisch formuliert, trifft es aber ziemlich genau. An diesem Datum &#8211; vor genau 647 Tagen &#8211; wurde aufgrund der verursachten Serverlast der in der WikiMedia-Software implementierte Aufrufzähler pro Artikel deaktiviert.</p>
<p>Seitdem ist es nicht mehr auf einfache Weise möglich herauszufinden, welche Artikel bei den Wikipedia-Nutzern besonders beliebt sind (genauer: besonders häufig aufgerufen werden).</p>
<p>Grundsätzlich muss man sich im klaren darüber sein, dass die auf diese Art erhobenen Zahlen nicht korrekt wären &#8211; sie könnten nur einen Anhaltspunkt liefern. Seit ihrem Start im Januar 2001 ist die <a href="http://wikipedia.org/" rel="nofollow" class="liwikipedia">Wikipedia</a> von einer kleinen unbekannte Webseite nach Angaben von <a href="http://www.alexa.com/" class="liexternal">Alexa</a> in die Top20-Webseiten weltweit aufgestiegen &#8211; in Deutschland gehört sie zu den Top5-Webseiten.</p>
<p>Dies führt dazu, dass es nicht mehr möglich ist, das Webangebot auf einem &#8220;einfachen Server&#8221; zu hosten. Die <a href="http://de.wikipedia.org/wiki/Wikipedia:Server" rel="nofollow" class="liwikipedia">Infrastruktur</a> ist momentan auf mehr als 240 Server verteilt, die über vier Standorte auf drei Kontinenten verteilt sind. Der Kauf von <a href="http://wikimediafoundation.org/wiki/Resolution:Hardware_Purchase_Jul-06" class="liexternal">20 weiteren Servern</a> wurde von der Wikimedia Foundation gerade beschlossen.</p>
<p>Dies ist einer der weltweit größten Server-Cluster, der komplett mit <a href="http://de.wikipedia.org/wiki/Freie_Software" rel="nofollow" class="liwikipedia">Freier Software</a> betrieben wird und vermutlich der einzige, der fast ausschliesslich von etwa einem Dutzend ehrenamtlicher Administratoren aus aller Welt &#8211; USA, Australien, Großbritannien, Deutschland, Island, Frankreich und Litauen &#8211; betreut wird.</p>
<div class="caption center"><a href="http://de.wikipedia.org/wiki/Bild:Wikimedia_server.jpg" class="imagelink" title="Weltkarte: Wikimedia-Server" rel="nofollow"><img id="image136" src="http://wikipedistik.de/wp-content/uploads/2006/07/Wikimedia_server-klein.jpg" alt="Weltkarte: Wikimedia-Server" /></a><br />Weltkarte: Wikimedia-Server (ohne Frankreich)<br />Autor: Sansculotte / Lizenz: CC-BY-SA</div>
<p><!--more--><br />
Zu Spitzenzeiten verzeichnet die Wikipedia 16.000 Zugriffe pro Sekunde (!). Würden diese alle direkt auf die 12 Datenbank-Server durchgereicht, käme es aufgrund der Überlast unweigerlich zu einem <a href="http://de.wikipedia.org/wiki/Denial_of_Service" rel="nofollow" class="liwikipedia">Denial of Service</a> &#8211; die Wikipedia würde nicht mehr antworten.</p>
<p>Die Lösung besteht darin, häufige und wiederholte Anfragen in großen <a href="http://de.wikipedia.org/wiki/Proxy" rel="nofollow" class="liwikipedia">Proxy-Caches</a> (Zwischenspeichern) &#8211; den <a href="http://de.wikipedia.org/wiki/Squid" rel="nofollow" class="liwikipedia">Squids</a> &#8211; vorzuhalten und diese nicht an die Apache-Webserver oder die Datenbank-Server weiterzuleiten.Ein Großteil der Seitenabrufe nicht-angemeldeter Benutzer wird von den Squids bedient: Momentan liegt die &#8220;hit-rate&#8221; (eine Anfrage wird aus dem Cache bedient) bei etwa 75 Prozent. Besonders bei Ereignissen wie z.B. der Fussball-Weltmeisterschaft bringen die Squids eine enorme Lasterleichterung.</p>
<p>Hier sieht man aber gleich das nächste große Problem, wenn man Zugriffsstatistiken erfassen möchte &#8211; da die durch die Proxy-Server bedienten Abfragen gar nicht mehr bis zur Datenbank durchkommen, können Sie auch einen dort aktiven Artikelzugriffszähler nicht erhöhen.</p>
<p>Eine Möglichkeit wäre nun, zusätzlich auf den Squids Abfragestatistiken zu erfassen und diese über die Gesamtzahl der Rechner zu aggregieren. Auch dies ist aus Performance-Gründen keine Option.</p>
<p>Eine clevere Idee &#8211; wenn auch inspiriert durch die russischsprachige Wikipedia &#8211; hat vor zwei Wochen <a href="http://de.wikipedia.org/wiki/Benutzer:LeonWeber" rel="nofollow" class="liwikipedia">Leon Weber</a> umgesetzt. Sein Tool <a href="http://de.wikipedia.org/wiki/Benutzer:LeonWeber/WikiCharts" rel="nofollow" class="liwikipedia">WikiCharts</a> ist seit heute allgemein zugänglich. Eine Ankündigung und Diskussion findet sich <a href="http://thread.gmane.org/gmane.science.linguistics.wikipedia.deutsch/19600/focus=19600" class="liexternal">in der Mailingliste</a> der deutschsprachigen Wikipedia.</p>
<p>Durch eine Ergänzung der für alle Benutzer verwendete JavaScript-Vorlage um einen <a href="http://de.wikipedia.org/wiki/MediaWiki:Pagecounter.js" rel="nofollow" class="liwikipedia">Pagecounter-Teil</a> wird der Name des aufgerufenen Artikels (das Lemma) an den <a href="http://tools.wikimedia.de/" class="liexternal">Toolserver</a> übergeben und dort gespeichert. Diese Vorgehensweise belastet die Wikimedia-Server kaum und berücksichtigt fast alle Artikelaufrufe &#8211; auch solche, die durch die Squids bedient werden.</p>
<p>Um eine Überlastung des Toolservers zu vermeiden wird nicht jeder einzelne Artikelaufruf gelogged, sondern nur jeder 750ste. Nach zwei Wochen kann man sich nun erste Ergebnisse der <a href="http://tools.wikimedia.de/~leon/stats/wikicharts/" class="liexternal">Top 100</a> aufgerufenen Artikel ansehen.</p>
<p>Leider löst das Tool von Leon immer noch nicht das Problem, zu einem gegebenen Artikel eine ungefähre Schätzung der Aufrufe zu bekommen, wenn sich dieser nicht in den Top 100 befindet.<br />
<img src="http://vg02.met.vgwort.de/na/e56ed8940f229b847b1b87dc6edddc" width="1" height="1" alt=""/></p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/07/28/israel-libanon-sex-und-die-tour-de-france-die-beliebtesten-seiten-in-der-deutschsprachigen-wikipedia/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
	</channel>
</rss>

