Nachdem nach längerer Zeit endlich im Mai ein neuer Dump zur Verfügung stand, aus dem Eric Zachte seine informativen Statistiken updaten konnte (Stand: 10. Mai) fragte Anfang Juni Wikipedia-Gründer Jimbo Wales auf mehreren Mailinglisten nach einigen Statistiken, die er gerne hätte um einige Behauptungen die im Raum stehen zu verifizieren, falsifizieren bzw. die zugrundeliegenden Daten auf jeden Fall zu quantifizieren.
For years now, it has been common for people to claim that “all the good editors are jumping ship” or “we are losing our best people”. Generally, this has not proven to be true: people come and go, to bes ure, but as some people drift away, others have drifted in. Whether the rate of burnout is “too high” or “too low” or “just right” is quite hard to say.
Die Fragen, die er im Einzelnen stellte, waren:
I would be fascinated if we could figure out such statistics as “For any given edit, what is the average length of service of the editor?” “For any given edit, what is the median length of service of the editor?” These could be measured by either time since first edit, or total number of edits or (perhaps best) some weighted average of the edit history.
It would be nice to track that number over time… are we becoming “younger” as a community, “older” as a community? Staying about the same? Are old-timers sticking around longer than they used to, or jumping ship faster?
Diese Fragestellung wurde zunächst auf die zwei folgenden Hauptfragen heruntergebrochen:
Steve Bennett schlug vor dies zu messen, indem man den Prozentsatz der Wikipedianer betrachtet, die in den letzten zwei Monaten aktiv waren und die im aktuellen Monat mehr Bearbeitungen durchgeführt haben, als im vorherigen. Diese Daten kann man aus der RecentChanges-Tabelle (“Letzte Änderungen”) auslesen.
Der Entwickler Tim Starling hat genau dies für die englischsprachige Wikipedia gemacht und im Meta-Wiki den Artikel “Days since first edit” gestartet. Aus seinen Daten hat Jakob Voss ein anschauliches Diagramm der durchschnittlichen Beitragsanzahl der Autoren in Relation zu ihrer “Beschäftigungsdauer” erstellt:

Ergebnis: Die Bearbeitungen im Bezug zur Anmeldedauer des Benutzers sind klar logarithmisch verteilt. Dadurch wird zwar bestätigt, dass der größte Teil der Arbeit von einem “harten Kern” von Benutzern erstellt wird, aber gleichzeitig kann man den Daten entnehmen, dass der Beitrag von neuen Benutzern höher ist, als von vielen erwartet. Jakob schreibt:
I was really suprised to see that around a quarter of all edits are by “newbies” that have done their first edit less than 100 days ago.
16. Juni 2006 um 07:49 Uhr
Ich bin jetzt nicht ins Detail in die “Days since first edit” Geschichte eingestiegen. Doch scheint mir die Methodik von einer recht fragwürdigen Annahme auszugehn (“If you assume that each contributor makes one edit per timestep).
Vor allem aber sagt das ganze aber nur aus, dass Autoren am Anfang ihrer Laufbahn recht aktiv in der *Anzahl* ihrer Bearbeitungen sind und dann irgendwann die Lust verlieren. Es sagt absolut nichts aus über die *Menge des Inhaltes*, den sie beisteuern. Hier wird schon wieder der Fehler begangen, Anzahl von Edits mit inhaltlicher Erweiterung gleichzusetzen.
Uli