<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:creativeCommons="http://backend.userland.com/creativeCommonsRssModule"
>

<channel>
	<title>Wikipedistik &#187; Spam</title>
	<atom:link href="http://wikipedistik.de/tag/spam/feed/" rel="self" type="application/rss+xml" />
	<link>http://wikipedistik.de</link>
	<description>Nutzung von Wikis als Wissensmanagement unterstützende Systeme in Unternehmen</description>
	<lastBuildDate>Thu, 02 Jun 2011 21:06:26 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.3</generator>
<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
		<item>
		<title>Graue Listen gegen Spam</title>
		<link>http://wikipedistik.de/2008/03/25/graue-listen-gegen-spam/</link>
		<comments>http://wikipedistik.de/2008/03/25/graue-listen-gegen-spam/#comments</comments>
		<pubDate>Tue, 25 Mar 2008 02:44:15 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Offtopic]]></category>
		<category><![CDATA[E-Mail]]></category>
		<category><![CDATA[Graylisting]]></category>
		<category><![CDATA[Greylisting]]></category>
		<category><![CDATA[Ham]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[SpamAssassin]]></category>
		<category><![CDATA[Statistik]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2008/03/25/graue-listen-gegen-spam/</guid>
		<description><![CDATA[<div class="caption right"><img src='http://wikipedistik.de/wp-content/uploads/2008/03/spam-small.png' alt='Spam is evil' /></div>
<p>Das <a href="http://de.wikipedia.org/wiki/Spam" rel="nofollow" class="liwikipedia">Spam</a>-Problem hat in den letzten Monaten bei mir etwas überhand genommen. Der Großteil der Mails, die an eine meiner Domains gesendet werden, landen auf einem gemeinsamen Server und wurden bisher ausschließlich <a href="http://spamassassin.apache.org/" class="liexternal">SpamAssassin</a> vorgeworfen.</p>
<p>Der Assassine leistet hervorragende Arbeit. Um Spam (= unerwünschte Mail) von Ham (= erwünschte Mail) zu unterscheiden, führt er eine Reihe von Tests durch:</p>
<ul>
<li>Prüfung der Mails auf statistische Spam-Merkmale (z.B. &#8220;Absender aus Korea&#8221;, &#8220;Mail nur in GROSSBUCHSTABEN&#8221;, &#8230;)</li>
<li>Abfrage von <a href="http://de.wikipedia.org/wiki/Realtime_Blackhole_List" rel="nofollow" class="liwikipedia">RBLs und DNSBLs</a></li>
<li>Abfrage von Prüfsummen-basierten Filter-Diensten</li>
<li><a href="http://de.wikipedia.org/wiki/Bayesscher_Filter" rel="nofollow" class="liwikipedia">Bayes-Filterung</a></li>
</ul>
<p>Das Problem: Die Durchführung dieser Tests ist ressourcen-intensiv. Neben einer Menge Hauptspeicher belegt die Spam-Filterung zusätzlich CPU-Arbeitszeit und die Abfragen an netzbasierte Dienste summieren sich auch.</p>
<p>Schaut man sich einmal das Aufkommen von meiner Mail der letzten Monate an&#8230;</p>
<div class="caption center"><img src='http://wikipedistik.de/wp-content/uploads/2008/03/mailaufkommen-small.png' alt='Mailaufkommen 2007/2008' /><br />Mailaufkommen (Größter Teil meiner Mailadressen) 2007/2008</div>
<p>&#8230;so sieht man, dass die Situation wohl eher nicht besser wird.</p>
<p><!--more-->Neben dem Problem der Ressourcen-Auslastung (das z.B. dazu führt, dass die Webseiten auf dem Server &#8211; unter anderem Wikipedistik &#8211; langsamer ausgeliefert werden) kommt noch dazu, dass die Anzahl der <em>false negatives</em> steigt. Unter &#8220;false negative&#8221; versteht man Mails, die Spam sind, aber nicht als solcher erkannt werden. Diese Nachrichten verstopfen die Inbox und verursachen Aufwand, da sie von Hand gelöscht werden müssen.</p>
<p>SpamAssassin ist gut &#8211; aber kein Spamfilter hat eine Erkennungsrate von 100 Prozent. Daraus folgt: Je mehr Mails durch den Filter gehen, desto mehr Problemfälle treten auf. Dank sinnvoller Einstellung gibt es bei mir jedoch so gut wie keine <em>false positives</em>, also Mails, die erwünschte Mails darstellen, aber als Spam erkannt wurden. Der Preis für eine geringere Wahrscheinlichkeit an &#8220;false positives&#8221; ist jedoch eine höhere Wahrscheinlichkeit für &#8220;false negatives&#8221;.</p>
<p>Die einfachste Lösung um die Anzahl an Fehleinordnungen wieder zu senken ist einleuchtend: Die Anzahl der von SpamAssassin zu bearbeitenden Mails muss gesenkt werden. Dies führt dann zusätzlich zu einem weniger ausgelasteten, performanteren System.</p>
<p><strong>Greylisting</strong><br />
Aus diesem Grund habe ich am Karfreitag um 7:00 Uhr auf meinem Mailserver <a href="http://de.wikipedia.org/wiki/Greylisting" rel="nofollow" class="liwikipedia">Greylisting</a> aktiviert.</p>
<p><em>Whitelisting</em> bedeutet, dass Mail nach bestimmten Kriterien immer angenommen wird, während beim <em>Blacklisting</em> die Mail immer abgelehnt wird. <em>Greylisting</em> nutzt hingegen eine Besonderheit des SMTP-Protokolls: Kann eine Mail nicht zugestellt werden, so versucht es der entsprechende Server nach einer gewissen Zeitspanne erneut.</p>
<p>Während diese Funktionalität in jedem vernünftigem Mailsystem umgesetzt ist, so gilt dies nicht für eine Vielzahl von Spam-Software, die wesentlich einfacher gestrickt ist und in der Regel nur einen Zustellversuch macht.</p>
<p>Kontaktiert ein einlieferndes System meinen Mailserver, so gibt es folgende Daten an:</p>
<ul>
<li>IP-Adresse des absendenden Mailservers</li>
<li>E-Mail-Adresse des E-Mail-Senders</li>
<li>E-Mail-Adresse des E-Mail-Empfängers</li>
</ul>
<p>Wurde noch nie Mail empfangen, auf die dieses Trippel zutrifft, so wird die Maileinlieferung mit einem temporären Fehler quittiert. Ein herkömmliches Mailsystem versucht dann nach einer kurzen Zeitspanne eine erneute Einlieferung, die dann akzeptiert wird. Bei der Vielzahl von einmaligen Zustellversuchen von Spam führt dies dazu, dass die betreffende Mail gar nicht erst in meinem System landet und demnach auch nicht von SpamAssassin untersucht werden muss.</p>
<p>Systeme, die in der Greylist gelandet sind und danach eine erfolgreiche Zustellung durchführen, werden automatisch in die Whiltelist aufgenommen. So tritt der Nachteil der nicht unmittelbar ankommenden Mail nur beim ersten Kontakt mit einem bisher unbekannten Trippel auf. Trotzdem muss natürlich dieser Nachteil mit einem möglichen Vorteil abgewogen werden.</p>
<p>Wie meine Abwägung ausfällt?<br />
Das muss ich glaube ich nicht extra in Worten beschreiben.</p>
<p>Die folgenden Graphen sprechen für sich:</p>
<div class="caption center"><img src='http://wikipedistik.de/wp-content/uploads/2008/03/angenommene-mails.png' alt='Angenommene (und verarbeitete) Mails' /><br />Angenommene (und verarbeitete) Mails &#8211; Massiver Rückgang seit Freitag, 7:00 Uhr</div>
<div class="caption center"><img src='http://wikipedistik.de/wp-content/uploads/2008/03/abgelehnte-mails.png' alt='(Durch Greylisting) abgelehnte Mails' /><br />(Durch Greylisting) abgelehnte Mails &#8211; Aktivierung ab Freitag, 7:00 Uhr</div>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2008/03/25/graue-listen-gegen-spam/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
		<item>
		<title>Meilensteine 3/3: Spam</title>
		<link>http://wikipedistik.de/2006/11/26/meilensteine-33-spam/</link>
		<comments>http://wikipedistik.de/2006/11/26/meilensteine-33-spam/#comments</comments>
		<pubDate>Sun, 26 Nov 2006 07:19:47 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Akismet]]></category>
		<category><![CDATA[Robert Basic]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Wikipedistik]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/11/26/meilensteine-33-spam/</guid>
		<description><![CDATA[<p>Der <a href="http://wikipedistik.de/2006/01/02/first-post/" class="liinternal">erste Eintrag</a> in Wikipedistik stammt vom 2. Januar 2006.</p>
<p>Seit diesem Zeitpunkt sind immerhin <em>95 Beiträge</em> und <em>192 Kommentare</em> in diesem Blog erstellt worden. Etwas erschreckend ist es allerdings, wenn man sich anschaut, wieviele Kommentare <em>nicht</em> veröffentlicht wurden: Gestern habe ich den <strong>50.000sten Kommentar-Spam</strong> gelöscht.<br />
<!--nevermore--><br />
Ebenso wie Spam den E-Mail-Dienst belastet, belastet er auch Blogs. Spammer wollen entweder ihre Nachricht per Kommentar loswerden, oder einen Link auf ihr Angebot unterbringen. Da das Spamproblem schon bei einem relativ kleinem Nischenblog wie meinem solche Ausmaße annimmt, kann man sich in etwa vorstellen, welche Dimensionen das bei bekannten Blogs erreicht.</p>
<p><a href="http://www.basicthinking.de/blog/2006/06/26/spam-stats-und-gegenmassnahmen/" class="liexternal">Robert Basic</a> sammelt auch schonmal 10.000 Spam-Einträge innerhalb von nicht ganz zwei Wochen. Ohne eine zusätzliche Filtersoftware (ich benutze dazu <a href="http://akismet.com/" class="liexternal">Akismet</a>) scheint es für Blogs nicht mehr möglich, eine Kommentarfunktion anzubieten.</p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/11/26/meilensteine-33-spam/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
		<item>
		<title>Herzlichen Glückwunsch, Spiegel-Online!</title>
		<link>http://wikipedistik.de/2006/11/01/herzlichen-glueckwunsch-spiegel-online/</link>
		<comments>http://wikipedistik.de/2006/11/01/herzlichen-glueckwunsch-spiegel-online/#comments</comments>
		<pubDate>Wed, 01 Nov 2006 20:33:55 +0000</pubDate>
		<dc:creator>Tim Bartel</dc:creator>
				<category><![CDATA[Wikipedia-News]]></category>
		<category><![CDATA[Fehler]]></category>
		<category><![CDATA[Felix Knoke]]></category>
		<category><![CDATA[Giesbert Damaschke]]></category>
		<category><![CDATA[Kritik]]></category>
		<category><![CDATA[Malware]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Spiegel Online]]></category>
		<category><![CDATA[SpOn]]></category>
		<category><![CDATA[Tomorrow]]></category>
		<category><![CDATA[Wau Holland]]></category>
		<category><![CDATA[Wikipedia]]></category>

		<guid isPermaLink="false">http://wikipedistik.de/2006/11/01/herzlichen-glueckwunsch-spiegel-online/</guid>
		<description><![CDATA[<p>In der <a href="http://de.wikipedia.org/wiki/Demoszene" rel="nofollow" class="liwikipedia">Demoszene </a> wetteifern Coder in Intro-Competitions darum, möglichst beeindruckende Effekte in nur 4 Kilobyte große Binärdateien zu packen. Halbleiterhersteller konkurrieren darum, wer die meisten Transistoren auf einem <a href="http://de.wikipedia.org/wiki/Die_%28Halbleitertechnik%29" rel="nofollow" class="liwikipedia">Die</a> unterbringen kann. Und für das Guinness-Buch der Rekorde knubbeln sich auch schon mal über 30 Personen in und auf einen VW-Käfer.</p>
<p>Eine Reihe von Journalisten hingegen versucht sich im Wettkampf untereinander mit einer enorm hohen Fehlerdichte pro Kurztext zu profilieren. Den Klassiker in dieser Disziplin stellte die unvergessene Zeitschrift TOMORROW auf, die uns 1999 mit dem Abschnitt</p>
<blockquote><p>
WWW. World Wide Web. Dieser Teil der Adresse beschreibt die Organisation, die vereinfacht den Zugang ins Netz ermöglicht. Hier könnte zB auch eine Nummer stehen wie 123.456.789&#8243;
</p></blockquote>
<p>einen Höhepunkt bescherte. Oder wie Gisbert Damaschke (nach Wau Holland <a href="http://groups.google.de/group/de.org.ccc/msg/204c8d0d26f4ad54?dmode=source&#038;hl=de" class="liexternal">zitiert</a>) damals treffend feststellte:</p>
<blockquote><p>
Es ist ein Kunststueck eigener Art, so viele Fehler in einen so kurzen Text zu packen. Mein Liebling ist die IP-Adresse mit drei statt 4 Tripeln, von denen 2 auch noch oberhalb von 255 liegen.&#8221;
</p></blockquote>
<p>In der heutigen Zeit sind diese Kleinode weitestgehend unerreicht, aber immer wieder gibt es Versuche in die Richtung, die Fehlerdichte möglichst hoch zu treiben. Bereits in der Vergangenheit ist Spiegel-Online positiv in diesem Feld aufgefallen. Heute gab es nach längerer Zeit wieder einen Höhepunkt zu vermelden.<br />
<!--more--><br />
Felix Knoke schreibt im <a href="http://www.spiegel.de/netzwelt/tech/0,1518,445918,00.html" class="liexternal">Netzwelt-Ticker</a>:</p>
<blockquote><p>
<strong>Wiki-Community verhindert Wurm-Attacke</strong></p>
<p>In einen Wikipedia-Artikel eingefügte Links und eine ganze Spam-Lawine sollte gestern die Malware W32.Blaster verbreiten &#8211; aber die Wiki-Community schritt schnell genug ein. Nur Minuten nach der Attacke wurde der Angriff abgewehrt.
</p></blockquote>
<ul>
<li>Von einer Wurm-Attacke spricht man in der Regel, wenn ein Wurm sich selber verbreitet.</li>
<li>Die Wiki-Community (gemeint ist wohl die Wikipedia-Community) hat an dem eigentlichen Spamrun nichts verhindert.</li>
<li>Dass die Dateien Malware enthielten ist wahrscheinlich &#8211; allerdings wurde bei Heise Security keiner von 20 Virenscanner fündig. W32.Blaster war somit also garantiert nicht enthalten.</li>
<li>Die &#8220;Minuten&#8221; bis zur Versionslöschung waren leider Stunden. Die entsprechende &#8220;manipulierte&#8221; Version des Artikels wurde zwar schnell nach Einstellung revertet &#8211; das wiederum hatte keinen Einfluss auf den &#8220;Angriff&#8221;, da in der Spam-Mail der Permalink auf die alte Version genutzt wurde.</li>
</ul>
<blockquote><p>
Die Mail brüllte laut, wie Spam-Mails eben brüllen: &#8220;Wikipedia schlägt Alarm. Neue Variante des W32.Blasters im Umlauf. Wurm-Fix zum Download&#8221;. Ein Link zur Wikipedia sollte Vertrauen schaffen: Wer sich gegen die neue Blaster-Variante schützen wolle, müsse nur auf den Blaster-Artikel in der Wikipedia surfen, dort gäbe es die nötigen Updates.
</p></blockquote>
<ul>
<li>Von &#8220;brüllen&#8221; schreibt man im Mailkontext dann, wenn Großbuchstaben verwendet werden &#8211; aber ich will nicht zu kleinlich sein.</li>
<li>Der letzte Satz ist irreführend (war aber auch in der Original-Mail unklar gehalten). In der entsprechenden Artikelversion fand sich ein externer <em>Link</em> auf die angeblichen Updates.</li>
</ul>
<blockquote><p>
Und tatsächlich: Wer dem Link zur Wikipedia folgte, konnte dort Links zu den Patches finden &#8211; samt Hinweis von Microsoft, dass man zu so einem außergewöhnlichen Mittel greifen müsse, da die Microsoft-Downloadserver ausgefallen seien. Natürlich versteckte sich hinter den Downloads nichts anderes als der W32-Blaster, vor dem sich hereingelegte Surfer eigentlich schützen wollten.
</p></blockquote>
<ul>
<li>Siehe oben. Wenn in den Dateien eine Malware enthalten war (wahrscheinlich), so definitiv nicht W32.Blaster.</li>
</ul>
<blockquote><p>
Doch unter den Empfängern der Blaster-Spammail muss auch ein Wikipedia-Autor gewesen sein. Der bemerkte schnell, dass eine einfache Änderung des Artikels nicht viel bringen wird. Der Wurm-Autor hatte auf eine History-Version des Artikel verlinkt, diese Versionen lassen sich nicht ändern. Nur wenige Minuten, nachdem die Spam-Lawine losging, sperrte die Wikipedia deshalb den kompletten Artikel.
</p></blockquote>
<ul>
<li>Die logische Schlussfolgerung, warum unter den Empfängern des Spams ein Wikipedia-Autor gewesen sein muss, bleibt mir verborgen. Fakt ist, dass wir unter anderem durch Hinweise von Dritten, aber auch durch eine große Anzahl an Bounces auf den Spamrun aufmerksam wurden.</li>
<li>Die Aussage, dass der Artikel nach wenigen Minuten gesperrt wurde ist falsch und unsinnig: Eine Sperre bringt hier natürlich nichts. Der wichtige Punkt ist die Löschung der entsprechenden Artikelversion. Dies geschah leider nicht nach Minuten, sondern erst nach Stunden. Nachdem dann die verunstaltete Seite erneut eingestellt wurde, wurde diese wieder gelöscht und der Artikel gesperrt.</li>
</ul>
<p>Alles in allem ist das für einen relativ kurzen Text eine ansehnliche Fehlerdichte. Aber ich werde die Augen nach weiteren Anwärtern offen halten. Bis dahin ersteinmal herzlichen Glückwunsch, Spiegel-Online!</p>]]></description>
		<wfw:commentRss>http://wikipedistik.de/2006/11/01/herzlichen-glueckwunsch-spiegel-online/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
	<creativeCommons:license>http://creativecommons.org/licenses/by/2.0/de/</creativeCommons:license>
	</item>
	</channel>
</rss>

