Wenn man Texten nicht mehr trauen kann

Wussten Sie, dass manche Zeichen identisch dargestellt werden, obwohl sich dahinter ein ganz anderer Buchstabe verbirgt?

Ein herzliches Dankeschön an „Unicode“ – den Zeichensatz, den wir mittlerweile fast überall verwenden. Dieser ist so konzipiert, dass er knapp 150.000 einzelne Zeichen verwalten kann. Diese werden durch Zeichencodes eindeutig identifiziert, so gibt es bspw. das kyrillische Zeichen mit dem Code U+0430, das als „kleines a“ dargestellt wird. Unser lateinisches Zeichen mit dem Code U+0061 ist ebenfalls ein „kleines a“.

Die meisten Schriftarten zeigen diese beiden verschiedenen (!) Zeichen exakt identisch auf dem Bildschirm an.

Auch früher hatten wir schon solche sog. homographischen (der Fachbegriff dafür) Angriffe – allerdings gab es da noch den ASCII-Zeichensatz mit lediglich 128 Zeichen und man musste sich bspw. mit einem recht verpixelten G00GLE (also mit Nullen statt O’s) behelfen. Heute gibt es alleine im Unicode-Zeichensatz ca. 7.000 solcher identisch aussehender Homoglyphen (sorry, ja, schon wieder ein Fachbegriff – aber ein lustiger), die in Wirklichkeit verschiedene Zeichen sind.

Das perfide an solchen Angriffen ist jedoch, dass sie mit bloßem Auge nicht zu erkennen sind. Man bräuchte schon einen speziellen Editor, der Unicode-Zeichen sichtbar machen kann oder eine spezielle Schriftart, in der bspw. das kyrillische und das lateinische „kleine a“ unterschiedlich dargestellt werden.

Sommit hat uns Unicode nicht nur einen weltweit einheitlichen und nutzbaren Zeichensatz beschert (das ist nämlich tatsächlich super), sondern leider auch ein tolles Angriffsmuster für Phishing jeder Art – und das ist natürlich nicht mehr super.

In Domain-Namen, Links, etc. können also leider sehr einfach nicht erkennbare Fehler platziert werden. Umso wichtiger sind Zertifikate, Verschlüsselung und gute Authentifizierung. Sicher ist sicher….