Wir erheben nur Metadaten“ – Wie oft hat man diesen Satz in den letzten Jahren gehört. Dabei sind Metadaten das wahrlich interessante und Metadaten-Vermeidung, die hohe Kunst. Dieser Aspekt ist leider in der Praxis oft immer noch im toten Winkel der Debatte.

Definition: Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über andere Daten enthalten. Das kann ganz unterschiedliche Bereiche umfassen. Im hier behandelten Kontext meint es Informationen wie Wer, wann, wo, mit wem, worüber usw.

Ein lange bekanntes Problem

Bei jeder Novelle der Überwachungsgesetze und bei jedem Skandal um Telemetrie-Datenerhebung durch Firmen kommt zuverlässig das Argument, dass man nur Metadaten sammeln würde und die Inhalte nicht tangiert wären. Die meisten Menschen sind dann beruhigt, weil sie glauben, ihre wahrhaft sensiblen Daten wären weiterhin geschützt. Weit gefehlt!

Für einen Einstieg in die Materie empfiehlt sich immer noch ein Artikel auf netzpolitik.org von 2014: Wie dein unschuldiges Smartphone fast dein ganzes Leben an den Geheimdienst übermittelt. Ergänzend dazu ein Bericht der SZ von 2014 was sich aus Telefonüberwachung ableiten lässt: Die Lüge von den Metadaten. Wohin die Sammlung von Metadaten führen kann, hat die ZEIT 2015 eindrücklich dargelegt: BND speichert 220 Millionen Telefondaten – jeden Tag.

Die Berichte entstammen der Hochphase der Globalen Spionage- und Überwachungsaffäre, aber der Sachverhalt hat sich seitdem kaum geändert. Immer noch sammeln Firmen und Geheimdienste systematisch Metadaten, immer noch beschwichtigen Politiker und immer noch glauben die meisten Menschen, ihre Kommunikationsinhalte wären das wirklich schützenswerte.

Das ist verständlich, weil die Inhalte vermeintlich unsere Vorlieben, Interessen, Ziele, Wünsche und Träume enthalten, aber unsinnig, denn die Kommunikationsinhalte sind bei den meisten Menschen völlig uninteressant und ohne Kontext auch meistens wenig aussagekräftig. Wirklich interessant für Firmen und den westlichen Überwachungsstaat sind die Metadaten. Denn sie geben Auskunft über Bewegungsprofile, Netzwerke und Verbindungen.

Zumindest gegenwärtig lassen sich Metadaten auch immer noch leichter automatisiert auswerten als Video-, Sprach- oder Textinhalte. Wobei angesichts der Fortschritte in der automatischen Spracherkennung und Inhaltserschließung das bald hinfällig sein könnte.

Wir erzeugen mehr und nicht weniger Metadaten

Die oben referenzierten Artikel sind alle 6-7 Jahre alt. Damals wurde nur das Bewegungsprofil, Internet, WhatsApp und E-Mail berücksichtigt. Smart Watches, intelligente Fitness-Armbänder, Smarte Lautsprecher, Smarte Autos – all diese Entwicklungen waren noch nicht so weit wie heute. Das Ausmaß der genutzten Dienste und die Zahl der Sensoren im Smartphone hat seitdem somit definitiv noch zugenommen.

Im Unterschied zu den Inhalten kann man Metadaten nicht vermeiden, indem man selbst ein bisschen verschlüsselt und ein wenig sensibler im Umgang mit seinen Daten ist. Möglicherweise ist das Thema auch deshalb so wenig im Fokus, weil es ein Ohnmachtsgefühl auslöst. Bei den Inhalten kann der Einzelne aktiv werden und zu wirkungsvoller Verschlüsselung greifen. Dabei gibt es erfolgversprechende Verfahren, bei denen wir mit großer Wahrscheinlichkeit davon ausgehen könnten, hinterher unsere Inhalte effektiv geschützt zu haben.

Um Metadaten zu reduzieren, hilft es nur Dienste zu nutzen, die genau diese Daten vermeiden. Mit ein bisschen Verschlüsselung seiner Dateien im kommerziellen Cloud-Dienstleister oder der Inhalte seiner E-Mails beim gleichen Anbieter kommt man da nicht weiter.

Umdenken nicht in Sicht

Eine komplette Änderung alle Gewohnheiten und Dienste kann man von niemandem verlangen. Bei neuen Diensten oder Geräten sollte man diesen Faktor aber endlich berücksichtigen. Die Erkenntnis wie wichtig und gefährlich Metadaten sind, ist schließlich alt genug.

Es gibt gute und verbreitete Dienste, die sich zumindest des Problems angenommen haben. Die Signal-Entwickler beschäftigen sich seit Jahren mit der Reduzierung und Vermeidung von Metadaten. Bei Threema hat man dieses Problem auch immer beachtet. Wer freie Software bevorzugt, hat ebenfalls Alternativen: Die Vermeidung von Metadaten als Konzept gilt auch für den besonders sicheren Messenger Briar.

Viele andere Dienste tun dies nicht. Einerseits weil die Vermeidung von Metadaten kompliziert ist, andererseits weil es bei vielen Entwicklern keine Priorität hat. Das gilt natürlich für viele kommerzielle Dienste, aber auch für die neuen Lieblinge der verschränkten FOSS/Datenschutz-Community.

Die neuen föderierten Messenger (z. B. Delta Chat / Matrix) sind strukturell bedingt genau so ungeeignet für die Vermeidung von Metadaten wie XMPP und E-Mail vor ihnen. Die Vernetzung eines föderierten Systems benötigt einfach systembedingt Metadaten und bringt einen Kontrollverlust mit sich, weil man den Serverbetreibern vertrauen muss.

Vor allem den Hype um die neuen föderierten Protokolle kann ich unter diesem Gesichtspunkt nicht verstehen. Hier werden zu offensiv Konzepte vermischt, die sich nicht immer vertragen: Digitale Souveränität und Datenschutz. Man mag auf die alten Protokolle, wie beispielsweise die E-Mail, nicht verzichten können, aber muss doch nicht sehenden Auges im Bewusstsein der hier beschrieben Problematik neue Protokolle etablieren, die genau die gleichen strukturellen Probleme haben.

Zusammengefasst

Metadaten sind das wirkliche Problem. Sie sind für alle Feinde unserer digitalen Sicherheit und unserer Privatsphäre interessant, wir erzeugen immer mehr davon und das Problem steht zu wenig im Fokus. Verschlüsselung ist nett und so lange sie mit wenig Aufwand zu realisieren ist, auch ratsam – sie geht aber am Kernproblem vorbei. Das gilt auch für die neuen gehypten Dienste.

Moin, meine Name ist Gerrit und ich betreibe diesen Blog seit 2014. Der Schutz der digitalen Identität, die einen immer größeren Raum unseres Ichs einnimmt ist mir ein Herzensanliegen, das ich versuche tagtäglich im Spannungsfeld digitaler Teilhabe und Sicherheit umzusetzen. Die Tipps, Anleitungen, Kommentare und Gedanken hier entspringen den alltäglichen Erfahrungen.

8 Ergänzungen

  1. Viele der letzten Artikel hier konnte ich nur eingeschränkt teilen, aber bleibt für mich eigentlich nur ein „+1“ 🙂

  2. Beim Kernpunkt deiner Aussage gebe ich dir vollkommen recht, was matrix anbelangt möchte ich jedoch noch etwas hinzuzufügen:
    1. Ist meiner Ansicht nach eine föderierte Struktur definitiv besser als ein waaled garden (auch Signal gehört hier dazu, solange ich keinen Signal Server laufen lassen kann der aktiv am Netzwerk teilnimmt macht man sich genau von einem Anbieter abhängig, das mag jetzt OK sein, in 15 Jahren könnte es sich aber wieder in das neue WhatsApp handeln von dem man die Leute wieder nicht weg bekommt)

    2. Ist den Matrix Machern diese Problematik vollkommen bewusst und sie arbeiten seit knapp zwei Jahren (wird definitiv noch länger dauern) an einem vollständig dezentralen, p2p Ansatz. Das Problem hier ist dass sauber föderiert und dezentralen einfach verdammt schwierig ist und zwischendurch muss halt irgendwann auch etwas nutzbares vom Band laufen

    • Wie geschrieben: Digitale Souveränität und digitale Privatsphäre/Datenschutz haben Schnittmengen aber sind nicht das gleiche. Das wird zu oft vermischt.

      Eine föderierte Struktur ist momentan (und vermutlich auch mittelfristig) nicht gut für die Vermeidung von Metadaten und somit für die Privatsphäre.

  3. Hallo Gerrit,
    bei der Erhebung von Metadaten hast du Recht, allerdings finde ich, dass der Schwenk hin zu den Messengern ein wenig am Problem vorbei geht. XMPP und Matrix speichern zwar viele Daten auf dem Server, durch die Föderation ist man aber zumindest nicht einem einzigen Betreiber ausgeliefert, wie dies bei Signal oder Threema der Fall wäre. Kritisch wird es doch vor allem, wenn viele Daten zusammenlaufen und selbst dezentrale Systeme wie Tox können noch einiges zu Tage födern, wenn man es darauf anlegt. Sei es drum, das ist ja nicht die Botschaft.

    Um dein eigentliches Fazit aufzugreifen:
    Reicht denn eine Sensibilisierung für das Thema aus? Welche Maßnahmen wären für dich noch vertretbar – alles über Tor etc. laufen zu lassen? Die Lösung scheint auf Grundlage der aktuellen Netzwerktechnik selbst fast unmöglich. Senderseitig kommt die Lokalisierung in (5G-)Funkzellen, also drei Buchstaben mobil und zuhause immer lauschend dabei. Auf der anderen Seite ein gesprächiges Betriebssystem und zentralisierte Dienste, die immer mehr online-Funktionen und (auch teilweise politisch gewollt) persönliche Daten zur Authentifikation erfordern. Hier scheint es doch ebenso nur darauf anzukommen, ob und von wem die Daten erhoben werden (können). Die einzige Gegenmaßnahme kann doch nicht die Reduktion oder ein Verzicht sein.

    • „durch die Föderation ist man aber zumindest nicht einem einzigen Betreiber ausgeliefert, wie dies bei Signal oder Threema der Fall wäre.“

      Und was nützt dies wenn das föderierte System insgesamt zu viele Metadaten generiert?

      Genau deshalb habe ich ja diesen Schwenk gemacht. Es werden immer noch System gehypt, die nicht in die richtige Richtung gehen. Wenn dann dem noch die Plakette „Privacy“ angehängt wird, verstehe ich das nicht mehr.

    • Anderer Punkt: Eine Lösung gibt es nicht, aber man sollte kritisch sein, wenn Betreiber oder Politiker mit dem Verweis auf Metadaten beschwichtigen. Signal zeigt zudem, dass ein bisschen was technisch möglich ist.

Schreiben Sie eine Ergänzung

Ergänzungen dienen der Diskussion über die Inhalte des Artikels. Nachfragen, Anmerkungen und Ergänzungen sind dezidiert erwünscht. Ergänzungen werden vor der Veröffentlichung moderiert. Wir behalten uns vor Kommentare ohne inhaltlichen Bezug oder abseitige Diskussionen nicht zu veröffentlichen.

Bitte geben Sie Ihre Ergänzung ein!
Bitte geben Sie hier Ihren Namen ein