Skip to content

Google sammelt versehentlich Daten?

Nachdem Google Ende April beim Wardriving ertappt wurde, hieß es seitens Googles noch, man würde ja nur die MAC-Adressen und Namen (SSID) der Funknetze protokollieren, aber weder Nutzdaten (Payload-Daten) sammeln noch speichern. Inzwischen hat Google zugegeben, dass das nicht stimmt: Es wurden Payload-Daten unverschlüsselter Funknetze gesammelt und gespeichert. Da die Streetview-Autos i.A. in Bewegung sind, handelt es sich dabei nur um Ausschnitte des Netzwerkverkehrs. Aufgezeichnet werden konnte immer nur so lange, wie der betroffene Access Point in Reichweite war und der Empfänger im Wagen auf dem entsprechenden Kanal empfangen hat (der ca. 5 Mal pro Sekunde gewechselt wurde). Im Prinzip können dabei wirklich nicht viele Daten pro Netz gesammelt worden sein - aber was in diesen Informationsschnipseln alles drin steht, weiß nur Google. Theoretisch kann da alles drin sein, was (worauf auch Google hinweist) die Bedeutung der Verschlüsselung der über Funknetze übertragenen Daten zeigt.

Zufällig Daten gesammelt... und keiner merkt es?

Interessant ist die Begründung, wieso es zum Sammeln der Nutzdaten kam: 2006 arbeitete ein Google-Techniker an einem experimentellen WiFi-Projekt und schrieb dazu ein Programm, das sämtliche übertragenen Daten erfasste (wozu Google das brauchen könnte, müssen wir wohl nicht lange raten, oder?). Als ein Jahr darauf das Projekt zum Sammeln der MAC-Adressen und Namen (SSID) von Funknetzen mit Hilfe der Streetview-Autos gestartet wurde, wurde dieser Code verwendet, obwohl die Projektleiter keine Nutzdaten erfassen wollten. Also mal ganz langsam: Die verwenden einfach vorhandenen Code und merken nicht, dass der mehr liefert, als sie wollen? Wenn ich fremden Code verwende, muss ich doch prüfen, ob der überhaupt tut, was er tun soll. Und wenn dabei keinem auffällt, dass da mehr Daten anfallen als vorgesehen - tja, keine Ahnung, wie man das bezeichnen soll, ohne unhöflich zu werden.

Sammeln ist gut, speichern ist besser, es merken wäre die Krönung

Das niemand gemerkt haben will, dass das Programm am Ende mehr Daten ausgegeben hat, als geplant war, ist ja schon ziemlich merkwürdig. Aber es wird noch besser: Die Daten wurden nicht nur von den Streetview-Autos gesammelt, sondern auch im Google-Netzwerk erfasst. Zufällig, ohne das es jemand gemerkt hat. Und das soll man glauben? Dass da zufällig ein Server rumstand, der aus Langeweile mal eben die Payload-Daten gesammelt hat, weil er sonst nichts anderes zu tun hatte? Obwohl: Vielleicht ist das ja der gleiche Server, der 1999 bei Microsoft ganz zufällig die ebenso zufällig an Microsofts übertragenen Word-GUIDs gesammelt hat.

(M)ein Erklärungsversuch

Betrachten wir mal Schritt für Schritt, wie man an die MAC-Adresse und SSID kommt. Erst mal müssen alle über WLAN empfangenen Daten erfasst werden. Dass dabei Nutzdaten aufgezeichnet werden, bleibt nicht aus. Das macht jeder Netzwerk-Sniffer so, und anscheinend macht das auch das 2006 entwickelte Programm. Danach müssen diese gesammelten Rohdaten ausgewertet werden, um die gewünschten Informationen zu erhalten. Und da fängt es an, merkwürdig zu werden: Die Streetview-Entwickler haben den vorhandenen Code verwendet, um MAC-Adressen und SSID zu sammeln. Wieso wurden dann aber die ebenfalls erfassten Nutzdaten nicht als unnötig verworfen? Selbst wenn die Auswertung nicht im Streetview-Auto, sondern erst in der Google-Zentrale passiert, hätte alle Daten außer den gewünschten danach gelöscht werden müssen. Wenn die dann trotzdem gespeichert werden, muss dafür ja wohl irgend jemand verantwortlich sein.

Eine Erklärung für das zufällige und unbemerkte Speichern der Nutzdaten gibt es: Google hat außer den extrahierten Informationen (MAC-Adresse und SSID) zusätzlich die gesammelten Rohdaten gespeichert. Die enthalten dann natürlich auch die Nutzdaten. Das wäre zwar so, als wenn man aus einer Zeitung einen interessanten Artikel kopiert, danach aber zusätzlich auch den Rest der Zeitung aufhebt, aber immerhin reden wir hier von Google, und da ist es durchaus möglich, das alle Daten gespeichert werden, wie nutzlos sie auch sind.

Diese Erklärung ist möglich - aber: Wieso hat Google nur die Nutzdaten unverschlüsselter Netze gesammelt, wie man ja selbst zugegeben hat? Die Rohdaten enthalten alle Daten, auch die verschlüsselten Frames. Das man damit nichts anfangen kann, steht auf einem anderen Blatt. Wenn Google die unverschlüsselten Nutzdaten gesammelt hat, spricht das für mich sehr dafür, dass das 2006 entwickelte Programm diese ausgegeben hat (wie es ja ursprünglich auch vorgesehen war) und dann diese Nutzdaten gespeichert wurden. Außerdem: Warum sollte Google sich die Mühe machen, jetzt die Nutzdaten aus den Rohdaten zu isolieren, um sie dann zu löschen (s.u.)? Dann könnte man auch die Rohdaten komplett löschen, die gewünschten Informationen hat man ja bereits erfasst.

Schadenbegrenzung und Vertrauensbildende Maßnahmen

Google hat die gesammelten Nutzdaten inzwischen isoliert und aus dem Unternehmensnetz entfernt. Wie sie gelöscht werden sollen, will man mit den Behörden der betroffenen Länder abstimmen. Die werden begeistert sein, dass sie Google jetzt beibringen sollen, wie man Daten löscht. Aber das Löschen von Daten ist für Google natürlich neu, die kennen ja bisher nur Funktionen zum Sammeln, Speichern und Verknüpfen der Daten, da ist es verständlich, dass sie fürs Löschen Hilfe brauchen. Vielleicht bin ich jetzt auch etwas unfair, wahrscheinlich hat man bei Google einfach Angst, wieder einen Fehler zu machen, wenn man die unerlaubt gesammelten Daten nun ohne Erlaubnis löscht.

Als vertrauensbildende Maßnahme soll der Code nun von einer unabhängigen dritten Partei geprüft werden (Wer garantiert denn, dass das auch wirklich der verwendete Code ist?). Diese Partei soll dann ebenfalls prüfen, dass die gesammelten Daten korrekt gelöscht wurden (Wie macht man das? Nur, weil sie auf der einen Festplatte nicht sind, bedeutet dass ja nicht, dass sie auch auf keiner anderen sind, von anderen Speichern wie Bändern, CD-ROMs,... ganz zu schweigen). Außerdem sollen die internen Prozeduren geprüft werden, um eine Wiederholung eines solchen Vorfalls (Was? Dass sowas entdeckt wird?) zu verhindern. Zudem wurde die Sammlung von WiFi-Daten durch die Streetview-Autos komplett eingestellt (Wollen wirs mal glauben).

Carsten Eilers

Trackbacks

Dipl.-Inform. Carsten Eilers am : Datenschutz oder Bequemlichkeit?

Vorschau anzeigen
Wie viel Bequemlichkeit sind Ihnen Ihre Daten wert? Oder wie viel Unbequemlichkeit oder zusätzlicher Aufwand? Angesichts der aktuell bekannt gewordenen Schnüffelprogramme der USA und Großbritanniens sollte man darauf achten, welche

Dipl.-Inform. Carsten Eilers am : Kommentare zu Conficker, Android, Google Glass, iOS und mehr

Vorschau anzeigen
Heute gibt es mal wieder eine bunte Mischung an Kommentaren. Zum Beispiel zu den Spam-Quellen im 2. Quartal 2014. Conficker lebt noch?!?! Hätten Sie damit gerechnet, dass Conficker auf Platz 1 der Liste der in Unternehmen am h&auml