Was speichert Twitter? Finde es heraus!

Ich habe es vor einiger Zeit schon per Twitter (oh, the Irony!) verkündet (2): Es gibt die Möglichkeit zu erfahren, welche Informationen Twitter über den eigenen Account gespeichert hat 1. Der Prozess, an diese Daten zu kommen, wird von Twitter (unnötig) steinig gemacht, aber es funktioniert. Heute nacht kam also die E-Mail mit allen Daten, welche Twitter zu meinem Account web_martin gespeichert hat. Was ist enthalten:

  • Basic information about your Twitter account.
  • Any records of changes of the email address on file for your Twitter account.
  • Tweets of your Twitter account.
  • Favorites of your Twitter account.
  • Direct messages of your Twitter account.
  • Any contacts imported by your Twitter account.
  • Accounts followed by your Twitter account.
  • Accounts that follow your Twitter account.
  • Any lists created by your Twitter account.
  • Any lists subscribed to by your Twitter account.
  • Any public lists that include your Twitter account.
  • Any searches saved by your Twitter account.
  • Logins to your Twitter account and associated IP addresses.
  • Any records of a mobile device connected to your Twitter account.
  • Any records of a Facebook account
  • connected to your Twitter account.
  • Links and authenticated API calls that provide information about your Twitter account in real time.

In meinem Fall sind tatsächlich alle Tweets seit 2008 (als JSON) samt ihren kompletten Meta-Informationen enthalten; andere sprechen davon, dass nur 26 Monate enthalten seien; das kann ich nicht bestätigen. Ein Tweet sieht so aus:


// ************** Tweet 12236 of 12243 **************
{
"geo": null,
"entities": {
"hashtags": [

],
"urls": [
{
"indices": [
31,
51
],
"url": "http://t.co/ddGXRtM4",
"expanded_url": "http://j.mp/GLkZvw",
"display_url": "j.mp/GLkZvw"
}
],
"user_mentions": [

]
},
"created_at": "Mon Mar 26 08:21:02 +0000 2012",
"truncated": false,
"coordinates": null,
"favorited": false,
"in_reply_to_user_id_str": null,
"in_reply_to_user_id": null,
"source": "Buffer",
"id_str": "184193226931056641",
"contributors": null,
"possibly_sensitive": false,
"retweet_count": 0,
"user": {
"id_str": "12948892",
"id": 12948892
},
"in_reply_to_status_id": null,
"id": 184193226931056641,
"retweeted": false,
"in_reply_to_screen_name": null,
"text": "Face detection in JavaScript ☞ http://t.co/ddGXRtM4",
"in_reply_to_status_id_str": null,
"place": null
}

Was mich stutzig macht, ist die Speicherung von DirectMessages (DMs) und Telefonbuch-Kontakten. Ich lösche meine DMs regelmäßig per DMCleaner. Deshalb war ich erstaunt, dass in den Twitter-Informationen auch DMs aus letztem Oktober aufgetaucht sind:


********************
sender_id: 12948892
recipient_id: XXXXXXXX
text: Then wait another year ;)
created_at: Fri Oct 21 13:55:16 +0000 2011

Ich muss fairerweise sagen, dass ich nicht genau weiß, wo diese DMs (wieder) herkommen. In meinen Clients tauchen Sie nun auch wieder auf, ich bin mir aber sicher, dass ich nach Oktober mindestens einmal gelöscht habe. Bei einer erneuten Löschung jetzt hat DMCleaner aber scheinbar nicht alle DMs erfasst, denn dort genannte Zahl der gespeicherten DMs unterscheidet sich von der in meinen Clients. Gut möglich also, dass ich schlicht der Meinung war, alles gelöscht zu haben, die Webapp aber einen Fehler hat. Die ähnliche App von Tim Whitlock konnte die alten DMs löschen, sodass diese nun in keinem Client zu sehen sind. Da der Prozess der Datenanforderung aber circa einen Monat dauert, kann ich das jetzt leider nicht mal eben schnell nochmals machen. Falls jemand der Leser auch vorhat, seine Daten von Twitter zu fordern, wäre es interessant zu wissen, ob dort dann auch gelöschte DMs enthalten sind. Also vorher DMs löschen (falls es euch nichts ausmacht) und dann die Daten verlangen.

Gelöschte Tweets konnte ich übrigens keine finden. Ich habe mindestens einen Tweet im Kopf, den ich später gelöscht habe; diesen habe ich nicht in den Daten gefunden. Insofern spricht dies für die These, dass die Webapp schlicht nicht alle DMs gelöscht hat.

Richtig ärgerlich ist die Situation jedoch bei den Telefonbuch-Kontakten: Diese hatte ich testweise über die iPhone-App hochgeladen, um herauszufinden, wer meiner Kontakte (mir unbekannterweise) einen Twitter-Account hat. In den Logs sind nun alle (!) E-Mail-Adressen und Telefonnummern (nicht aber die Namen der Kontakte), die ich zum Zeitpunkt des Uploads im Handy hatte, gespeichert. Twitter speichert diese Daten nach eigenen Angaben 18 Monate und es gibt auch die Möglichkeit, sie zu löschen, was ich auch recht bald nach dem Import getan habe. Dennoch fanden sich alle Nummern und Mailadressen in den gespeicherten Daten. Interessant (und leider Branchenstandard) ist, dass diese Daten überhaupt im Klartext gespeichert werden: Durch Hashing der Daten ließe sich das umgehen und Twitter könnte die Funktion ebensogut implementieren, hätte aber keine Klartext-Adressen oder Telefonnummern.

Ebenfalls interessant ist die Auflistung der IPs, von denen auf den Account zugegriffen wurde. Diese Auflistung reicht in meinem Fall bis 01.02.2012 zurück und beinhaltet 463 Einträge. Interessant wäre hier zu wissen, wo die Grenze liegt; sprich bis zu welchem Zeitraum die IP gespeichert bleibt.


********************
id: 103963240
user_id: 12948892
created_at: 2012-02-01T08:32:20+00:00
last_login_ip: XXX.XXX.XXX.XXX

Der Rest der Daten beinhaltet nichts außergewöhnliches und entspricht den Erwartungen. Es wäre toll, wenn sich mehr Leute dazu entscheiden würden, ihre Daten zu verlangen, dann könnten wir die Ergebnisse (insbesondere im Bezug auf die DMs) vergleichen.

Noch ein letzter Tipp: Twitter fordert eine Identifikation der Person per Personalausweis oder ähnlichem Dokument, dies soll an eine Amerikanische Faxnummer gesendet werden. Hier reicht es völlig aus, Vorname, Name, Foto und Unterschrift sichtbar zu lassen und alles andere (Ausweisnummer, Geburtsdatum / -ort) auszuschwärzen. Wahrscheinlich hätte ich das Foto auch noch schwärzen könnenDas Photo muss bestehen bleiben, weil eine »government-issued photo ID« verlangt wird. Danke, Patrick.

Viel Erfolg! Ich freue mich über Meinungen und Kommentare.

  1. Für Facebook gilt das gleiche, dort ist meine Anfrage aber seit Monaten in Bearbeitung und ich habe bisher noch keine Daten erhalten.

4 Gedanken zu „Was speichert Twitter? Finde es heraus!

  1. Krass – um alles zu bereinigen muss man noch mehr private Daten von sich preisgeben.

    Die Gestapo würde alle sozialen Netzwerke lieben …

  2. So, meine Daten sind jetzt auch da. Auch bei mir sind noch einige DMs da, obwohl ich immer alle lösche. Ich nehme an, dass der andere (Sender bzw. Empfänger) die DM noch nicht gelöscht hat und sie deshalb noch gespeichert bleibt. Da eine DM ja beiden „gehört“, müssen sich auch beide für das Löschen entscheiden, bevor es wirklich weg ist.

Kommentare sind geschlossen.