Datenauskunft bei ebay.de

Die EU Datenschutzgrundverordnung (DSGVo), hat uns Konsumenten endlich das Recht gebracht, Daten von Firmen und Portalen maschinenlesbar zu beziehen. Motiviert von Kattaschas Anfrage bei Amazon und ihrem Talk auf dem 35c3, habe ich einmal eBay.de angefragt und teile gerne meine Erfahrungen. Weil dies ganz erfolgreich war, will ich hier kurz berichten wie das abläuft und was man dann über sich erfährt.

Zunächst solltet ihr in eurem eBay-Konto schauen, dass der hinterlegte Name, Geburtsdatum, die Wohnadresse und Telefonnummer aktuell sind und mit euren Angaben auf eurem Personalausweis übereinstimmen. Dann schickt Ihr eine Mail an Anna_DPO@ebay.com (bzw. den ausländischen Zuständigen) zum Beispiel mit Folgendem Inhalt:

Sehr geeehrte Damen und Herren,

hiermit beantrage ich eine Datenauskunft nach Art. 15 der DSGVO zu meinem mit dieser Mailadresse verknüpften eBay-Konto "<Nutzername>". Dabei handelt es sich meiner Meinung nach insbesondere (aber nicht ausschließlich )um die personenbezogenen Daten, wie meine Stammdaten und deren Änderungshistorie. Alle Daten bzgl. meiner Finanztransaktionen, Postadressen, verknüpften Profile und genutzten Apps. Daten über Bewertungen, Gebote, durchgeführte Suchen, betrachtete Artikel, ...

Für die Beantwortung meiner Anfrage setze ich Ihnen hiermit eine Frist bis zum <in 4 Wochen>.

Benutzt für den Versand am besten die Mailadresse, über die Ihr auch bei eBay registriert seit. Hängt Fotos eures Personalausweises an, unnötige Angaben können dabei geschwärzt werden.

Datenauskunft

Bei mir gab es noch einige Rückfragen von eBay und dann telefonisch das Passwort und einige Minuten später eine Mail mit einer Zip-Datei mit folgendem Inhalten:

  • Angebotene und verkaufte Artikel.pdf
  • Browsingverlauf.xlsx
  • Gebote.pdf
  • Käufe.pdf
  • Kommunikation Kunde zu Kunde.xlsx
  • Kundenkontakte.pdf
  • Personenbezogene Daten.pdf

Dazu gab es diverse PDFs mit meinen Angaben aus meiner Mail und Legenden zu den übermittelten Daten. Denn in den (gesperrten) PDFs sind schlicht Tabellen aus den eBay-Datenbanken gewesen. Hierbei sind Daten seit 2007 dabei und umfassen 130 Käufe, 287 Gebote und fast 3400 Interaktionen auf der Webseite, die seit über einem Jahr aufgezeichnet wurden und von 59IPs stammten.

Datenaufbereitung

Damit man seine Daten etwas besser verstehen kann, muss man die HTML-Tabellen aus der PDF befreien. Ich habe sie deshalb mit Tabula Java als .CSV umgewandelt:

java -jar tabula-1.0.2-jar-with-dependencies.jar --password <übermitteltes Passwort> --lattice --pages all "angebotene und verkaufte Artikel.pdf" --out artikel.csv

Danach kann man sie etwa mit Libreoffice Calc einlesen (Trennzeichen „,“, Zeichenketten mit „“, Zeichensatz Windows-1252. Allerdings sind dann immernoch die Zeilenumbrüche ziemlich störend. Manuell kriegt man die leicht angepasst, indem man die Spalten auswählt und mit Suchen & Ersetzen arbeitet („\n“ zu „“, Reguläre Ausdrücke aktivieren, nur Auswahl aktivieren). So kann man sich bereits einen ziemlich guten Überblick verschaffen.

Konkret sieht dann das etwa so aus:

Browsingverlauf.csv
EBAY_USERNAME,USER_ID,SITE_ID,SITE_NAME,GUID,SESSION_SKEY,IP,DEVICE_TYPE,PAGE_ID,PAGE_NAME,SESSION_START_DT,REFERRER,URL_QUERY_STRING,EVENT_TIMESTAMP,SEARCH_QUERY,ITEM_ID
ich,369945656,77,Germany,4b4165311680a0e766242e34ffff9d3e,37564326255801,216.113.170.95,PC,1883,My eBay: My Account,2019-01-14,https://www.ebay.de/myb/Summary?MyEbayBeta&gbh=1&LogUID=calle_vom_harz,/ws/eBayISAPI.dll?_trksid=p2060353.m2034.l3911&MyEbayBeta=&MyeBay=&CurrentPage=MyeBayMyAccounts&ssPageName=STRK%3AME%3ALNLK%3ANone&FClassic=true,2019-01-14 05:30:29,?,?
...

Käufe.csv
Item ID,Transaction ID,"Listing Start Date","Listing End Date",Transaction Date,"Checkout Status","Seller User ID",Buyer ID,"Buyer User ID","Listing Type",Qty Avail,"Purchase QTY",Item Price,"Total Price",Currency,"Leaf Category Name",Listing Title

111287210302,1621736656001,02/24/2014,01/29/2019,02.05.2017 10:29:14, Complete, nordic-sale, 369945658, ich,"Store Fixed
Price",32750,1,"1,99","1,99",EUR,"Möbel & Wohnen:Hau shalt:Kleider- & Schuhpflege: Schuhpflege: Schnürsenkel","runde Schnürsenkel 80-220 cm für Arbeitsschuhe, Wanderschuhe, Reißfest"
...

Analyse

Als Freund der reproducible science und von Python, benutze ich gerne Pandas, um die Daten auszuwerten. Für die Erkundung zusammen in einem Jupyter Notebook, welches ich auf Github zu Verfügung stelle.

Zeitliche Verteilung

Verteilung nach Kategorien

Browser

Die (sinnvolle) Auswertung des Browsing-Verlaufs ist schon etwas schwieriger und auch noch nicht abgeschlossen. Was ich bisher rausfand, ist in erster Linie die zeitliche und räumliche Verteilung

Orte: ‚Broad Brook‘, ‚DE‘, ‚Friedrichsdorf‘, ‚Nienburg‘, ‚Quedlinburg‘, ‚Hamburg‘, ‚Havixbeck‘, ‚Berlin‘, ‚Hanover‘, ‚Dresden‘, ‚Bremen‘, ‚Rostock‘, ‚Leipzig‘, ‚Potsdam‘, ‚Lambrechtshagen‘, ‚Wismar‘]

Resüme

Es ist super, dass durch die Datenschutzgrundverordnung solche Auskünfte bei Firmen überhaupt möglich sind und diese dort ernst genommen werden. Neben einigen unspektakulären Details (ja ich habe fast immer nur ein einzelnes Produkt gekauft, oft habe ich nur einmal etwas von einem Verkäufer gekauft und ich habe mich kaum zu den Zeiten nicht in Rostock befunden) und einigem Stirnrunzeln (merkwürdige Struktur der Artikelnamen, Tabellenspalten, …), wird einem aber sehr schnell klar, welchen Umfang die Daten haben und wie genau einzelne Lebensphasen sich dadurch rekonstruieren lassen. Das ist natürlich nicht ganz eindeutig, aber es gibt auf jeden Fall genügend Indizien für Dritte, um Werbestrategien und Auskünfte zu optimieren. Und natürlich kann eBay so jede Menge Vermutungen anstellen, mit wem man so handelt und ob (statistisch) alles mit richtigen Dingen zugeht.

Es stellt sich auch die Frage, warum einige Daten unbedingt so lange vorgehalten werden. Die früheren Wohnaddressen sind ebenso obsolet, wie auch die IP-Adressen der letzten Monate. Auch die seit Jahren abgeschlossen Käufe, müssten nicht in allen Details gespeichert bleiben. Da eBay aber keine Löschung ohne Schließung des Kontos anbietet, muss man wohl einen separaten Löschantrag stellen.

Author: Matthias
Betreibt dies Blog und probiert so einiges aus Technik herauszuholen. Oft mit Bezug zur Wirklichkeit, aber manchmal auch weil es eben geht ;-) Hat sich von Robotron über Basic, ASM, qC, ... soweit hochgearbeitet, dass er eigentlich gar nicht mehr so oft codet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert