Dansk studerende offentliggør 70.000 brugere af datingsite

En dataskandale er under opsejling i Aarhus, efter at en studerende ved Aarhus Universitet har støvsuget et datingsite for brugerdata og offentliggjort det hele på nettet.

70.000 brugere af OK Cupid fremgår af data, danske studerende har skrællet ud af tjenesten. (Foto: © skærmdump)

En kæmpe bunke data om brugerne af det internationale dating-site OK Cupid er nu havnet på nettet, efter at en studerende ved Aarhus Universitet og en medhjælper har skrællet tjenesten for oplysninger og lagt det hele ude i en fil, man let kan hente ned og grave løs i.

Det store datasæt rummer data om seksualitet og seksuelle præferencer fra op mod 70.000 brugere af OK Cupid. Hverken brugerne eller OK Cupid er blevet spurgt om lov.

Af datasættet fremgår det, at 868 af de 70.000 er danskere.

Brugerne fremgår dog - tilsyneladende - fortrinsvis under deres brugernavn på OK Cupid, der ikke behøver at være deres rigtige navn. Datasættet indeholder dog også alder, lokation og ikke mindst brugernes svar på en række spørgsmål om seksualitet.

Det er data, der tilsammen, i kyndiges hænder, kan bruges til at identificere, hvem der oprettet profilerne.

Brøl af kritik

Offentliggørelsen af det store data har vakt furore på nettet, blandt andet på det sociale medie Reddit, hvor brugerne skyder med skarpt mod de to danskere, der står som forfattere af rapporten.

Ekstremt uetisk, uvidenskabeligt og helt unødvendigt, lyder flere af skudsmålene.

Historien er også begyndt at rulle i amerikanske medier.

Aarhus Universitet tog tidligere i dag afstand fra den studerendes handlinger via Twitter, hvor universitetet fremhæver, at den studerende har udgivet datasættet i sin fritid.

Rundt omkring på nettet præsenterer den studerende sig dog hørende hjemme på Aarhus Universitet.

- Med den viden, jeg har i øjeblikket, er der tale om et privat initiativ og ikke noget, der har relation til Aarhus Universitet eller hans studier på universitetet. Det er ikke et udtryk for universitetets holdning, og han er heller ikke ansat her. Men vi undersøger i øjeblikket sagen nærmere, siger pressechef på Aarhus Universitet, Anders Correll.

Scrapet - ikke hacket

OK Cupid er ikke blevet spurgt om lov forud for indsamlingen af de mange data, der er offentligt tilgængelige via sidens egen søgemaskine, hvor man kan søge dem frem en efter en. Det kræver dog, at man har oprettet en profil og er logget ind.

De danske studerende har dog ikke gjort det store arbejde manuelt, men derimod med et værktøj, en såkaldt scraper, der har tappet OK Cupid for tilfældigt udvalgte brugerprofiler.

Disse mange data er samlet sammen i et datasæt, der er efterfølgende blev lagt ud på netstedet 'The Open Science Framework', hvor det kan hentes af andre med interesse i de mange data.

Skarp kritik

Kort efter offentliggørelsen blev de studerende ramt af en flodbølge af kritik på sociale medier. Blandt andet skriver Oliver Keyes, mangeårig medarbejder og nu forhenværende hos Wikimedia Foundation - fonden bag Wikipedia - at:

- Dette er uden tvivl den mest overdrevent uprofessionelle, uetiske og forkastelige dataudgivelse, jeg nogensinde har set.

DR Nyheder har været i kontakt med den studerende, EK, der ikke ønsker at kommentere sagen. På blandt andet det sociale medie Twitter forsvarer han dog offentliggørelsen med, at data i forvejen var offentlige, og at brugerne ikke fremgår med deres fulde navn.

Et minefelt

En af dem, der via sociale medier hurtigt rettede en skarp kritik af offentliggørelsen, er den sociologiuddannede Rasmus Munksgaard, der har speciale i at bedrive forskning på med samme, digitale teknikker.

- Her bevæger vi os ind et minefelt. Ja, du er gemt bag et brugernavn. Men samtidig kan man de-anonymisere folk, og gætte, hvem de er. Mange mennesker genbruger jo brugernavne, og hvis man samtidig har lokationsdata og alder, er det lettere, siger han.

Rasmus Munksgaard har i forbindelse med sit eget arbejde høstet data fra mange af nettets skjulte sider, fx narkohandelspladser på det særlige Tor-netværk.

- Argumentet om, at dette data i forvejen lå offentligt tilgængeligt, er problematisk, fordi det nu er lagt i en søgbar database. Man kan forestille sig, at nogen kunne søge efter alle homoseksuelle i et bestemt land. Det er ikke uproblematisk.

Det er endnu uvist, om der er begået noget ulovligt i forbindelse med sagen.

Rettelse 17/5: I en tidligere version af denne artikel, stod Oliver Keyes som ansat hos Wikimedia Foundation. Han stoppede imidlertid hos fonden for nogle uger siden, hvilket nu er rettet.