Moje življenje (je) naprodaj
Marjan Kodelja 5. januarja 2018 ob 06:45

 »Sem 50-letni Slovenec, ki dvajset let dela v medijih in ves ta čas živi na istem naslovu, v severozahodnem delu Ljubljane. Imam dva otroka, sina v srednji šoli, kjer je priden učenec, in hčerko v devetletki. Vse družinske obveznosti redno poravnavam in nimam dolgov. Vozim nov avtomobil, te pa menjam vsakih šest let. Prometne nesreče nisem imel, vedno pa sklenem tudi kasko zavarovanje. Na spletu kupujem glasbo in kakšen film, pred leti pa sem nekaj časa v spletni trgovini kupoval tudi hrano in gospodinjske pripomočke. Moj letni prihodek je nekoliko nad slovenskim povprečjem. Vzorec nakupovanja imam vedno enak, enkrat tedensko z družino opravim večji nakup v velikem nakupovalnem središču. Čevlje in obleke kupujem enkrat letno. Vsako jutro se ob istem času odpravim od doma in prevozim enako pot. Od doma, mimo vrtca in šole do službe. Popoldne se odpravim neposredno domov. Kadar sem doma, je televizor ves čas prižgan, največ pa gledam dokumentarne televizijske programe. Knjig ne kupujem, ker bolj malo berem. Vsak dan na spletu preživim več kot pet ur, pri čemer je dejavnost na spletu enakomerno porazdeljena prek celotnega dneva. Poleti se z družino za dva tedna odpravimo na dopust na morje, pozimi pa nekajkrat skočim do bližnjih avstrijskih smučišč. Vsako drugo nedeljo popoldne smo z družino v Kranju. Vsaj dvakrat tedensko v večernih urah odtečem deset kilometrov s povprečnim časom. Z bližnjimi sosedi nimam stikov, se pa s prijatelji vsako soboto zjutraj dobimo na bližnji tržnici. Zdravstvenih težav nimam in ne obiskujem zdravnika. Imam eno škodljivo razvado (vsega pa tudi ne povem javno).«

V ozadju interneta se bohoti gospodarska panoga, vredna milijarde dolarjev letno. Njena edina dejavnost je sledenje, združevanje in prodaja podatkov, pridobljenih iz javno dostopnih zbirk podatkov ter iz zasebnosti ljudi. Sistemi, ki so jih ta podjetja postavila v internetu, neumorno beležijo vedenje uporabnikov. Aplikacije in storitve, ki jih uporabljamo vsak dan, ustvarjajo zapise o naši preteklosti. Zapisi v kombinaciji z javnimi zbirkami podatkov postanejo zgovornejši. Mnogo bolj, kot bi si mislili. Ne pozabimo na lokacijsko sledenje, ki ga več čas izvajajo mobilne naprave, zapise, ki jih delimo v družbenih omrežjih, spletne nakupe in podobno. Na podlagi zbranih podatkov algoritmi posameznega uporabnika uvrstijo v predal, v katerem je s podobnimi osebki. Skupne so jim želje, zanimanja, osebnostne lastnosti, zdravstveno stanje … Tako zbrani in organizirani podatki so na voljo vsem, ki so zanje pripravljeni plačati. Ne počnejo ničesar protizakonitega. Njihova dejavnost je legalna in skladna z zakoni o varstvu osebnih podatkov, ki globoko zaostajajo za zmogljivostjo tehnologij. Uporabniki interneta nismo več ljudje, temveč smo izdelki, s katerimi trgujejo. Pa če se s tem strinjamo ali ne.

Osebni podatki

Osebne podatke zbira državna uprava, zbirajo jih ponudniki storitev oziroma vsak, ki ima za to možnost. Po zakonu jih lahko prodaja zainteresiranim kupcem le v dveh primerih. Bodisi z dovoljenjem vsakega posameznika, čigar osebni podatki so v zbirki, ali če iz zbirke pred predajo izbriše osebne podatke, podatke, ki lahko enoznačno povežejo neosebne podatke s človekom. S tem ni nič narobe. Statistični urad, ki izdeluje statistiko uporabe na primer mobilne telefonije v izbranem letu, potrebuje podatke operaterjev, da izračuna povprečno uporabo, največjo, najmanjšo in druga statistična merila. Ne potrebuje imen in priimkov uporabnikov pri vsakem zapisu. Zanje je ta podatek brezpredmeten. Zanima pa jih na primer poštna številka, da izračunajo porabo po regijah. Zato poštne številke ostanejo v zbirki. Zbirka je na voljo tudi drugim kupcem, ki so zanjo zainteresirani. Operater se ne bo branil dodatnega prihodka in mu je vseeno, ali zbirko plača akademska ustanova, ki izvaja študijo, ali zasebno podjetje, ki se ukvarja s »sledenjem osebnim podatkom«.

Kateri pa so podatki, ki nas enoznačno identificirajo? V našem primeru se med take uvrščajo ime in priimek, naslov (brez poštne številke), davčna številka, EMŠO, enoznačne številke osebnih dokumentov, številke plačilnih kartic in nekateri drugi, bolj zapleteni zapisi. Gre tudi za podatke, s katerimi sami ne moremo identificirati posameznika, lahko pa to stori nekdo drug. V primeru številke plačilne kartice na primer banka.

Psevdonimni podatki

V brezosebnem zapisu pa lahko ostanejo podatki, kot so poštna številka, starost, spol. Ti se ne uvrščajo med osebne podatke, temveč med psevdonimne. Tako imenujejo osebne podatke, s katerimi ni možna identifikacija uporabnika brez uporabe dodatnih informacij. In ravno v tem je problem. Dodatnih podatkov, ki omogočajo, da so zgovorni tudi psevdonimni podatki, sploh ni težko dobiti. Drago morda, težko pa ne. Z globalizacijo (liberalizacijo) podatkovnih tokov imajo podjetja z nekaj znanja možnost, da med seboj primerjajo več zbirk. Vsaka posebej ne pove veliko, vse skupaj pa pravzaprav vse. Tako lahko identificirajo posameznika, o katerem vedo več kot on sam. Ne samo, kje stanuje, temveč na primer tudi kakšne želje in potrebe ima. Idejo, da je dovolj iz zbirke umakniti ime uporabnika, so strokovnjaki za računalniško varnost zavrgli že pred petnajstimi leti. Če vedo njegovo zdravstveno stanje, kje živi, kolikšen mesečni prihodek ima, koliko otrok ima in kakšno je njegovo dnevno gibanje, jih njegovo ime niti ne zanima. Kar pomeni, da je vzdržno brezosebljanje (anonimizacija) podatkovnih zbirk veliko več kot odstranitev nekaj osebnih podatkov po njihovi ozki definiciji.

Več podatkov imajo, lažje je

Več kot imajo podatkov, zbranih o posamezniku, lažje jih med seboj povežejo in večja je verjetnost, da pripadajo osebi, o kateri morda niti ne vedo, kdo je in kje stanuje. Dostikrat to v internetu niti ni najpomembnejše. Po podatkih podjetja Pew Research ima povprečni uporabnik Facebooka 338 prijateljev. To pomeni, če bi vse dejavnosti v tem krogu uporabnikov zbrali v zbirki podatkov, 338 podatkovnih zapisov o njem. Mobilni telefon lahko zbere na uro tudi do 500 zapisov. V zdravniški kartoteki imamo lahko nekaj tisoč zapisov. In tako naprej. Recimo, da v teh zbirkah ni niti enega osebnega podatka, ki bi kazal na nas. A če te zbirke primerjajo z na prvi pogled nezanimivi zbirkami, kot je preprost telefonski imenik, oziroma z zbirkami, kjer so osebni podatki, nas najdejo. Tako preprosto je. Ali drugače. Košček nepomembne informacije lahko postane osebni podatek, če ga je mogoče primerjati z velikim številom pomembnih podatkov.

Latanya Sweeney iz harvardske univerze trdi, da lahko 87 odstotkov Američanov unikatno identificira s pomočjo le treh podatkov: poštne številke, spola in starosti. Če je to mogoče v Ameriki s 320 milijoni prebivalcev, kaj je šele mogoče v Sloveniji z dvema. Ameriški primer ni teoretičen, temveč praktičen. Leta 1997 je guverner zvezne države Massachusetts dovolil objavo brezosebne zbirke podatkov o zdravstvenem stanju javnih uslužbencev in njihovih družinskih članov. Bolnik je bil v zbirki označen s številko, namesto z imenom in številko zavarovanja, poleg občutljivih podatkov o njegovem zdravljenju in bolezenskih stanjih pa so v zbirki ostali poštna številka, rojstni datum in spol. Sweeney je od države za dvajset dolarjev kupila volilni imenik, ki vsebuje imena, naslove, spol, starost in poštno številko volivcev. Nato je primerjala obe bazi in identificirala zdravstvene podatke guvernerja, ki je zbirko dovolil objaviti. Le šest oseb v mestu Cambridge je imelo isti dan rojstva, od tega so bili le trije moški in le eden je živel v njegovi poštni številki. Če imamo zgolj dve zbirki, ki obe poleg ostalih različnih podatkov vključujeta te tri psevdonimne podatke, lahko v vsaki zbirki najdemo zapisa, ki zadevata natančno določeno osebo.

Spremljanje mobilnih naprav

Lokacijski podatki, ki jih mobilne naprave nenehno pošiljajo na strežnik storitev in aplikacij, če te možnosti ne izključimo, nas načelno ne skrbijo, ker menimo, da so brezosebni. Med podatki pa je tudi številka (naslov) MAC, ki je unikatna vsaki napravi. Naslove zbirajo bližnja brezžična omrežja, čeprav vanje naprava ni priključena. Dovolj je, da se sprehodimo po dosegu z napravo v žepu, ki ima vključen vmesnik Wi-Fi. Podjetja, ki so specializirana za sledenje ljudem, vohunijo in iščejo vzorce gibanj. Ko na primer vsak delovnik ob isti uri zaznajo napravo z istim naslovov MAC, lahko ugibajo, da je njen lastnik zaposlen v bližnjem podjetju. Kontekst okolice, kakšna podjetja so v četrti, lahko naprej pove, da gre za finančnika. To je morda pretirano. V resnici naprave, s tem pa tudi njihove lastnike uvrščajo v kategorije življenjskih slogov, ki jih opisujejo različna gibanja ljudi prek večjega števila bližnjih brezžičnih omrežij. Eno samo omrežje ne zagotovi veliko uporabnih podatkov, če spremljajo gibanje naprave prek celotnega mesta, pa to pove veliko več o njenem lastniku. Oseba, ki je vsako jutro ob istem času v parku, je uvrščena na primer v kategorijo rekreativnega tekača.

Raziskovalci ameriškega MIT Media Laba so tudi v primeru teh zbirk dokazali, da niso tako brezosebne, kot trdijo operaterji. Pridobili so zbirko podatkov neznanega operaterja, ki je vsebovala brezosebne lokacijske podatke 1,5 milijona Evropejcev, zbranih v petnajstih mesecih. Raziskovalci so imeli pred seboj vzorce premikanja vsakega uporabnika v zbirki na ravni ure, le vedeli niso, kdo so. Za to so potrebovali dodatne informacije. Na primer podatek, da je neka oseba na svojem računu Facebook objavila fotografijo, ko je bila ob neki uri na točno določenem mestu. Dokazali so, da potrebujejo štiri takšne dodatne podatke (mesto in čas), pa lahko iz operaterjeve zbirke ne samo identificirajo uporabnika, temveč tudi obnovijo njegovo premikanje za celo leto nazaj. Za 95 odstotkov uporabnikov v zbirki. Polovico uporabnikov pa lahko najdejo, tudi če imajo zgolj dva para dodatnih podatkov. Zelo podobno kot v prejšnjem primeru identifikacije s poštno številko, spolom in rojstnim datumom. Če pa so podatki manj natančni, na primer da so v zbirki le lokacije uporabnika vsakih osem ur, je identifikacija še vedno možna, le več dodatnih podatkov je potrebnih. Zelo preprosto povedano: kadar koli imamo pri sebi svoj mobilni telefon, je našim potem mogoče slediti.

Naroči se na redna vsakotedenska e-poštna obvestila o novih prispevkih na naši strani.


 

Se moramo tega bati?

Če zbirke raziskujejo raziskovalci in statistični uradi, nam je vseeno, če imajo ti možnost, da nas prepoznajo. Analize in sledenje niso stvar prihodnosti, temveč se dogajajo danes. Ne v Sloveniji, ker smo premajhni in komercialno manj zanimiv, zato pa v večjih državah. Da morebitnih vladnih služb, ki jih je razkril Snowden, niti ne omenjamo. Sledenje na spletu in tudi zunaj njega je dnevno početje za to dejavnost specializiranih podjetij. Dokler pa se nam zaradi njihovega početja na zaslonu naprave prikaže le nam bolj na kožo pisan oglas, nam je vseeno. Mogoče nas oglas malo razdraži, a se pomirimo. Huje je, ko se zložijo vsi vidiki življenja posameznika, ki prinesejo nepričakovane posledice.

Nihče ne bi prostovoljno izdajal podatkov o sebi, o svojem življenjskem slogu, če bi videl, da lahko to vpliva na njegovo prihodnost. O tem se v tujini več govori, nas pa niti ne zadeva toliko. Uvrščenost v neki vedenjski vzorec lahko vpliva, ali bo oseba sprejeta na želeno univerzo, koliko jo bo stalo zdravstveno zavarovanje. Ker imamo razmeroma odprt izobraževalni sistem in solidarnostno zdravstveno zavarovanje, nas to, kot smo dejali, ne zadeva. Vendar so podatki o zdravstvenem stanju uporabni še kje drugje. Farmacevtska podjetja bi si jih še kako želela, pa tudi zavarovalnice, da trgovcev sploh ne omenjamo. Če bomo slišali, da je neko podjetje od slovenskega javnega zdravstva kupilo brezosebno bazo podatkov o bolnikih, posegih, uporabi zdravil, smo lahko prepričani, da tega ni storilo zaradi manj pomembne akademske raziskave. V ozadju so drugačna zanimanja.

Rudnik zlata

Profiliranje posameznikov se je začelo po napadu teroristov na newyorški trgovski center leta 2001, s ciljem, da se preprečijo morebitni novi takšni napadi. Ameriške vladne agencije so se trudile ugotoviti, kdo je povezan s terorističnimi aktivnostmi ali pranjem denarja. Zanje ni bilo pomembno le, da neka oseba to počne, morali so vedeti tudi, kdo je. Tedaj razvita orodja in metode danes uporabljajo zasebna podjetja. Finančno močna podjetja imajo moč vplivanja na spremembe zakonov. Kot primer: na evropsko uredbo o varstvu osebnih podatkov je bilo vloženih kar 7000 amandmajev. Prepričani smo, da večina prihaja izpod peres teh podjetij. Navzven svoje predloge argumentirajo kot »javno dobro«, kaj vse bomo dobrega zaradi novih pravil dobili državljani, v ozadju pa so njihovi zelo ozki poslovni interesi.

Internet vir dodatnih podatkov

Za identifikacijo posameznika iz brezosebne zbirke so potrebni dodatni podatki o njem, te pa dnevno pušča na internetu. Nosljive naprave za beleženje življenja so šele na začetku svoje poti, ko bodo splošno sprejete, bodo nov podatkovni rudnik. Eden mnogih. Mobilne aplikacije zbirajo več podatkov o uporabnikih, kot jih potrebujemo. Google že danes ve več o uporabniku, kot ta ve o sebi. Facebook enako. Spletni piškotki neutrudno beležijo našo aktivnost na spletu. Ko smo o teh stvareh pisali, smo vedno dejali, da če smo pazljivi, ne vedo, kdo smo. Danes vedo tudi to, saj zavestno osebne podatke vpišemo, ko se na primer prijavimo v družbeno omrežje. Pa tudi če jih ne, pomembnejšim storitvam zaupamo mobilno telefonsko številko zaradi večje varnosti, ki jo omogoča dvostopenjska zaščita uporabniškega računa. Tako Google kot Facebook podatke o svojih uporabnikih brez zadržkov prodajata. V brezosebni obliki, da ne bo pomote. Resnični problem ni v obstoju elektronskih zbirk, temveč v možnosti, da jih združijo na enem mestu.

Ko število podatkov, ki jih dnevno ustvarimo, raste in se zapisuje v zbirke, podjetja, ki se danes ukvarjajo s profiliranjem uporabnikov, že razmišljajo o naslednji fazi. To so že predvideli scenaristi filma Posebno poročilo (Minority Report). Z navzkrižno primerjavo podatkovnih zbirk želijo napovedati, kako se bomo obnašali v prihodnosti. Takrat pa pozabimo na svobodno voljo. Odločitev, kaj bomo videli, kaj bomo kupili in na kaj se bomo naročili, bo sprejel nekdo drug. Le predstavljena bo tako, da bomo mislili, da smo se odločili sami. Kar bomo obdržali, bo le naše ime. Prihodnost bo še zanimiva.

Avtor Marjan Kodelja
mm
Marjan se s tehnološkim novinarstvom ukvarja od leta 1997 in v tem času je videl že mnogo stvari, ki se nikoli niso uveljavile ali pa so imele kratek čas trajanja. Začel je pri računalniški reviji Moj mikro in ter 2000 postal njen urednik. Veliko kasneje je bil urednik naprej tednika Stop in nato še tednika Vklop, trenutno pa kruh služi s pisanjem tehnoloških člankov.
Marjan Kodelja - prispevki
Brez komentarjev

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja