keskiviikko 7. heinäkuuta 2010

Miten vähän yksityisyydestä on jäljellä

ACM:n tuoreessa lehdessä on mainio artikkeli yksityisyyden säilyttämisen problematiikasta, otsikkona Myths and fallacies of "personally identifiable information". Usein on lähdetty siitä, että yksittäisen henkilön toiminnasta, terveydestä tms. asioista kertova tieto tulisi anonymisoida, jonka jälkeen sitä voisi hyödyntää ilman suurempia riskejä yksilönsuojan loukkaamiseen.

Kirjoittajat demonstroivat (lukuisiin käytännön esimerkkeihin viitaten) kuinka anonymisoitu data voidaan suhteellisen helposti linkittää takaisin niin että henkilöllisyys paljastuu suurella todennäköisyydellä. Miljoonista ihmisistä on jo saatavilla netissä niin paljon informaatiota, että sitä yhdistelemällä voidaan luoda yksityiskohtainen profiili jota voidaan käyttään yksilön tunnistamiseen muissa yhteyksissä. Esimerkkinä voidaan käyttää vaikkapa tietyn ihmisen omistamia vaatteita tai kirjoja: vaikka yksikään vaate tai kirja ei sinänsä riitä identifioimaan yksilöä, mikä tahansa riittävän iso osajoukko näistä tavaroista yksilöi henkilön yksikäsitteisesti.

Kirjoittajien mukaan ainoa tapa välttää laajamittainen henkilöön liittyvien tietojen vuotaminen on sijoittaa yksilönsuojan kannalta problemaattiset tiedot keskitettyyn tietojärjestelmään, josta voidaan tehdä hakuja vain tarkkaan rajattujen kriteerien avulla. Tämä on kallis ja vaativa ratkaisu, ja edellyttää huomattavaa määrää ohjelmointityötä, säännöllisiä auditointeja ja niin edelleen.

Toinen vaihtoehto on sitten se, että yksilönsuoja katsotaan menetetyksi ainakin käsitteen laajassa merkityksessä: yksittäisey tietoalkiot ovat tunnistamattomia, mutta koska ne voidaan tietoteknisin menetelmin linkittää toisiinsa, kuka tahansa riittävät tietotekniset valmiudet omaava taho voi murtaa yksityisyyden suojan.

Asiaan liittyvät fysikaaliseen maailmaan liittyvät jäljittämisen menetelmät. Tuore tutkimus kertoo, että "nautittu pullovesi, limsa tai pienpanimo-olut voidaan jäljittää hiuksista maantieelliseen sijaintiin liittyvän, luonnollisen kemiallisen merkin avulla. [...] pullovesi, limsa tai pienpanimo-olut jättää hiuksiin kemiallisen merkin, jolla voidaan matkakohteet paikallistaa vielä matkan jälkeen. [...] isotooppi-kuviot ovat kuin kemiallinen sormenjälki, joka osoittaa, millä maantieteellisellä alueella henkilö on ollut."

Tämä tutkimus koskee vain rajallista määrää henkilöitä ja pienehköä maantieteellistä aluetta, mutta uskoisin sen olevan yleistettävissä koko maailman mittakaavaan. Eli ei kuin maahantulotarkastuksessa otetaan hiusnäyte ja tämä kertoo missä olet viettänyt viimeiset viikot ja kuukaudet.

Niin netissä kuin fyysisessä maailmassa hyödynnetään yhä tehokkaammin kehittyneitä tiedon louhinnan menetelmiä, jotkut puhuvat myös käsitteestä "computational intelligence". Tällä tiellä ollaan vasta alkumatkassa, saapa nähdä mitä seuraavaksi keksitään.

No, ei jotain pahaa ettei jotain hyvääkin. Samaisessa ACM:n lehdessä oli viittaus kirjoitukseen The Rise of the External Brain: "Google has become our external brain, sifting through the extended stores of knowledge offered by multitudes, helping us remember what we once found, and locating advice from people who have been where we now want to go."

Ajatus netistä (ja Googlesta) "ulkoisena aivona" tuntui aluksi osuvalta mutta hetken aikaa asiaa ajateltuani turhankin lennokkaalta vertauskuvalta. Ehkä tässä on kuitenkin syvällisempi kysymys pohjalla.

Netin kaaottisesti syntyvä ja jäsentymätön tieto ei ehkä tarkkaan ottaen pohjaudu samanlaiseen biologiseen paradigmaan kuin aivomme, mutta jonkinlainen "evolutiotiivinen" prosessi siinä on taustalla. Ja kun ottaa huomioon, että tietotekniikka - ja tuo aiemmin mainittu "computational intelligence" - etenee kohtuullisen rivakkaa vauhtia, vertaus ulkoisee aivoon ei ehkä ole niinkään kaukaa haettu.

Toki esimerkiksi kuvien tunnistamisessa netti on yhä aika huono, ajatellaan vaikkapa tilannetta että otat kuvan perhosesta tai korennosta ja haluaisin tunnistaa lajin - eipä kuvahakujärjestelmistä paljon iloa ole. Mutta tämä saattaa pian muuttua kun algoritmiikka (ja käytetty laskentateho) saavat rutkasti lisää potkua.

Ja pakko se on myöntää, kymmeniä kertoja päivittäin täytyy asioita tarkistaa netistä, ilman sitä olisi hyvin orpo olo.

Ei kommentteja: