keskiviikko 17. helmikuuta 2021

Kyseenalainen henkilötietokanta

Minä en väitä olevani henkilötietokantojen laillisuuden asiantuntija. Mutta tein vuosia kansainvälisessä suuryrityksessä töitä asiakastietojen analyysin kanssa eli opin perusteita siitä, mitä tiedoilla saa yleensä ottaen tehdä. Lisäksi, vaikka en sukututkimuksessa ole eläviä ihmisiä suuremmin keräillyt, olen yrittänyt pysyä kärryillä noudatetuista lakien tulkinnoista. Varmuuden vuoksi kurkistin ennen alla olevan kirjoittamista Tietosuojavaltuutetun sivuille, jossa otsikon Henkilötietojen käsittely alla lukee edelleen tutun omaiset vaatimukset:

  • kerättävä ja käsiteltävä tiettyä, nimenomaista ja laillista tarkoitusta varten
  • kerättävä vain tarpeellinen määrä henkilötietojen käsittelyn tarkoitukseen nähden
Uudistuneista asioista poiminta sivulta Rekisteröidyn informointi:
  • Jos henkilötiedot kerätään muualta kuin rekisteröidyltä itseltään, tulee henkilötietojen käsittelyä koskevat tiedot toimittaa rekisteröidylle kohtuullisen ajan mutta viimeistään yhden kuukauden kuluessa
Intron jälkeen asiaan. Eilen illalla kuuntelin tallenteena Kansalliskirjaston saman päivän Missä mennään -webinaarin. Yksi esityksistä käsitteli ilmeisesti suhteellisen uutta Kantoa eli kansallisten toimijatietojen tietokantaa, joka perustuu aiemmin (jonkun) kirjastoväen käytössä olleeseen tietokantaan. Ilmiselvästi kyse ei ollut vuosi sitten alkaneesta työstä identiteettien hallitsemiseksi vaan muusta, joten kurkkasin ja hain "tietenkin" ensimmäiseksi itseni. (Näyttökaappauksesta poistettu syntymävuoteni. Kiinnostuneet saavat hakea sen itse esiin.)


Sain tietää olevani sukututkija ja tietokirjailija toiminta-alanani fysiikka, historia ja sukututkimus. Ilahduttavasti tiedon lähteet eivät jääneet epäselväksi, sillä niiksi oli merkitty DIA-matrikkeli, Hesarin henkilöhaastattelu ja eka omakustanteeni vuodelta 2004. Kun kannan tarkoituksena on tukea kirjojen luettelointia ja ihmisten yksilöintiä, ymmärrän, että omakustannetta pyöritellyt on päätynyt sanoihin sukututkija ja sukututkimus. Ajatus stemmaa alakulman tietoon "Luotu 15.4.2005"

Tuolloin oli käytössä DIA-matrikkeli, josta (ilmeisesti) on saatu yksilöintiin tarvittava syntymävuosi, joka on tietokannassa yleisesti täytetty kenttä. Matrikkelista on myös keksitty fysiikka, joka ei suinkaan ole "toiminta-alani" eikä edes liity DI-työstäni tehtyyn julkaisuun. Mutta miksi on nähty tarpeelliseksi kirjata tietokantaan tutkintoni suoritusvuosineen sekä matrikkelissa mainittu työnantajani?  

Täysin mysteeriseltä tuntuu Hesarin haastattelun käyttäminen tietokannan täydentämiseen. Sen julkaisun aikaan minulla oli jo yksi yhtenäinen identiteetti kirjastotietokannoissa ja yhtenäistä linjaa edustava tuotanto, joten tulevien kirjojen linkitys minuun ei vaatinut termejä tietokirjailija ja historia, jotka jutusta lienee poimittu. Seurataan kirjailijoiden mainintoja mediassa? Kuitenkaan vastaavia lähteitä ei näkynyt huomattavasti enemmän mediassa olleella kaverillani, josta on tehty samanlainen Hesarin henkilöjuttu. Useita kirjoja kirjoittaneella tuttavallani, joka esiintyy medioissa useita kertoja vuodessa, ainoa lähdeviite oli yliopiston verkkosivu reilusti yli 10 vuotta sitten ja tietojen taso tämän mukainen.

Laitoin illalla yläreunan palautenapilla viestin, jossa pyysin poistamaan entisen työnantajani, jolla ei ole mitään tekemistä minkään julkaisuni kanssa. En epäile, etteikö tieto häviä. Mutta kuinka moni älyää käydä tietonsa tarkistamassa? Kuinka moni kirjoja tehnyt tietää syntymävuotensa olevan julkisesti nähtävillä enemmän tai vähemmän paikkaansa pitävien muiden tietojen kanssa? Tsekkasin pari tuttua, joista toisella oli vähemmän ja vanhentunutta tietoa kuin hän todennäköisesti toivoisi ja toisella taas oli väitöstiedotteesta poimittu talteen syntymäpaikkakin. Että jos vaikka sattuisi jostain ilmaantumaan toinen Suomen historian tutkija, jolla on sama nimi ja syntymävuosi, niin on sitten joku erottava tekijä? Onko tiedon keräyksessä tosiaan noudatettu edellä lainattua ohjetta tarpeellisesta määrästä?

FB-kaverit tarkistivat omia tietojaan iltamyöhällä. Yksi ei löytänyt itseään, vaikka nimensä on todistetusti ollut kirjan kannessa. Finnasta haetuissa julkaisuissa oli virheitä eli siellä on yhdistetty/sekoitettu kaimoja toisiinsa. Outoja toiminta-aloja oli. Maininnat tutkinnoista eivät olleet kattavia eivätkä ajantasalla, tietenkään. Tittelit olivat vanhentuneita, tietenkin. Niitä ei missään tapauksessa pysty pitämään yllä, mikä asettaa kyseenalaiseksi alkuperäiset kirjaukset. Sillä alussa mainittua sivua lainaten, henkilötiedot on "päivitettävä aina tarvittaessa ‒ epätarkat ja virheelliset henkilötiedot on poistettava tai oikaistava viipymättä". Ennen siirtoa verkkoon henkilöillä (ainakaan minulla) ei ollut edes tietoa kannan olemassaolosta, joten he eivät voineet tietojaan tarkistaa. Nyt kun tiedot ovat esillä ja ne näyttävät satunnaiselle harhailijalle voimassaolevilta, niiden pitäisi sitä myös olla.
 
Tietokannalla on varmasti validi tarkoitus, mutta tietokirjauksien sisältö ja laatu vaihtelee niin voimakkaasti, että yksi tuttavani totesi "herää vaan kysymys mikä on taas tämmösen sekametelisyltyn hyöty ylipäänsä...". Onko kaikki tieto todella tarpeellista? Jos on, sitä pitäisi olla kattavammin. Ellei, sitä pitäisi poistaa. Poistettava olisi myös vanheneva tieto, jos sen ylläpidolle ei ole prosessia. Ja jollain ilveellä pitäisi saada kaikille rekisteröidyille tieto siitä, että he ovat rekisterissä!

3 kommenttia:

Anonyymi kirjoitti...

Hei, kuten sanoin esityksessäni, datan julkaistaminen tuo päivänvaloon myös ne puutteet ja virheelliset tiedot, joita tietokannassamme on. Sanoin myös, että kaikki palaute on tervetullut! Kuvailu tehdään yleensä siinä ajassa, jolloin jokin kirja tms. ilmestyy. Kuvailija on niiden tietojen varassa, joita julkisista tiedonlähteistä on saatavana sillä hetkellä. Jos kirjojen tai muun aineiston julkaisemisen välissä tulee pitempi tauko, silloin tietokannassa olevia tietoja ei päivitetä muuten kun tekijän pyynnöstä. Kanto ei ole pelkkä henkilötietokanta, vaan tiedot henkilöistä ovat asetettu kontekstiin aineistoikkunan kautta. Meillä on lailliset perusteet siihen, että kuvaillaan aineistoon liittyviä tekijöitä, jotta nämä voidaan erottaa toisistaan myös 50 vuoden päästä. Lisätietoja tietosuojasta löytyy täältä: Asteri, KANTO, ISNI ja Melindan kuvailutiedot (https://www.kiwi.fi/x/PIGnC). Mielelläni vastaan kysymyksiin, tiedät, mistä minua tavoittaa :) Ystävällisin terveisin Katerina Kansalliskirjastosta P.S. Olemme hankkineet Asteri-tietokannassa oleville toimijoille ISNI-tunnuksia, myös sinullakin on sellainen.

Anonyymi kirjoitti...

Mikä tuossa on henkilötietojen käsittelyn peruste, ja miten rekisteröityjä informoidaan?

Anonyymi kirjoitti...

Hei, yllä olevan linkin (https://www.kiwi.fi/x/PIGnC) takana löytyy vastaus kohdasta 3. Minkä takia me saamme käsitellä henkilötietojasi eli mikä on käsittelyn oikeusperuste?. Jos on kysyttävää, laitathan meille sähköpostia (yhteystiedot löytyy täältä https://www.kiwi.fi/x/m4GQB). Katerina Kansalliskirjastosta