keskiviikko 16. maaliskuuta 2022

Lisää "uudistuksia" Kansallisarkiston verkkopalveluissa

Tuskin olen Astiasta toipunut, niin Kansallisarkisto 10.3. kertoi julkaisevansa

uudistetun version sukututkijoiden suosimasta Karjala-tietokannasta keväällä 2022.
Yli 11 miljoonan tietueen tietokantaan on kerätty luovutettujen alueiden asukkaiden elämäntapahtumat: syntymät, kuolemat, muuttamiset, naimisiinmenot. Tietokannan nimestä huolimatta tietoja on myös muilta luovutetuilta alueilta, esimerkiksi Petsamosta.

Spontaani reaktioni oli "apua, ne tekee Katihan hausta vieläkin huonomman". 

Edellisenä päivänä Karjala-tietokanta oli jo tiedottanut, että "Karjala-tietokantatyöryhmän tallennustyö on päättynyt. Katiha.xamk-hakupalvelu toimii edelleen, mutta lisäyksiä/korjauksia sen tietokantaan ei enää juurikaan tehdä. Työryhmän toiminta loppuu 31.3.2022. " Eli olemme Kansallisarkiston varassa.

Mistä puheen ollen. Tiistaina Kansallisarkisto kertoi, että  

Kansallisarkiston suositut sisällissodan ja toisen maailmansodan uhreja käsittelevät tietokannat ajetaan alas maaliskuun 2022 aikana.
Tietokantojen koko sisältö on siirretty Sotasampo- ja Sotasurmasampo-palveluihin, jotka on kehitetty yhteistyössä Aalto-yliopiston kanssa. Kehityshankkeiden yhteydessä molempien tietokantojen sisältöä on päivitetty ja rikastettu.

Leuka loksahti totisesti auki. Sampojen ideanahan oli LINKITETTY DATA eikä fiksatun tietokannan esittäminen. En siis yllättynyt, että Hyvinkään historiaa tutkinut apulaisprofessori Anu Lahtinen oli pian tiedotteen julkaisun jälkeen kommentoinut

Hyvä varmaan sinänsä, mutta Sotasammossa tiedot yhdistyvät osittain virheellisesti, eli vanha on omassa käytössä ollut luotettavampi. Löytämieni virheiden perusteella näyttää esim. siltä, että hyvinkääläisiä kaatuneita ja Puolimatkan sankarihautoihin saletisti haudattuja on virheellisesti merkitty haudatuksi Kytäjän hautausmaalle. Vanhassa sotasurmatietokannassa hautausmaatiedot ovat oikein, joten ihmettelen, mistä virhetieto on tullut. Onko hautausmaa oletettu kirjoillaolopaikkakunnan (Hyvinkään mlk) mukaan? (Olen laittanut palautetta)

Kansallisarkiston tililtä vastattiin

Tässä vielä vähän lisätietoa: olemme tietoisia ongelmista, ja siksi suljettavien tietokantojen tietosisällöt julkaistaan avoimena datana kaikkien käyttöön. Vanhojen tietokantojen käyttöliittymät ovat tulleet käyttöikänsä päähän eikä meillä ole muuta mahdollisuutta kuin sulkea ne. Virheet pyritään korjaamaan mahdollisimman pian!

Lahtinen vastasi samaa, mitä olisin itsekin sanonut:

En tiedä auttavatko avoimet datapaketit kauheasti tällaista peruskäyttäjää, joka lähinnä toivoisi saavansa luotettavaa tietoa ilman ylimääräistä teknistä säätöä, mutta ehkä joku muu pystyy niitä käsittelemään, ja toivottavasti virheet saadaan korjattua.

Eikä Lahtinen ollut ainoa ongelmista kommentoinut.

Eikä Sampojen ylläpitoresursseista tai -organisaatiosta puhuttu tiedotteessa (myös KA:n omilla sivuilla) mitään. Myöskään Sotasampo-sivustolta ei löydy viitettä mihinkään pysyvämpään taustaorganisaatioon. Turkimusryhmä Semantic Computing Research Group on olemassa niin kauan kuin sillä on rahoitusta eikä tutkijoiden tehtävä ole palvelujen ylläpitotehtävät.

Ainoa täysijärkinen tiedotteen kohta oli lopussa: "Kansallisarkisto julkaisee tietokantojen sisällön myös erillisinä datapaketteina vuoden 2022 aikana.", mutta tässäkin on ongelmansa, kuten yllä todetaan. 

Jään jännittämään Katihan tulevaa osoitetta ja datan kohtaloa. Uskoni ja käsitykseni Kansallisarkiston ymmärryksestä historiantutkijoiden (muk.luk. harrastajat, sukututkijat ja satunnaiset isoisoisän etsijät) tarpeista datan dokumentoinnin, luotettavuuden ja esittämisen suhteen ovat alempana kuin koskaan. Ja tämä porukka kuvitteli uskottavuutensa kärsivän joukkoistetusta kuvailutiedosta! Låt mig skratta.

1 kommentti:

Sari Vahtera kirjoitti...

Aivan sama oli itselläni ensimmäinen reaktio, kun luin että Katiha siirtyy Kansallisarkiston alle. "Miten KA onnistuu tämän sössimään". Toki tässä oli taustalla jo hämmästys ja kummastus uudistetun Astian toiminnasta.