sunnuntai 7. helmikuuta 2021

Arviota AkatemiaSammosta

Perjantaina avautui jonkin aikaa odotettu AkatemiaSampo ja pääsin vertailemaan arvailujani Ylioppilasmatrikkeleiden linkitetyn datan mahdollisuuksista toteumaan. Lyhyesti: olin oikeassa skeptisyydessäni. Hieman pidemmin: jälleen on tehty prototyyppi, jonka korjailuun ja ylläpitoon ei ole rahoitusta. Uutta tietoa oli se, ettei tekemiseenkään ollut rahoitusta, mikä selittää venähtänyttä aikataulua. Iloinen yllätys oli se, että mukana on sekä Yrjö Kotivuoren vuodet 1640-1852 että Veli-Matti Aution 1853-1899. Hyvää uutta oli myös (muistaakseni) se, että Eero Hyvönen sanoi suoraan suomeksi, että tulokset pitää tarkistaa lähiluvulla. 

Avaustilaisuuden esityksistä kävi myös ilmi, että Yrjö Kotivuori oli tehnyt oman osansa Ylioppilasmatrikkelista alunperin tietokantamuotoon. Mutta kaikki päivitykset oli sittten tehty html-sivuihin, minkä takia linkitetyn datan vaatima rakenteistus oli tehtävä uudestaan tekstistä. Valitettavan hyvä tapausesimerkki tutkimusdatan hallinnan miettijöille.


Tältä pohjalta ei tietenkään päästy niihin ihmeisiin, joita sinisilmäisesti melkein uskalsin toivoa. Tiedolle tehdyn käsittelyn rajat tulivat esiin jo esityksen Runeberg-esimerkistä, jossa J. L. Runebergin lanko ei näkynyt vaimonsa veljenä. En saanut varsinaista vastausta chat-kysymykseeni siitä, minkälaista prosessointia oli tehty ja jätetty tekemättä. Lankosuhteen purku on - hetken ajateltuani, saamani vastauksen tuella - tehtävä, johon ihminen pystyy, sillä mahdollisen epäselvyyden yhteydessä käytettävissä on useimmiten tukimateriaalia. Pelkän ylioppilasmatrikkelin varassa virhetulkintoja voisi syntyä helposti, kun lanko tarkoittaa kahta eri asiaa, vaimoja voi olla useampia ja samoja sukunimiä molempien aviopuolisoiden suvuissa.

Tämän kaltaiset rajoitukset pitäisi (taas) tietää ennenkuin ryntää käyttämään AkatemiaSammon verkostoja. Sukulaisuussuhteiden osalta ne ovat siis olennaisesti puutteellisia. Akateemisten suhdeverkostojen pohjana on Jakob Flachseniusta tarkastellen tiedot hänen "ohjaamistaan" opinnäytteistä. Esisetäparalla ei häkkyränsä perusteella ole yhtään opillista jälkeläistä 1700-luvun alun jälkeen. Veljeänsä eli esi-isääni katsoin hieman tarkemmin ja totesin käyttöliittymän harhaanjohtavaksi. Siitä kun ei suinkaan hypännyt silmille ketju Johan Flachsenius > David Lund > Daniel Juslenius > Henrik Hassel > Jakob Gadolin > Henrik Gabriel Porthan> ..., jonka sain kokoon hyppien vanhan matrikkelin ja AkatemiaSammon välillä esityskalvojen esimerkin antaman vinkin perusteella.

Johanin kohdalla tietokantaan ajetuista kirjallisuusviitteistä puuttui muuten ainakin viimeinen eli "K. Kyläkoski, Flachsenius, muistiinpanoja (2009) s. 51". Mutta mitäs pienistä. (Palvelussa on palautelomake, mutta kuten alussa totesin, ylläpitoon ei ole varoja, joten täyttämisen hyöty on kyseenalainen.)

Merkittävää lisäarvoa rakenteistuksesta saadaan ainakin paikannimien osalta ja julkaisen toivottavasti ensi viikolla jonkin aikaa odottaneen koosteen, joka on nyt helppo tarkistaa ja mahdollisesti täydentää. Paikannimien ontologian aikadimensio oli ratkaistu nykyhetkellä, mikä on ihan yhtä validi ja problemaattinen vaihtoehto kuin kaikki muutkin. Paikkakunnat on ryhmitelty maakunnittain, mutta joukossa on myös Turun ja Porin lääni, sillä "aineistoissa, esim. ammateissa on paljon viittauksia 'Turun ja Porin lääniin'. Satakunta ja V-Suomi ovat varsinaisen hierarkian osia."

Jollain ilveellä, josta en kysynyt ja joka saattoi mennä esityksissä ohi, nykypaikkakuntien alle on ryhmitelty muita paikannimiä. Nykytilanteen mukaan nämäkin, eli Kauvatsa kuuluu Kokemäkeen, vaikka matrikkelien käsittelemänä aikana se oli osa Huittista. Harjavalta, joka oli kyseisenä aikana osa Kokemäkeä ei linkity nyky-Kokemäkeen, mutta Harjavallalla on rinnakkaisnimi "Harjavalta, Kokemäki". Ajattelutyö siis tarpeen, jos on etsimässä monimutkaisempaa kuin ensimmäistä Lapissa syntynyttä ylioppilasta.

Karttanäkymässä Peipohja ja maamieskoulu ovat samassa kohtaa kuin "Kokemäki" eli molemmat väärässä paikassa. Kokemäenkartano ja Vitikkala puolestaan oikein, mutta 60% tarkkuus ei ole kehuttava tulos. Muuttoliikkeen visualisointi henkilöpuolella on kyllä hieno. (Amerikkaan lähti Kokemäenkartanon herrassööringin poika Eugène Carl Jochum von Knorring, jota en ole laskenut Kokemäen siirtolaisiin.)

Paikannimiontologiasta sain siis otteen, mutta "Ammatit ja arvot" näyttää sillisalaatilta. Mitä selittää se, että 5043 nimikettä ei ole löytänyt vastinettaan AMMO/HISCO historiallisten ammattien ontologiassa. Ja tässä ryhmässä on päällimmäisten joukossa kirkkoherran apulainen, rovasti ja varapastori, joilla ei siis ole yhdistävää yläkäsitettä? Miten esityksessä sitten vilahti ammattiryhmiin jaettu kaavio? Kuuntelin ilmeisen huonosti. Esitykset ovat verkossa ja myös muuta dokumentaatiota tarjolla, joten sieltä voisi tarkistaa.

Esityksiä kuunnellessa ajatukseni harhailivat haavemaailmaan, jossa AkatemiaSampoon linkittyisi kaikenlaista dataa ja myös aineistoja kuten viime viikolla mainostetut Keisarillisen Aleksanterin-yliopiston väitöskirjat, niiden joukossa olevat oppilasluettelot, digitoidut tuomiokirjat ja paljon paljon muuta. Linkitetyllä datalla on ehdottomasti annettavaa historiantutkimukselle, mutta en oikein ymmärrä miten käyttökelpoisiin lopputuloksiin päästäisiin.

Ei kommentteja: