keskiviikko 3. heinäkuuta 2019

Tunnistetut käsialat

Suomen oloissa oli erikoista nähdä juhannuksen jälkeen Kansallisarkiston koko vanha tutkijasali täynnä ihmisiä, mutta näin oli EU-tason READ-projektin päättäjäisseminaarissa. Siitä julkaisi Mari Välimäki ajatuksia tuoreeltaan ja Kansallisarkiston omassa tiedotteessa on ohjelma tiivistettynä, mutta puran muistinpanoistani näin jälkijättöisesti pari pointtia.

Transkribus-softa on siis selvittänyt käsialoja ja fraktuuraa hämmentävän hyvin, kuten kävi ilmi jo lokakuussa ja palautettiin mieleen Jyväskylässä kesäkuun alussa. Käyttö on jatkossa muuttumassa joiltain osin maksulliseksi, mutta yksityiskohdat tuntuivat olevan epäselviä. READ jatkuu osuuskuntamuodossa.

Haasteellisinta ohjelmalle on käsialojen vaihtuminen, kielten sekoitus ja taulukot. Viimeksi mainitusta suomalaisesta aineistosta yritettiin koeaineistona henkikirjoja ja kun en koskaan pysähtynyt asiaa miettimään, jäi Jyväskylän esityksen jäljiltä epäselväksi se, mikä niissä oli hankalaa. Nyt kun näki esimerkkejä.... henkikirjojen talouksiahan ei ole rajattu viivoin, joita kuitenkin on jokaisen rivin alla. Eli ota siitä sitten selvää.

Amsterdamin kaupunginarkistossa on yhdistetty joukkoistus ja koneluku. Aiemmin notaarien asiakirjoista olivat vapaaehtoiset poimineet nimiä ja nyt he korjaavat 1600- ja 1700-luvun käsialojen konelukua. Kun vertaa Helsingin kaupunginarkiston digitaaliseen tarjontaan, itku meinaa päästä. Ja muistista pukkasi tieto, että Turun kaupunginarkistossa digitoitu materiaali luvattiin marraskuussa 2018 "lähitulevaisuudessa asiakaskäyttöön"...

Kansallisarkisto ei suunnittele joukkoistusta, mutta proaktiivisesti jakoi seminaarin jälkeen FB:ssä sukututkijoiden näkyviin 1800-luvun tuomiokirjojen ilmoitusasioiden testialustan linkkiä. Yhdessä FB-ryhmässä kaipailtiin rippikirjoja ja muistettiin, että niihin koneluku ei vaihtelevien käsialojen ja muotojen vuoksi ollut toiminut. Toisessa ryhmässä useampi kommentoi "upeeta", vaikka heti huomattiinkin, että haussa kannattaa käyttää erilaisia kirjoitusmuotoja nimille.

Välimäki haikaili tekstissään ymmärrettävästi 1600- ja 1700-luvun käsialojen lukumallia. Mutta Stenfelt-projektin palautettua minut 1800-luvun käräjäpöytäkirjojen ääreen kymmenen vuoden tauon jälkeen konkretisoitui syy, miksi niihin kohdistuu huomattavasti vähemmän tutkimusta kuin aiempiin vuosisatoihin. Ovat nimittäin varsin työläitä läpikäytäväksi, kun yksistä käräjistä syntyy satoja sivuja pöytäkirjaa. Näkisin siis, että teknisisestä syystä tehty valinta tarjoaa Ihan Oikealle Tutkimukselle merkittäviä mahdollisuuksia, joihin toivottavasti tarjotaan.

Sitä, että sukututkijat tulevat hyödyntämään sekä ilmoitusasioiden että luvattujen varsinaisten hakumahdollisuuksia, en epäile hetkeäkään. Sen sijaan en edellenkään löisi vetoa sen puolesta, että kyseinen mahdollisuus julkaistaan uuden Astian yhteydessä tämän vuoden puolella. Mutta, jos olen väärässä, niin hieno juttu.

P. S. READ/Transkribus ei tietenkään ole maailman ainoa hanke käsialojen koneelliseen lukemiseen. Ruotsissa Tomas Wilkinson on äskettäin puolustanut artkkeliväitöskirjaansa Learning based Word Search and Visualisation for Historical Manuscript Images.

Ei kommentteja:

Lähetä kommentti