torstai 13. kesäkuuta 2019

Digitaalista historiantutkimusta Jyväskylässä (1/2)

Ensimmäistä kertaa sitten vuoden 2010 (sessio I, II&III, IV&V) matkustin Jyväskylään kuuntelemaan Kustaa Vaasa -seminaaria, jonne houkutteli "digitaalisen ajan historiantutkimuksen" ympärille rakennettu ohjelma. Jonka aloitti Pasi Ihalainen kertoen parlamenttipuheiden analyysistä minulle jo monista esityksistä tutuilla metodeilla, joiden hyötyjä kuitenkin Ihalaisen mukaan pitää perinteisen tyylin tutkijoille edelleen todistella.

Minä olisin kaivannut lisätodistelua siitä, että parlamenteissa esitetyllä puheella on jotain merkistystä tai vaikutusta, sillä Suomen eduskunnan täysistunnoista ei kovin vaikuttavaa kuvaa saa. Ohimennen tuli muuten todetua, että valtiopäiväaineistomme digitointiratkaisu "ei ole kehuttava" ja yleisöstä kommentoitiin, ettei siitä voi edes tehdä luotettavasti nimihakua.

Mikko Tolosen puheenvuoro tutkimuskysymysten merkityksestä laskennallisessa historiantutkimuksessa oli virkistävä verrattuna aiemmin esittämiinsä myyntipuheisiin. Enää ei ihmetelty digitaalisen historiantutkimuksen olemusta, vaan oli otettu uusi käsite ja annettu sille selkeähkö määritelmä, jossa viitattiin massadataan. Ei kannustettu merkityksettömään "datalla leikkimiseen", jolla saa korkeintaan aikaiseksi "lapsellista anakronistista" tuubaa. Vaan pitäisi tehdä huolella mietittyjä projekteja, joissa on useampia ihmisiä ja monta vuotta työtä. Tulevaisuuden ovet ovat edelleen kiinni.

Yleisökeskustelun lopuksi Tolonen korosti datan käsittelyn dokumentointia ja analyysien toistettavuutta. Palaan tähän vielä lopuksi.

Heini Hakosalon esitys syntymäkohorttitutkimusten historiasta sivusi digitaalisuuden vaikutusta tutkimuksen tekoon, mutta lopuksi Hakosalo herätteli kysymystä siitä, miksi kohorttitutkimuksien aineistot eivät kiinnostaneet historiantutkijoita. Yhtenä mahdollisena selityksenä, että niitä ei ole opettettu/ohjattu käyttämään.

Pohjoismaisten kielten tutkija Harry Lönnroth esitteli kielihistoriallista näkökulmaa digiaineistoihin. Hän mainosti Språkbankenia, johon en ole koskaan kurkistanut. Siinä on tekstikorpuksien (Korp) lisäksi sanakirjoja (Karp) ja kuten juuri toissapäivänä totesin, toisinaan sanojen merkityksiä on kiva (tai hyvä) tarkistaa kyseisen ajan sanakirjasta eikä pelkästään SAOB:sta.

Lönnroth tarjosi ajallista perspektiiviä digitaalisten aineistojen tutkimukseen mainiten, että Matti Rissanen oli artikkelissaan Three problems connected with the use of diachronic corpora jo vuonna 1989 tunnistanut riskin, että korpusten analyysimahdollisuuksia käyttävät eivät välttämättä viitsi paneutua teksteihin ja niiden kieleen.

Kansallisarkiston miehet vilauttivat supernopeasti käyttöliittymäluonnosta READ-projektissa koneluetuille 1800-luvun renovoitujen tuomiokirjojen ilmoitusasioille. Ilmeisesti olin (vaihteeksi) turhan pessimistinen pelätessäni viime lokakuussa, että tuloksia ei saada kaiken kansan käyttöön. Tosin nyt ratkaisu on sidottu Astian uuteen versioon, joten en löisi vetoa tuotantoversion julkaisusta ennen vuoden loppua, vaikka sellaista lupailtiinkin.

Lisäksi lupailtiin ilmoitusasioiden jälkeen tulevan esiin tekstitunnistettuna varsinaisia, mutta henkikirjojen taulukkorakenne on osoittautunut vaikeammaksi kuin oli odotettu. Kannattaa myös pitää mielessä, että tuomiokirjojen tekstintunnistus on tehty "ruotsiksi" eli suomenkieliset osat - mukaanlukien paikannimet - ovat heikompilaatuisempaa jälkeä.

Päivän lopussa oli kaksi esitystä valokuvista ja niiden jälkeen Pasi Nevalainen kertoi kokemuksistaan liiketoimintahistorian projektissa, jossa digitoitu (ja ilmeisesti koneluettu) asiakirjamateriaali oli viety tietokantaan. Hän asetti kyseenalaiseksi ratkaisun tarjoaman hyödyn tutkimukselle, mutta päätyi positiivisen puolelle.

Tekniikasta hän ei puhunut, mutta kertoi kohdanneensa historiantutkimukselle vieraan vaatimuksen metodin ja prosessin perusteellisesta kuvauksesta artikkelissa. Tästä aiheesta muistan olleen puhetta jollain Otaniemessä tarjotulla digihumanismipizzalla, jossa useat olivat sitä mieltä, että metodiselostusta pitäisi olla (erityisesti digitaalisessa) historiantutkimuksessa näkyvillä enemmän (sillä toistettavuus, ks. yllä). Mutta, kun todennäköisesti en ollut ainoa, jonka "metodissa" serendipiteetillä on (turhan) merkittävä rooli, lyhyessä keskustelussa ei päästy rakentavaan ratkaisuehdotukseen sopivasta dokumentaation yksityiskohtaisuudesta. Tässä siis vielä mietittävää.  

Päivän päätteeksi oli iloni istua seurassa, johon osui ihminen, joka oli samaa mieltä kanssani Helsingin kaupunginarkiston digitointiratkaisujen surkeudesta ja digitointien tiedottamisen olemattomuudesta. Miksiköhän en ole avautunut aiheesta koskaan Helsingin historiatoimikunnassa istuvalle tuttavalleni, joka istui saman pöydän toisessa päässä? Koska on niin paljon hauskempaa vain valittaa vuodesta toiseen?

Ei kommentteja: