torstai 10. joulukuuta 2015

DH-muistiinpanoja

Piipahdin tiistaina kuuntelemassa muutaman esityksen seminaarista Conceptual Change - Digital Humanities Case Studies ja istuin eilisen seminaarissa Digital History in Finland. Alla poimintoja 14 sivun muistiinpanoistani.

1) Kimmo Kettunen kertoi Historiallisen sanomalehtikirjaston OCR-laadun mittauksesta. Noin 65-70% sanomalehdistä koneellisesti tunnistetuista sanoista löytyvät verrokkiaineistosta ja loput ovat siis todennäköisesti virheellisiä. (Tosin osa omalaatuista kieltä tai painovirheellisiä.) Taannoisessa Myyräpelissä saatiin korjattua 65000 sanaa eli aivan olematon osa aineistosta. Järkevämpää ajankäyttöä on tehdä tekstitunnistus uudelleen ja käyttää myös jälkikorjauksia. Tätä yritetään ensi vuonna.

Joissain verkkopalveluissa varoitetaan koneluvun epätäydellisyydestä. Olisiko tarpeen sanomalehtikirjastossakin, kysyi Kettunen.

Reunahuomautuksena todettakoon, että Kettunen jakoi sanomalehtikirjaston käyttäjät kahteen ryhmään: maallikkokäyttäjät ja aktiiviset tutkijat.

2) Pasi Ihalainen totesi digitoitujen sanomalehtikirjastojen käytön olevan nykyään niin helppoa, että New York Timesin kirjoitukseen viittava opiskelija ei saa häneltä yhtään pistettä.

3) Norjalainen Maurius Warholm Haugen tutkii matkustamisesta kirjoittamista ranskalaisessa lehdistössä 1780-1820 hyödyntäen Gallicaan digitoituja lehtiä. Hän korosti ymmärtävänsä, että tämä tarkoittaa sitä, että hän ei kohdista hakujansa kaikkeen mahdolliseen ja valikoimaa vinouttaa muiden tekemät digitointipäätökset. Mutta näin hän on kuitenkin saanut mukaan julkaisutyyppejä, joita ei muuten olisi käynyt läpi. Gallica-haku tuotti nopeasti laajan katsauksen.

Haugen kehoitti "työkalureflektointiin" eli avaamaan tapaa, jolla esim. tietokantaa on käytetty. Mitä haettu ja miten. Pitää tiedostaa, että sama haku myöhemmin ei välttämätä tuota samaa tulosta, sillä palvelun ylläpitäjät voivat tehdä lisäyksiä ja muutoksia. Tästä kuulee mainintoja liian harvoin.

4) Ensi vuonna alkaa käsinkirjoitettujen tekstien tunnistusta työstävä EU-projekti READ – Recognition and Enrichment of Archival Documents, jossa Suomesta on mukana Kansallisarkisto. Projektin lopputulos on "epävarma". Sen sijaan Tampereen yliopistossa yritetään tosissaan käsinkirjoitetun tekstin tunnistusta sotakirjeistä, jotka ovat olleet käyttämättöminä arkistossa olemattoman luettelointitiedon tähden.

5) Risto Turunen tutkii suomalaisen sosialismin kieltä 1895-1918. Hän on muodostanut käsinkirjoitetuista sanomalehdistä korpuksen, jolla pystyy vertaamaan maaseudulla ja kaupungissa käytettyjä sanoja tai naisten ja miesten kirjoitusten eroja. Painetuista sanomalehdistä hän taas hakee eroja sosialististen ja ei-sosialististen julkaisujen välillä. Mielenkiintoista.

6) Ville Walta kertoi hankkeesta Codices Fennici, joka tulee DF:n ja Fragmenta Membranean rinnalle täydentämään kuvaa kirjallisesta kulttuurista ennen vuotta 1600. Käsikirjoitusten sanallisesta kuvauksesta en saanut oikein käsitystä, mutta sivuista tulee esille digikuvat. Erikseen mainitsi, että käsikirjoituksilla tulee olemaan pysyvä tunniste (dah?) ja mahdollisesti (?!) myös yksittäisillä sivuilla. Sitä voi tehdä elämänsä helpoksi ja tai vaikeaksi.

7) Leo Lahti esitteli Fennicasta ja KB:n Libriksestä tehtyjä tilastollisia katsauksia, joissa näkyi painovuosittain painopaikat ja jopa paperinkulutus. Jälkimmäinen perustui julokaisun kokoon ja sivumärään, mutta mistä saatiin painosmäärä?

8) Johanna Ilmakunnaksen mielestä museoiden verkossa avatut esinetietokannat antavat merkittäviä uusia mahdollisuuksia historiantutkimukselle. Etsimäänsä ei vaan aina löydä avainsanalla. Kalvolla vilahti myös kysymys siitö onko metadata riittävää ja kuka sitä on tuottanut. Työkalureflektointi [3] tarpeen.

9) Jaakko Tahkoluoto ei kertonut minulle mitään uutta Kansalliskirjaston digitaalisista aineistoista. Mutta muistutti, että varsinaiseen kirjastoon päästään taas 1.3.2016.

10) Charlotta Wolff oli alkanut tehdä väitöskirjansa valistusajan verkostoja uudestaan tietokoneella. Tämä mahdollistaa erilaiset ryhmittelyt helpommin ja nopeammin kuin kynä ja paperi. Verkostoanalyysiin hän on käyttänyt sovellusta Palladio.

11) Pekka Uotila dokementoi vanhempiensa säästämää materiaa arkistoluettelotyökaluun. Sanoi olevansa kiinnostunut järjestämisestä ja tarinankerronnasta. Projektin kulkua dokumentoitu blogissa.

12) Martti Häikiön viimeisimpiä julkaisuja on Itsenäisyys100-sivusto. Hän sanoi verkkosivuston tekemisen olevan aivan toisenlaista kuin kirjan kirjoittaminen. Verkossa ei ole tilarajoitteita ja voi tavoittaa monta eri yleisöä. Haasteena sitten luoda tarinankulku. Tämä oli ratkaistu käyttämällä rakennetta, jossa aina nostetaan esiin viisi asiaa.

13) Jessica Parland-von Essen palautti mieleen, että hän teki verkkokirjaprojektin Historia i en digital värld Kenneth Nybergin kanssa jo 2013-2014. Suunnitteilla on kirjan päivitys.

14) Helsingin yliopiston hankkeessa, jota edusti Timo Korkiakangas yritetään DF:n tekstien osien yhtäläisyyksien kautta luoda verkkomalli ja tätä kautta uutta ymmärrystä keskiajan yhteyksiin ja kirjalliseen kehitykseen. Mieleen tuli Tuomas Heikkilän tekstejä vertailevat tutkimukset, mutta en saanut kysytyksi oliko projektilla näihin yhteyttä.

15) Petri Pajun ja Mats Fridlundin projektissa suunnitellaan tutkittavaksi Suomen teollistumisen kansainvälisiä yhteyksiä vuosien 1880-1920 lehdistä. Toisin kuin norjalainen tutkija [3], Paju tiesi varmasti mitä lehtiä Suomesta kannattaa tutkia. Ja toisin kuin monet muut eilisessä seminaarissa (poislukien Ilmakunnas [8]) tarkoituksena on käyttää kotimaisen rinnalla ulkomaista aineistoa. Kansallisuus oli päivän sana.

Mutta kyseinen projekti ei tule käynnistymään, sillä Paju tekee seuraavan vuoden Koneen säätiön rahoituksella projektia
that will map out the past, present and future of digital historical scholarship in Finland. Such an investigation will allow to better assess the present situation and demands and make plans for the future.
16) Jukka Kortin esitys lehtihistorian tutkimisesta poiki yleisökysymyksen aikakauslehtien kuvallisuuden tutkimisen mahdollistamisesta. Hyvä kysymys!

17) Vuosia sitten kuuntelin radiojutun, jossa huomautettiin, että Etelä-Euroopan luolissa kalliomaalauksiin liittyy erityiset akustiset ominaisuudet. Mietitytti tietenkin oitis, miten Suomessa? Kiitos Riitta Rainion esittelemien tulosten tiedän nyt, että on mitatusti todistettu kuvakallioon liittyvä kaiku, jonka voi ajatella vastaavan pyhälle paikalle tulijalle. (Kolme tutkittua kohdetta sijaitsevat paikoilla, joissa vedenkorkeus on nyyään sama kuin kivikaudellakin.)

18) Panu Savolainen esitteli kolme asiakirjojen tarjoamaa näkymää Turun kaupunkitilan keskustaan ja reunamiin. Vuonna 1800 kerätty förmögenhetsuppskattningen (Ruotsin arkistossa ja siksi näkymätön sukututkimuksessa?) näytti arvokkaat tontit jokirannoilla ja kirkon läheisyydessä, kuten olisi odottanutkin.

Mutta ulkovalaistuksen ylläpidossa lusmuroineet ja oikeuteen päätyneet olivat ryhmittyneet aivan toisella tavalla. Osuivatko tietyt alueet valvonnan alle vai kokivatko kyseisissä kortteleissa asuneet valaistuksen tarpeettomaksi? Turun 106 kestikievaria oli vuonna 1777 luokiteltu neljään verotusryhmään keskeisyyden ja palvelun mukaan. Ilmeisesti jälkimmäinen oli merkityksellisempi, sillä kartalle sijoiteltuna kievarit olivat aivan sikin sokin.

19) Ilkka Jokipii ja Virva Liski olivat panneet kartalle valtiorikosylioikeuden tuomioita ja visualisointi kertoi yllättävän paljon vuodesta 1918. Mutta kertoiko uutta?

20) Kahvitauolla kuulin Viipurin historiallisen kaupunkikuvan tutkimusprojektista. Tulisikohan siinä järkevää käyttöä Arkistolaitoksen digitoimille rakennuspiirrustuksille?

Ei kommentteja: