tiistai 6. helmikuuta 2024

Kurkistin Suomalaisen kirjallisuuden atlakseen

Postilaatikkooni tuli viikko sitten Turun yliopiston tiedote, jossa hehkutettiin uutta verkkosovellusta, "josta löytyvät vuosina 1870–1940 ilmestyneet suomalaiset teokset, niiden kirjoittajat ja tapahtumapaikat". Tavanomaiseen ja tuttuun tapaan siis annetaan ymmärtää, että tietokanta kattaa "kaiken". Syvä huokaus. Hankkeen omilla sivuillakaan ei käytetä partitiivia enkä löydä mistään kuvausta siitä, että tosiasiallisesti on (kai) käytetty enimmäkseen Kansalliskirjaston digitointeja sekä usein niihin perustuvia Projekti Lönnrotin litterointeja, jotka kattavat vain murto-osan suomalaisesta kirjallisuudesta. 

Varsinkin kuin suomalaiseksi kirjallisuudeksi on atlaksessa nähdäkseni ymmärretty ainoastaan suomenkielinen. Käännösten osalta rajausperuste jää epäselväksi, sillä mukana on Toini Topeliuksen Kehitysaikana: tytöistä (1890), jonka alkuperäisteos on I utvecklingstid: En berättelse om flickor (1889), mutta ei yhtään isänsä teosta.

Siitä, että tietokannan sisältöä ei kuvata rehellisesti ja selvästi saa meikäläisen arvioinnissa reilut miinuspisteet. Myös "nimentunnistusteknologian" soveltaminen jää epäselväksi. Mutta olennaista on, että paikkoja ei ole (tietenkään) poimittu käsipelillä eikä niitä ole myöskään sijoitettu kartalle ihmistyöllä. Tosin ohjeista selviää, että virheitä "on pyritty manuaalisesti karsimaan, mutta suuresta aineistosta jokaista virhettä ei voi poistaa käsityönä." Kyseessä on siis sekasikö.

Tällä pohjustuksella testauskeissiin eli (tietenkin) Kokemäkeen. En keksinyt tapaa tehdä hakua suoraan karttanäkymästä, mutta sen perusteella Kokemäellä oli vain kolme relevanttia paikannimeä: Kynsikangas, Kokemäki ja Vitikkalanluoto. Syötin nämä sitten yksitellen paikannimihakuun.

Selvisi, että Kynsikangas esiintyi kerran molemmissa Lauri Haarlan romaanin Nuori pirkkalaispäällikö osissa. 

Klikkaamalla kirjan nimeä sain tietää, mitä muita paikkoja oli mukana ja Kokemäki oli vahvasti edustettuna. En keksinyt miten yksittäisestä paikasta olisi päässyt oikeaan kohtaan tekstiä, joka alkoi paikannimien jälkeen, mutta onnekkaasti huomasin pian yhden Kokemäkeä koskevan kohdan:

Keväthölskeeseensä joutui tyyni Loimijokikin ja ujutteli tulvavetensä kohti Kokemäkeä, jossa Pahdingin ja Lammaisten kosket karjahtelivat, syöksyivät suvantoihinsa ja painuivat välkeänä kymenä kohti Teljän kauppalinnaa.

Täälläkinpäin, Pyhänkorvan kauppapaikalla, Rakkulaisten Saksankivillä ja suvantojen markkinakentillä oli jo varastoaitat tyhjennetty.

Kokemäellä ei ole Rakkulaisia, mutta Kakkulainen, joten ensimmäisenä heräsi kysymys tekstin lähteestä. Sitä varten piti tehdä erillinen teoshaku, josta selvisi lähteeksi Projekti Lönnrot. En siis päässyt tarkistamaan, oliko kyse litteroijien virheestä vai Haarlan keksinnöstä. Pahdingin koski tarkoittanee samoin Pahringin koskea.

"Loimijokikin" on koneellisesti tunnistettu paikannimeksi, mutta päätteen irroitus ei ole onnistunut ja yhteys Loimijokeen on jäänyt muodostumatta. Paikkatieto, johon on yritetty liittyä, on identifioitu Wikidatan ja Open Street Mapin tunnistein, sillä paikkatieto ei rajoitu Suomeen. Jos olisi rajoituttu Suomen paikkoihin, linkittyminen Nimisammon aineistoon olisi tarjonnut historiallisienkin nimien, kuten Pyhänkorvan, paikat.

Paikoista puheen ollen, suurimman yllätyksen tuloksista antoi Vitikkalanluoto. Vaikka Nimisammon mukaan Suomi on täynnä paikkoja nimeltä Vitikka tai Vitikkala, niin ainoa käytetyllä metodilla ja aineistoilla löydetty oli Vitikkalanluoto, johon näin ollen yhdistettiin Eino Leinon esikoisromaani Tuomas Vitikka, jonka "Vitikkala ei ole mikään pikkutila" vaan "jo manttaaliltaan yksi Keski-Suomen suurimpia". Eli joillakin sadoilla kilometreillä meni pieleen.

Testatakseni paikannimien poiminnan kattavuutta googlasin 'Kokemäenkartano site:gutenberg.org' ja vähäisiin tuloksiin tuli mukaan Kyösti Wilkunan Suomalainen linnanneiti josta tuli kuningatar, jossa Kaarlo-kuninkaan läänityksiksi oli "myönnetty Raaseporin ja Korsholman linnat sekä Kokemäen kartano". Tämä kirja ei ollut atlaksen Kokemäki-tuloksissani, vaikka kirja siellä on. Kokemäen kartano oli tunnistettu paikannimeksi (luokkaan FAC, joka ohjeen mukaan on "ihmisen tekemä rakennelma"), mutta sitä ei oltu yhdistetty paikkaan Kokemäenkartano eikä erikseen kirjoitttamisesta huolimatta Kokemäkeen. Kun paikkahakuun kirjoitti Kokemäen kartanon, selvisi, että se esiintyy kertaalleen myös Kaarlo Hännisen kirjassa Suomen samoilijat II.

Kun paikannimihaku oli esillä, niin työnsin siihen vielä sukunimeni. Selvisi, että Arvi Järventaus oli kehitellyt romaaniin Kaukainen onni. Kertomus etsijän ikävästä (1922) Kyläkoskenrannan ja Kyläkosken, joka oli nimensä mukaisesti koski. Nimisammon mukaan Suomessa on viisi Kyläkoski-nimistä koskea ja kaksi taloa. Mihinkään näistä ei ole tietokannassa linkitystä, ehkä siksi, että se on käsityönä poistettu?

Forsby on Wikidataan nojautuen "Helsingin 26. kaupunginosa" ja sijoitettu kartalle tämän mukaisesti. Nimi esiintyy ainoastaan (?!) Betty Elvingin kirjassa Härkmanin pojat, jossa se on eksplisiittisesti "Pernajan Forsby". Ei pysty kaikki ohjelmistot vielä kaikkeen.

Edelleen käynnissä olevan paikallishistoriallisen harjoituksen puitteissa tein vielä Töölö-haun, jonka runsaiden tuloksien setvimiseen meni tovi. Eksploraatioon tietokantaa voi siis suositella.

Ei kommentteja: