Eilen avattiin Biografiasampo, joka on uusin Eero Hyvösen ryhmän tuotoksista. SKS:n Kansallisbiografian tekstit on avattu verkkoon (ainakin) vuodeksi ja niihin (sekä paimenmuistoihinsa yms.) on linkitetty koneellisesti dataa. Asianmukaisen datamallin avulla ihmisjoukkoa päästään kääntelemään ennennäkemättömillä tavoilla.
Pyörittelyssä pitää pitää mielessä pohjadatan ominaisuudet sekä koneellisen yhdistämisen rajoitukset. Kyseessä on proof of concept /beta-julkaisu, jonka ylläpidolla ja jatkokehityksellä ei ole rahoitusta. Totisesti toivon, että täky innostaa jonkun rahoitukseen, sillä tältä pohjalta olisi eisen esittelyn perusteella mahdollisuuksia vaikka mihin. Erityisesti jos mukaan saataisiin Kotivuoren ylioppilasmatrikkeli.
Mutta mitä irtoaa nyt? Otin testikappaleeksi Juho Saarisen, jonka muistelmasta lainasin pätkän pari päivää sitten. Ajattelin helpoksi tapaukseksi, sillä hänen pitäisi esiintyä kahdessa palvelun tietokannassa ja lisäksi linkitetyissä lähteissä. Joten valitsin etusivulta sovellusnäkymän "Henkilöt" ja työnsin googlemaisesti hakukenttään sanat Juho Saarinen.
Tulos ei ollut mitä odotin, vaan pitkä pätkä Juhoja ja Saarisia, mutta ei ollenkaan sitä Saarista, jota hain. Vaihdoin hakusanan pelkkään Saariseen ja syntymäajaltaan varhaisin oli Eliel Saarinen. Avaamalla hänen näkymänsä, löysin hakemani, sillä Juho oli Elielin isä. Ymmärrettävästi KB:n datasta lukien tietonsa ovat minimaaliset, eikä niihin ole saatu linkitettyä mitään.
Mutta Juho Saarinen oli pappi ja Biografiasammon osana piti olla SKS:n tietokanta Suomen papisto 1800–1920. Ad fontes, sanoo historianharrastaja ja huomaa, ettei Saarista ole tietokannassa eikä näin ollen kyseiset olemattomat tiedot ole Biografiasammossa. Ja miksiköhän Saarista ei ole tietokannassa? No, siksi, että "Aluksi on julkaistu tiedot niistä papeista, joiden sukunimet alkavat kirjaimilla F–K."
Väliin F-K jää H, joten Biografiasammosta pitäisi siis olla pari Hohenthal-pappia. Haku nimellä Hohenthal ei tartu sukunimensä muuttaneeseen S. A. Harimaan, mutta löytää kyllä kolme pappia. Vanhin näistä on Otto Mauritz Hohenthal. Hänen nimensä on Klas Emil Hohenthalin isänä matrikkelitekstissään, mutta koneäly ei ole osannut tahi uskaltanut muodostaa välilleen sukulaisuussuhdetta. Sitä ei ole myöskään Klas Emilin poikaan Torsten Mauritziin eikä Lennartiin, jolla on kyllä toinen Klas Emil Hohenthal isänään.
Pappismatrikkelin teksti viliseen paikannimiä ja vuosilukuja, joista julkistusseminaarin mukaan piti syntyä tapahtumatietoja, joita voisi sitten ihailla kartoilla. Mutta Hohenthalien karttoihin on merkitty vain synnyin- ja kuolinpaikat.
Tietokantojen välisten linkitysten / identitettiyhdistelmien olemattomuuden todisteeksi vielä Jorma Harima, jonka isä Samuli Albert Harima (aiemmin Hohenthal) ei ole Biografiasammossa sama kuin Samuli Albert Harima, jolla on poika Jorma Harima, joka on tietenkin eri kuin ensiksi mainittu.
Ei ollut ensimmäinen kerta, kun Hyvönen onnistui herättämään hitusen turhan korkeita toiveita.
ihania! :)
VastaaPoista