keskiviikko 24. lokakuuta 2018

HELDIG-summitissa kuultua


Istuin eilisen HELDIG summitissa, jossa oli reilu tusina esitystä, joten mainitsen vain itselleni merkityksellisimmät.

LODI4DH. Vaikka juuri Biografiasammon-julkaisuseminaarissa taas tiedostin, että Eero Hyvösen esittämä vaikuttaa aina paremmalta, kuin miksi todellisuus paljastuu, visioimansa linkitetyn data-infrastruktuurin osana mainitsemansa historiallisten paikkojen ontologia on niin kovin houkutteleva. Sillä mahdollistaisi unelmani yhden paikan lähteiden vaivattomalle käytölle. Mutta vain, jos ontologia on niin yksityiskohtainen, etten eksy (kuten pari päivää sitten) hakemaan Pirkkalan kylää Hämeen läänin henkikirjoista, kun se oikeasti oli Turun ja Porin läänin puolella.

Newseye. Kolmen muun EU-maan kanssa tehtävä Kansalliskirjaston sanomalehtidigitointien eteenpäin käsittely kuullosti hyvältä ja hyödylliseltä niin kauan kun puhuttiin OCR:n rakenteistamisesta. Mutta että automaattinen ja personoitu luonnollisella kielellä kirjoitettu tutkimusraportti.... Toivottavasti minulla on mahdollisuus kuulla projektista jossain vaiheessa pidempi esittely.

NameSampo. Vaikka Sampoja kohtaan (ks. linkki edellä) on jo muodostunut tietty aversio, niin tämä Nimiarkiston ja paikannimirekisterin yhdistelmä näytti lupaavalta. Sillä Nimiarkiston hakuominaisuudet ovat joko todella surkeat tai logiikka älyäni ylempi. Nimisampo on tulossa käyttöön joskus talven aikana, jolloin palannen sen todellisuuteen.

A Shared Agent Metadata Service for the Memory Organization Sector. Niin alkutekijöissään oleva Kansalliskirjaston projektiajatus, ettei sillä ollut näppärää lyhennettä eikä nimeä. Mutta ottaen huomioon, että toisessa Kansalliskirjaston esityksessä mainittiin erityiseksi haasteeksi identiteettien hallinta, niin tälle olisi tilausta.

Tieteen termipankki. Tästä olin toki kuullut, mutta esityksestä tuli mieleen, että setistä voisi olla käytännönkin hyötyä. Turun verkkokurssille pitäisi tällä viikolla jossain välissä pykätä essee katekismuksesta, joten hain sitä. Teksti ei varsinaisesti auttanut, mutta tarjosi lainauksen siitä ainoasta katemismuksesta, jonka olen lukenut kannesta kanteen. Strindbergin Pienestä katekismuksesta

Haa... nyt tiedän, miksi luulin, ettei katekismuksessa ole muuta kuin kysymyksiä ja vastauksia. Eli oli hyötyä sittenkin.     
Vad är religion? 
Ett på lägre utvecklingsstadier uppkommet behov, som av överklassen begagnats för att hålla underklassen under sig. 
Ja kas, suunnilleen se teesi, jonka ympärille esseeni olin ajatellut muotoilla

Automated Subject Indexing and Classification Using Annif. Osma Suomisen Finna-datalla kehittämä automaaginen asiasanoittaja Annif on nyt ilmeisesti uusi versio verrattuna siihen, jota ainoastaan yhden twiitin verran raportoin huhtikuussa 2017. Seminaarissa testasin mobiiliversiota  m.annif.org kuvaamalla (!) pienen pätkän matkailumainosta muistiinpanopaperini kääntöpuolelta ja asiasanoja kertyi melkein tekstin pituuden verran. En muista millä testasin viime vuonna, mutta jos uskallan, täytyy kokeilla blogiteksteilläni.

Osana kehitystyötä Suominen oli työntänyt ohjelman läpi suomenkieliset Wikipedia-sivut ja selvittänyt, että yleisimpiä aiheita ovat jalkapallo, jääkiekko ja muu urheilu. Mikäpä merkityksellisempää.

Finnish National Bibliography Fennica as Linked Open Data. Suomisen myöhemmässä esityksessä saimme vastauksen retoriseen kysymykseeni. Fennica linkitettynä datana kertoi, että 1,2 miljoonassa kirjatietueessa useimmin esiintyvän henkilöt ovat Jeesus, Mannerheim ja Alvar Aalto. 

Tätä systeemiä testasin jo joulukuussa 2017, mutta en tajunnut että muutos MARC-tietueista linkitettyyn dataan ei ollut pikkujuttu. Suominen kertoi, että joka kirjastossa on keksitty oma ratkaisu ja suomalainenkaan ei kaaviona suoraviivaiselta vaikuttanut. Suunnitelmana on lisätä ulkoisia tiedonlähteitä, mikä kuullosti hyvältä. (Tosin parhautta olisi identiteettihallinta. Ks. yllä.)

SuALT. Tämä metallinpaljastinharrastajien löytöjen kirjaukseen tähtäävä hanke on vilahdellut sosiaalisessa mediassa ilman, että olen ottanut siitä selvää. Tärkoitus tulla käyttöön vuonna 2020, joten perehdyn kunnolla silloin.

Kävikö kollaasin kuvien yhteys esityksiin selväksi? Ainekset tästä, tästä, tästä ja tästä.

Ei kommentteja: