tiistai 19. syyskuuta 2017

On vääriä paikkoja hakea

Historian gradujen seuraamiseksi teen satunnaisen säännöllisesti katsaukset suomalaisten yliopistojen julkaisuarkistoihin. Ainoastaan Jyväskylässä rss-syöte yksittäisiin aineisiin (siis esim. Suomen historia) on ollut niin framilla, että olen sen liittänyt rss-lukijaani ja pysyn näin helpommin ajan tasalla.

Mutta rss-lukijani kännykässäni on niin surkea, että käytännössä joudun myöhemmin etsimään gradun linkin hakemalla julkaisutietokannasta gradun nimellä. Näin olen havainnut toistuvasti, että oikein kirjoitetuillakaan sanoilla työ ei löydy tai on yllättävän pohjalla tuloksissa.


Lähetin vihdoin palautetta viime viikolla ja sain kirjaston informaatikolta vastauksen.
Hei! Enpä tiedä mitä hakuindeksointia tarkoitat, mutta jos puhut JYX-julkaisuarkiston omasta asiasanahausta niin ei, se ei ole kunnossa.
Kyllä, olin tarkoittanut JYX:n omaa hakua.
Julkaisuarkistossa käytetty alustan (DSpace) hakuominaisuudet ovat erittäin heikot, eivätkä siitä edes tulevan version vaihdon yhteydessä juuri tule paranemaan. JYXin tarkoitus on varmistaa aineistojen pitkäaikaissäilytys ja löytyvyys muilla välineillä. Senpä vuoksi ketään ei ohjeistetakaan menemään JYXiin tekemään minkäänlaista vähänkään laajempaa hakua vaan sen voi tehdä kirjastojärjestelmässämme JYKDOKissa, jossa tämä gradu nousee varsin korkealle hakutuloksissa, jos hakee sanalla rabies. Samoin hakukoneet löytävät tämän työn erinomaisesti työn otsikolla hakiessa. Ja jos tätä gradua luetaan oikein paljon, ties vaikka Googlekin sen tulevaisuudessa nostaisi näkyvämmin hakutuloslistalla esiin pelkällä rabies-termillä hakiessa, vielä sen status ei ole aivan niin korkealla.
Jasso. Onko muistettu, että verkossa liikkuu ihmisiä, joita ei ole koskaan ohjeistettu yhtään mihinkään? Jos olisin JYX:n etusivulta (tai ohjeista) saanut käyttövuosieni aikana lukea, että siellä tarjottu hakuominaisuus on hyvin puutteellinen, olisin suhtautunut saamiini tuloksiin toisin. Olenhan tästä tehnyt myös hutkimuksiini liittyviä hakuja.

Onko Jykdok (=Finna) sitten parempi ratkaisu? On, jos hakee oikealla nimellä tai tarkalla hakusanalla tai tiivistelmän sanalla (jos tiivistelmä kannassa). Mutta julkaisun kokotekstihaku onnistuu (*) vain JYX:ssä. Eli minä seikkailen siellä edelleen, mutta tietäen nyt, että tulokset voivat olla puutteellisia.

Mutta, kun nyt useimmat (?) yliopistokirjastot ovat Finnassa, osaisiko joku rakentaa (jatkuvasti/pysyvästi toimivan) kyselyn, jolla haetaan kaikki historianalojen gradut tuoreusjärjestyksessä?

(*) Testinä laivan nimi Carmania, joka esiintyy gradun tekstissä, mutta ei nimekkeessä, tiivistelmässä eikä asiasanoissa.

Kuva : San Diego Air and Space Museum Archive, Flickr Commons

2 kommenttia:

Jyrki Ilva kirjoitti...

Minun täytyy näköjään olla tässä asiassa eri mieltä Jyväskylän yliopistosta saamasi vastauksen kanssa. DSpacen hakuominaisuuksissa ei ole sinällään mitään varsinaista vikaa, taustalla on uudemmissa versioissa ihan sama Solr-teknologia (aiemmin Lucene) kuin Finnassakin.

VuFindia/Finnaa on tietysti kehitetty nimenomaan hakukäyttöliittymäksi, ja se on tältä osin monipuolisempi, intuitiivisempi ja helpommin muokattava. Mutta jos DSpacen hakualiakset yms. on kunnolla konfiguroitu ja aineiston metadata on kunnossa, hakutulokset ovat aivan OK. Suurimmat puutteet ovat todennäköisesti relevanssissa ja tulosten järjestämisessä, jotka toki Finnassakin riippuvat suurelta osin taustajärjestelmistä tuotujen kuvailutietojen laadusta.

Kuten itsekin totesit, DSpacessa on lisäksi kokotekstihaku, jota Finnassa ei tällä hetkellä ole. Kokoteksti-indeksointia on kyllä visioitu myös Finnaan, mutta teknisten kysymysten lisäksi tähän liittyy toistaiseksi oikeuksiin liittyviä haasteita, jotka pitäisi selvittää ensin. Kokotekstihaku voi tehdä DSpacen hakutuloksista sotkuisempia ja tulosjoukoista turhan isoja, mutta jos tämä on ongelma, haun voi tarvittaessa rajata myös yksittäisiin metadatakenttiin.

DSpacen Open Search -rajapinta tarjoaa varsin monipuolisia mahdollisia räätälöidä RSS- ja Atom-feedejä hyvin monenlaisiin tarpeisiin, toki kuvailutietojen asettamisssa rajoissa. Kansalliskirjaston ylläpitämien julkaisuarkistojen osalta jonkin verran ohjeistusta löytyy täältä:

https://www.kiwi.fi/x/mZS6Ag

Irene Ylönen kirjoitti...

Jos asiaa ei tahallisesti halua kärjistää, ei liene olemassa vääriä tai oikeita paikkoja hakea tietoa, on vain parempia ja huonompia. Jyrkin sanomasta huolimatta säilyn kohtuullisen itsekriittisenä julkaisuarkistomme nykyisiä hakuominaisuuksia kohtaan. Itsekriittisyys pitää mukavasti liikkeellä ja pistää pyrkimään parempaan. Ja parempia hakuominaisuuksia JYXiimme kaipailen, jotta siitä oikeasti olisi paikaksi, josta voisi innolla opastaa asiakkaita etsimään tietoa. Hakutulosten ajoittaisiin relevanssiongelmiin, sekavuuteen ja osin myös puutteisiin ovat törmänneet monet muutkin asiakkaamme, et pelkästään sinä, Kaisa (tai minä).

Meillä on käytössä vielä tällä hetkellä varsin vanha DSpace-versio, minkä huomaa myös julkaisuarkiston sangen vanhahtavasta ulkonäöstä. Uusi JYX 2.0 otetaan käyttöön tämän vuoden kuluessa. Käyttöliittymä muuttunee ainakin asiakasystävällisemmäksi ja modernimmaksi. Toki hyvin paljon riippuu meistä itsestämme, ei pelkästään järjestelmästä. Jatkuvasti pyrimme esimerkiksi parantamaan metadatan laatua ja yhdenmukaisuutta, onhan meillä nyt siitä luotu kansallinen suositus - mikä on mainiota. Ehkä näillä eväillä pystymme petraamaan jatkossa niin että JYXistä tulisi - ei ainoa, mutta ehkä se "oikea" paikka hakea tietoa. Se verran kyynikko (tai realisti) kuitenkin olen, että täydellistä siitä tuskin tältä osin tulee.