keskiviikko 14. helmikuuta 2018

Avoimista lehdistä


Aaro Sahari tiedotti viime viikonloppuna Tekniikan waiheita -lehden numeroiden vuosilta 2005-2014 olevan kaikkien luettavissa TSV:n Journal.fi -palvelussa. Suhtautuminen uutiseen oli päässäni kaksijakoinen, sillä journal.fi:stä tuli ensimmäiseksi mieleen muisto maailman surkeimmasta hakukokemuksesta.

Muistanko väärin tai onko tilanne korjaantunut? En ja ei. Hakutulokset muistuttavat Doriaa ennen vanhaan eli näkyviin tulee pelkkä otsikko eikä mitään hakusanan kontekstista. Konteksti on merkityksellinen, sillä haku sentään kohdistuu muuhunkin kuin otsikkoon. [Korjaus 17.2.2018: eipäs tartu, katso kommentit] Tosin ei tarttunut yhdessä artikkelissa esiintyvään sukunimeni taivutusmuotoon, joten aivan täydellistä tulosta ei kannata odottaa, jos on hakemassa muulla kuin jo tuntemallaan artikkelin nimellä. Eksploratiivinen käyttökeissi ei ole ollut suunnittelijoilla päällimmäisenä mielessä.

Eri lehdet olivat käyttäneet alustan mahdollisuuksia vaihtelevasti. Parhaimmillaan arkistosivulle oli syötetty manuaalisesti klikkauksia houkuttelevia kuvauksia numeroista, mutta useimmiten tarjolla oli vain Vol 123 N:o 4 linkkejä, jotka pitää kiinnostavan sisällön toivossa avata yksi kerrallaan läpi. Yllätyksiä tuli myös artikkelien saatavuuden kanssa. Monilla tuoreista numeroista näkyi vain sisällysluettelo, kuten odottaa saattoikin. Mutta vastaan tuli myös vanhempi numero, josta oli saatavilla kaikki muut artikkelit paitsi se kiinnostava.

Julkaisuarkistoon verrattuna lukijakäyttäjälle journal.fi vaikuttaa köyhältä. Artikkeleissa ei (kai) ole asiasanoja eikä alusta tarjoa "voisi myös olla kiinnostunut näistä" -linkkejä. Mutta muutaman testikappaleen perusteella artikkelit löytyvät asiasanoineen Finnasta, jossa "Katso myös" pelittää. Eksploraatio on siis tehokkampaa paikassa, josta (kuten on jo aiemmin tullut valitettua) puuttuu kokotekstiin kohdistuva haku.

Ainakin kahden lehden (Informaatiotutkimus ja Tieteessä tapahtuu) artikkelit ovat tällä hetkellä esillä sekä journal.fi:ssä että Doriassa. Katsomalla Jukka Rantalan artikkelia Kamppailu identiteettikasvatuksesta historianopetuksessa Journal.fi:ssä esillä ei ole pysyvää tunnistetta, mutta pdf aukeaa. Doriassa puolestaan on enää linkki journal.fi:hin sekä URN (http://urn.fi/URN:NBN:fi:ELE-1813964), joka tätä kirjoittaessani ei vie minnekään.

Informaatiotutkimuksessa julkaistun Juha Hakalan artikkelin E-viittaamisen ihanuus ja kurjuus Doria-sivulla annettu URN toimi ja toi samalle sivulle, missä artikkelia ei ollut tarjolla. Sivun toinen linkki oli DOI ja vei journal.fi:hen, jossa tällä kertaa oli doi esillä. Artikkelin aiheen huomioon ottaen olisi ollut pikkasen ironista, ellei näin olisi ollut.

Samasta aiheesta tuli sivustolla surffatessa vastaan Suomen tieteellisen kirjastoseuran julkaisemassa aikakauslehti Signumissa Merja Kallion katsaus Linkkimätä + sisältönyrjähdys = viitemätä, jossa doi oli myös paikallaan. Tekemättä kattavampaa kartoitusta voinen todeta löytyneiden irtoartikkeleiden oheen vielä todeta tunnistetilanteen. (Palaan lehtiin, joissa on useampia kiinnostavia artikkeleja myöhemmissä postauksissa.)
Tunnuksettomuus sikäli merkityksellistä, että edellä linkittämässäni artikkelissa Juha Hakala lainaa Jyväskylän yliopiston ohjeesta (jolla itsellään ei ole pysyvää tunnistetta) viime vuodelta pätkän:
Verkkosivujen pysyviä yleisesti tunnettuja osoitteita ovat mm. DOI- ja URN -osoitteet ja Permalink:it. Jos et löydä mitään tunnistetietoja sivustosta, se ei ole lähde, jota sinun kannattaa ylipäätänsä käyttää tieteellisessä kirjoittamisessa.
Kuva kirjasta "Little Tom" (1922)

3 kommenttia:

ajnyga kirjoitti...

Hei,

Olen ollut rakentamassa Journal.fi-palvelua, joten muutama kommentti kirjoitukseen.

Ensinnäkin on harmillista, että hakukokemus on ollut huono. Järjestelmä käyttää tällä hetkellä normaalia tietokantahakua, eli se ei kohdistu kokoteksteihin. Tähän on tulossa lähitulevaisuudessa järjestelmän kehittäjän taholta parannus, mutta tarkka aikataulu on minulle vielä epäselvä.

Palvelussa metadatan tuottavat lehdet itse ja lopputulos on vielä kirjava. Yksittäisen lehdenkin sisällä on usein niin, että tuoreempi sisältö on kuvailtu paremmin, mutta vanhemman sisällön osalta kuvailutiedot ovat hyvin rajalliset. Tilannetta on tarkoitus parantaa ohjeistuksilla, mutta Tieteellisten seurain valtuuskunnalla on rajoitetut mahdollisuudet pakottaa lehtiä tuottamaan laajempaa metadataa. TSV on jo antanut lehdille ohjeistusta mm. CC-lisenssien ja vertaisarviointitunnusten käyttöön, mutta asiaa pitää ilman muuta ohjeistaa ja perustella lehdille vielä laajemmin ja paremmin.

Käytetty Open Journal Systems -järjestelmä kyllä tukee hyvin laajasti erilaisia kuvailutapoja, esimerkiksi mainitsemiasi asiasanoja. Asiasanoihin liittyen TSV on myös tehnyt laajennuksen YSO-ontologian käyttöön, eli kuvailusanoja kirjoittaessa järjestelmän saa hakemaan suoraan ehdotuksia ontologiasta.

Merkitsen tuon hakutuloksen kontekstin esittämisen kehitettävien asioiden listalle ja keskustelen siitä myös järjestelmän kehittäjän suuntaan. Järjestelmässä on toiminto, jolla saa mainitsemiasi "voisit myös olla kiinnostunut näistä" -linkkejä artikkelin abstraktisivun alaosaan. En osaa sanoa suoralta kädeltä, että käyttääkö jokin lehti sitä tällä hetkellä.

Mitä tulee pysyviin tunnisteisiin, on lehdillä mahdollisuus ottaa käyttöön palvelussa DOI-tunnisteet. TSV on tehnyt tähän liittyen sopimuksen CrossRefin kanssa. Palvelun avaamisen yhteydessä viime vuonna tunnisteet otti käyttöön parisenkymmentä lehteä ja nyt uuden sopimuskauden alussa mukaan on tulossa muistaakseni toinen parisenkymmentä lisää. Lehdet saavat sopimukseen mukaan tultuaan kaikille uusille artikkeleilleen tunnisteet. Lisäksi lehti voi itse maksamalla hakea tunnisteet myös vanhoille artikkeleille. Jotkin lehdet ovat näin tehneet, mutta suurin osa ei. Vanhalle artikkelille DOI-tunniste maksaa vain $0.15, joten uskoisin monien DOI-sopimukseen mukaan tulevien kyllä hakevan jossain vaiheessa tunnisteet myös vanhoihin artikkeleihin.

Tunnisteiden kohdalla pätee sama politiikka kuin muutenkin palvelun käyttöön liittyen. TSV suosittelee ja tukee tunnisteiden käyttöönottoa, mutta ei voi sitä pakottaa. Lehdet ovat itsenäisiä toimijoita, joiden toimituskunnat tekevät päätökset. Tieteessä tapahtuu -lehti ei ole ottanut käyttöön DOI-tunnisteita, mutta Informaatiotutkimus-lehti sen sijaan on ottanut.

TSV ottaa mielellään kehitysehdotuksia vastaan. Niitä voi lähettää osoitteeseen ojs@tsv.fi. TSV saakin lehdiltä paljon ehdotuksia, mutta suurin osa niistä koskee järjestelmän sisäisiä toimintoja. OJS-järjestelmähän on julkaisualustan ohella myös toimitustyön avuksi tarkoitettu järjestelmä, jolla voi vastaanottaa, vertaisarvioida ja käsitellä käsikirjoituksia. Lukijoiden näkökulmasta tuleva palaute on siis tervetullutta.


Terveisin,
Antti-Jussi Nygård

Kaisa Kyläkoski kirjoitti...

Kiitos perusteellisesta vastauksesta. Käsitykseni kokotekstihausta perustui m.m. siihen, että haulla "sukututkijan" tulee esiin Anna Kuisminin artikkeli Maiseenin Hanna ja Myllärin Manta: 1800-luvun kansannaiset lukutaidon opettajina. Kyse lienee siitä, että artikkelista on tarjolla pdf:n lisäksi html-versio.

ajnyga kirjoitti...

Juuri näin, eli haku pääsee käsiksi "normaalia" tekstiä sisältäviin tiedostoihin. Näitä ovat HTML-muodon lisäksi ainakin XML ja "plain text", eli .txt-päätteellä tallennettavat tiedostot. Jälkimmäinen ei toki ole kovin keskeinen tiedelehden kannalta, mutta järjestelmä ei siis aseta mitään rajoituksia käytettävälle tiedostomuodolle. PDF on oma haasteensa, mutta saamme senkin varmasti indeksoitumaan hakuihin vielä tämän vuoden aikana. Poikkeuksena on todennäköisesti huonosti tehdyt vanhojen artikkeleiden skannaukset, joita ei ole OCR-tunnistettu.