torstai 29. syyskuuta 2022

Kannattaako uskoa vai tarkistaa?

Vaihteeksi omien twiittieni lainausta. Maanantaina olin hetken elämääni tyytyväinen: "Hups! vasta nyt aloin kokeilla Historiallisen bibliografian ARTO-tietueisiin @Finnafi hakua, josta en mielestäni ole koskaan kuullutkaan. Ihan Oikeille Historiantutkijoille varmaan kuitenkin tuttu juttu?" Olin sattuneesta syystä kaivanut esille kesällä saamani vinkin, että ohjeet löytyvät Melindan asuakaswikin sivulta. Siinä on myös kuvaus datan kattavuudesta, mikä on erittäin olennaista yleensä ottaen, mutta tätä tekstiä varten kriittiset rivit ovat

Historiallisen bibliografian tallennuksessa on käytetty omaa luokitusta (Suomen historiallisen bibliografian systematiikka), jota voi halutessaan hyödyntää tähän aineistoon kohdistuvissa hauissa. Luokat on tallennettu viitteisiin "HIS:"-etuliitteellä, esim. "HIS:7" = keskiajan historia, jonka voi syöttää suoraan Finna-hakuun (lainausmerkit hakulauseen ympärille).

Kahdella testauksella selvisi, että tässä ohjeessa oli kaksi virhettä. Toivottavasti kukaan ei innostu lisätestauksiin.

Keskiaikaa tutkiva tuttavani oli tietenkin käyttänyt esimerkkihakua ja pikaisesti todennut, että tulos oli kuraa. Demonstroidessaan kokemusta minulle listassa oli 2775 tietuetta. Päällimmäisenä "Regulation of the ARO4 and HIS7 genes in the Yeast Saccharomyces cerevisiae" ja kakkosena kirja "Harry Styles and the clothes he wears", jonka kuvauksesta löytyy kohta "with his $7.99 frog-eyed".

Totesimme, että joukossa oli keskiaikaakin. Esim. tietue Anita Geritzin kirjoittamasta keskiaikapelin arvostelusta, jolla on luokitus

Kun tuttavani klikkasi päällimmäistä näistä, hän sai enää 2772 tietuetta, jotka arvatenkin kaikki sisälsivät luokituksen HIS:7.x . (Sattuneesta syystä en tarkistanut jokaista.) Eli koska haku perustuu merkkijonoon olisi parempi suosittaa muotoa "z HIS:7". Tämän kokemuksen perusteella, tietämättä asiasta yhtään enempää.

Oma hakuni kohdistui luokkaan 17.2., jonka pitäisi olla "Sanoma- ja aikakauslehdet. Kalenterit". Hieman siis ihmettelin, kun joukossa oli (kirjaimellisesti) huomattava määrä tietueita, jotka käsittelivät Kalevalaa ja/tai Lönnrotia. Esimerkiksi Väinö Kaukosen artikkeli Kanttelettaren syntyvaiheista. Kun vuorostani demosin tätä ihmeellisyyttä tuttavalleni, tämä totesi, että tietueessa oli oikein luokitus "z HIS:17.2". Hän ehdotti, että tarkistaisin miten Kalevala-aiheiset nimekkeet on luokiteltu painetuissa bibliografioissa. 

Nämähän on digitoitu, joten ei ollut haastavaa todeta, että viimeiseksi jääneessä bibliografiassa (1986-90) (aivan kuten wikin pdf-listassa) Kalevalalla on oma luokkansa 16.3 kirjallisuudenhistorian ja kansanrunouden alla. Mutta esimerkkiartikkelini oli vuodelta 1982, joten jotta saisin todistavan kuvan tänne, piti avata edellinen osa (1981-85)... Ja kas, siinähän oli eri luokittelu. 17.2 on nyt Kalevala Kansanrunouden ja kansanperinteen alla ja "Sanoma- ja aikakauslehdet. Kalenterit" luokka 16.4, joka puolestaan myöhemmin on Suomenkielinen kirjallisuus. 

Vastaavasti tuttavani keskiaikatulosten joukossa oli kai ripaus esihistoriaa, joka oli aiemmin luokka 7, kun taas keskiaika oli edellisessä osassa 8?

Tässä vaiheessa on syytä palata alussa ohitettuun osaan wiki-sivua: "Historiallinen bibliografia sisältyy Arto-kokoelmaan vuodesta 1960 alkaen ja sitä on tallennettu kattavasti noin vuoteen 2012 asti ja suppeammin vuoteen 2018 asti. 1950-luvusta on tallennettu Arto-kokoelmaan noin puolet ja vanhempaakin aineistoa löytyy satunnaisesti. "

Ilahduttavasti osissa (1961-70) & (1971-80)  keskiaika on luokka 8 ja sanomalehdet jne 16.4. Eli ohje vaatii näiden aiheiden osalta vain määrittelyn boolean-lauseelle, joka hakee vuoteen 1985 asti merkkijonoa "z HIS:8" / "z HIS:16.4." ja vuodesta 1986 alkaen merkkijonoa "z HIS:7"/"z HIS:17.2". Vai? Ei, kun keskiaikaa käsittelevä artsu 1960-luvulta onkin ihan oikeasti luokassa 7.3! Eli osa luokista on mäpätty oikein yhteen yhteiseen rakenteeseen ja osa ei? 

Hälläväliä, sillä kun on tietokannassa kerran törmännyt mömmöön, mihinkään ei enää usko. Valitettavasti.

Ei kommentteja: