lauantai 7. kesäkuuta 2008

Yhdestä kuva-arkistosta

Surffasin tällä viikolla mm. Doriassa, joka sisältää kaikenlaista digitaalista aineistoa. Koska kuvat ovat mielestäni kivoja, innostuin luonnollisesti nähdessäni Kansalliskirjaston kokoelmissa Kuva-arkiston.

Hakuammunnalla sieltä löytyi ihan mielenkiintoisia kuvia, mutta kuvien metadata vaikuttaa puuttelliselta. Vasemmalla oleva kuva on ote digitoidusta sivusta, josta kuvailutiedoissa todetaan
dc.identifier: fem2003184
dc.identifier.dcterms:other: 200601240952/web/fem2003184.jpg
dc.identifier.dcterms:URI:
http://hdl.handle.net/10024/31694dc.format: 13 x 19 cm
dc.source: Program. [Helsingfors.] Helsingfors 1912. sivu 11.
dc.source: Pienpainatteet
dc.source: CD PÄ 3
dc.subject: Teatteriohjelmat
dc.subject: Helsinki
dc.subject: 1910-luku
dc.subject: (kohdehenkilö:) Malmström
dc.subject: Hulda
dc.title: Apollo teatern


Ilmeisesti kyse siis teatteriohjelman sivusta vuodelta 1912. Onko muita sivuja digitoitu? Mistä näytelmästä oli kyse? Jos olisin etsinyt naisnäyttelijän kuvaa 1900-luvun alusta, minkälaisella haulla olisin löytänyt tämän tiedoston???

Lähetin palautetta ja sain ystävällisenä vastauksena "Asiasanoitus on tehty aikoinaan luetteloitaessa kyseistä aineistoa. Siitä on kulunut jo paljon aikaa ja on vaikea vastata kysymykseen mitä periaatteita luetteloinnissa on käytetty. Lisäksi kuva-aineiston asiasanoittamiseen liittyy aina oma hankaluutensa: kuinka monta asiasanaa vastaa yhtä kuvaa?"

Jaa, nykyaikaa edustaa mm. http://www.flickr.com/ , jossa kuvilla voi olla huomattavan pitkiä tag-listoja kuville sekä monenlaisia ryhmittelyjä, joihin verrattuna Dorian käyttöliittymä vaikuttaa varsin antiikkiselta. 1704 tietueen joukkoon sisältyy varmasti jotain mielenkiintoista, mutta hakeminen on paljon vaikeampaa kuin Muisti-tietokannan vastaavasta (vanhemmasta) kokoelmasta. (Molemmissa on Kansalliskirjaston aineisto - samaa vai ei? Kuinka moneen kantaan YHDEN laitoksen pitää laittaa tavaraa?)

Vakavampaa on vielä se, että kuvien alkuperää on mahdotonta tunnistaa suoraan kuvailutiedoista. Mikä on CD PÄ 3? Tai CD Aarteet 1? Metadatan kentät ovat paikoittain myös sekaisin, josta minulle vastaaja totesi "Aineiston lähtödata sisälsi useita eri käytäntöjä päivämäärien merkitsemisen suhteen. Osasta päivämääristä ei pystytty automatisoidusti erottelemaan, jolloin järjestelmään tuli tallennuspäivämäärä. Päiväykset on tarkoitus vastaisuudessa korjata." Myös tekijämerkinnöissä on ongelmia, mikä näkyy kyseisestä selausnäytöstä.

Niska tulee kipeäksi kun näin joutuu päätään pyörittelemään.

1 kommentti:

Esa-Pekka kirjoitti...

Kritiikkiai osuu kyllä hyvin oikeaan. Voin vielä hieman valottaa taustaa:

Kuva-arkiston kohdalla olemme dilemman edessä: jätämmekö kuvat piiloon odottelemaan sitä kenties joskus saapuvaa päivää, jona niiden kuvailuun on resursseja, vai panemmeko näytille edes tuollaisenaan. - Kyseinen aineisto on digitoitu mm. näyttely- ja julkaisutoiminnan yhteydessä, eikä siitä edes välttämättä ole kovin tarkkoja bibliografisia tietoja olemassa. Muisti-aineistoa tehtäessä oli mahdollisuus kunnolliseen kuvailuun.

Kansalliskirjaston digitointitoiminnassa tämä on tietenkin vain sivujuonne, massat löytyvät osoitteesta http://digi.lib.helsinki.fi/index.html