torstai 8. helmikuuta 2018

Väri on informaatiota

Juha Anttila twiittaasi maanantaina "Aalto yliopiston opinnäytetöiden skannausprojektissa päädyttiin skannaamaan kaikki värillisenä. Myös #OCR tehtiin kaikelle. Säilytysmuodoksi ei valittu vain yhtä vaan kolme: PDF/A, XML ja TIFF. #digitointi #VarmuudenVuoksi".

Loistavaa, ajattelin. Tulevat minunkin paperi- ja mustevalintani tallennetuiksi. Mutta lähettäessäni viestin eteenpäin kirjoitin saatteeksi "Kun taas historialliset materiaalit @Kansallisarkist ja @NatLibFi vedetään harmaasävyllä. Ihan kuin paperilla ei olisi väriä."

Kansallisarkisto ei reagoinut, mihin palaan lopuksi. Mutta Kansalliskirjaston johtaja Kai Ekholm katsoi asialliseksi/tarpeelliseksi/sopivaksi kuitata "Haluat siis lehdet hapettuneen ruskeina. Kyllä se lisämaksusta käy!"

No, Kansalliskirjaston synnithän eivät rajoitu paperin (nykyisen) värityksen salaamiseen vaan värillisemmänkin menneisyyden harmaasävyistämiseen. Kaivoin esille pari kuvaa, tein koosteen

ja kirjoitin Ekholmille vastauksen "Tunnistanet kuvasta oman laitoksesi tarjoamat. Ja mahdollisesti näet eron verrokkeihin? Menneisyys ei ole harmaasävyinen, joten sitä ei pitäisi sellaiseksi digitoidakaan. Ettekä näin ole kirjojen kohdalla toimineetkaan." Tarkastettuani Doriasta, että Kansalliskirjaston viimeisimmät 1700-luvun painatteiden digitoinnit tosiaan olivat värillisiä. Hapettumisen arvioinnin jätän ammattilaisille.

Nyt Ekholm yritti asiaalisuutta. Mutta viittasiko aloituksensa "Nokkelointi sikseen. " omiinsa vai minun sanoihini? Jatko kuului "Sanomalehdet on 50-luvulta lähtien mikrofilmattu. Digitointi tapahtuu niistä. Aikakauslehdet tms kyllä mikrokuvataan jo väreissä. Julkistamme pääosin sanomalehtiä ja pienpainatteita."

Esimerkkini oli aikakauslehti!!! Ja jos Kansalliskirjasto julkistaa sivuina enemmän pienpainatteita kuin aikakauslehtiä niin pienpainatteiden digitoinnin seuraamisessani on vakavia puutteita. (Pienpainatteita on kyseisellä otsakkeella tätä kirjoittaessani 129 465 sivua. Niitä on digitoitu värillisinä, vaikka väri olisi vain paperissa, esimerkki. Aikakauslehtiä on digitoitu 6 504 034 sivua ja niistä merkittävä osa on 1910- ja 1920-luvulta, jotka ovat viimeisimpiä julkistuksia.)

Loppulauseeni Ekholmille kuului "Ymmärrän kustannustehokkuuden, mutta informaatiohävikki harmittaa." Soisin, että eri materiaaleille sovelletut erilaiset valinnat olisivat julkisesti esillä (ja ehkä ovatkin) ja että digitoituja aikakauslehtiä lukeville tuotaisiin jotenkin tietoon se, että he eivät näe lehdistä kaikkea tietoa.

Ja Kansallisarkisto? Se digitoi omien linjauksiensa mukaan (joita en jaksa hakea esille, mutta tuskin ovat muuttuneet) alkuperäistä (!) materiaalia näkyville harmaasävyisenä. Jos edes arkistokäytössä ei ole värikuvia niin ovatkohan valinneet oikeat standardit käyttöön? Arkistomateriaalissa kun musteen väri on tietoa ja värillinen kuva huomattavasti helpompi lukea, kuten olen käytännössä Ruotsin puolella ArkivDigitalia käyttäessäni havainnut.

2 kommenttia:

Istvan Kecskemeti kirjoitti...

Vastaan vähän pidemmin ja perusteellisemmin

Kansallisarkiston digitointiprosessi on määritelty yleisemmin digitoinnin laatukriteereissä ja tarkemmin teknisissä vaatimusmäärittelyissä.

Väridigitoinnin on oltava värihallittua, kuten laatukriteereissä todetaan: Väridigitointi tulee tehdä siten, että digitaalisten kuvien värit ja sävyt vastaavat mahdollisimman tarkasti alkuperäisaineistoa. Tämä on mahdollista vain kalibroidussa ja profiloidussa työympäristössä. Monitori on kalibroitava mittalaitetta käyttäen ja skannerille on tehtävä yksilöllinen profiili. Skannerin profiili on tallennettava kuvan mukana, ja/tai kuvan väriavaruus olisi muunnettava johonkin laajatoistoiseen kuva-avaruuteen (esim. Adobe98, tai eciRGB).

Vaatimusmäärittelyissä todetaan bittisyyden osalta:
Sidokset, asiakirjat, aktit ja kortistot
Tapauskohtaisesti päätetään toteutetaanko digitointi värillisenä (24bit) vai harmaasävynä (8bit). Mustavalkoisia (1bit) tiedostoja EI SAA toimittaa arkistolaitokselle.
Kartat ja piirustukset
Kartat ja piirustukset PITÄISI digitoida värillisinä (24bit), poikkeuksena värittömät piirustukset harmaasävynä (8bit).

Kansallisarkiston digitoinnin keskeisenä tavoitteena on digitoida julkaisukelpoisella laadulla siten että aineistoja ei tarvitse digitoida uudestaan. Kartat ja piirustukset sekä asiakirjat, joissa värillisyydellä on oleellista merkitystä sisällön tulkinnan kannalta, digitoidaan väreissä. Muut asiakirjat digitoidaan harmaasävyisenä. Alkuperäisestä asiakirjasta digitoidun harmaasävyisen tiedoston sisältö on yleensä hyvin luettavissa.

Kansallisarkiston aineistojen digitoinnin tekninen kehitys on ollut nopeaa. Kunakin aikana on valittu kustannustehokkaimmat tavat digitoida asiakirjallista kulttuuriperintöä. Vuosina 2004-2010 kustannustehokkainta oli digitoida mikrofilmejä. Filmithän eivät ole värillisä. Yhdessä vaiheessa 2000-luvun lopulla aineistoja mikrokuvattiin, ja harmaasävydigitoitiin filmeiltä. Osa 1940-50 luvuilla kuvatuista mikrofilmeistä on teknisesti huonoja ja osa niistä digitoiduista kuvista vaikeasti luettavissa. Pahoittelemme sitä. Vuosien 2009-2010 digitointiprojekteissa pystyttiin tehostamaan karttojen ja piirustusten digitointia. Vuodesta 2014 lähtien digitointia on tehostettu ottamalla käyttöön irtoarkkien digitointi läpisyöttö- eli dokumenttiskannereilla.

Viime vuosina takautuvan digitoinnin maksullisilla projekteilla ja kumppanuusyhteistyöllä on saatu ja saadaan varsinkin sukututkimukselle kiinnostavia aineistoja digitoitua alkuperäisistä asiakirjoista.

Tätä julkaistaessa on Kansallisarkiston Digitaaliarkistossa 68 242 535 tiedostoa.

Digitoinnin laatukriteerit
Digitoinnin vaatimusmäärittelyt


István Kecskeméti, johtaja, Kansallisarkisto

Kansalliskirjasto kirjoitti...

Kansalliskirjasto digitoi aineistoja kulloinkin käytettävissä olevien resurssien puitteissa. Vuonna 2017 Kansalliskirjasto saattoi käyttöön yli kaksi miljoonaa sivua digitoituja aineistoja.

Jokaisen aineiston kohdalla joudutaan pohtimaan esimerkiksi tallennustilan tarvetta, joka värilliselle aineistolle on moninkertainen harmaasävyiseen verrattuna. Monia miljoonia sivuja sisältävät vanhat lehtiaineistot on jouduttu skannaamaan harmaasävyisinä, kun niiden digitointi on ollut tehokasta olemassa olleilta mikrofilmeiltä, ja sisällöstä suurin osa on ollut harmaasävyistä. Joidenkin aineistojen digitointiin on saatu lisärahoitusta kumppaneilta, esimerkiksi kustantajilta, ja on ollut mahdollista valita väridigitointi.

Kansalliskirjasto on uusinut sanomalehtiprosessinsa ja skannaa uusia sanomalehtiä värillisinä. Aineisto saatetaan tekijänoikeuslain mukaisesti käyttöön Kansalliskirjastossa ja muissa vapaakappalekirjastoissa.