perjantai 8. lokakuuta 2021

Tekstien kierrätystä paikasta toiseen

Eilen avattiin ja julkistettiin juhlallisesti hankkeen Informationsflöden över Östersjön. Svenskspråkig press som kulturförmedlare 1771–1918 välituloksena avoimeen ja yleiseen käyttöön tietokanta ruotsinkielisisten sanomalehtien (Suomessa, Ruotsissa ja Yhdysvaltain siirtolaisalueilla) tekstien toistoista. Vastaavahan on tehty aiemmin suomeksi, mutta olen jättänyt sen niin rauhaan, että osoitteen löytäminen tuotti vaikeuksia. Mutta löytyi kuitenkin: Text Reuse in Finnish Newspapers and Journals, 1771–​1920.

Uusi tietokanta Text reuse in the Swedish-language press, 1645-1918 voi olla väikkärinikin väännölle merkityksellinen, kunhan ehdin hetken ajattelemaan. Ajattelematta testasin vanhoja aiheita ja kokeilin karttanäkymää yhteen Abraham Stenfeltistä kiertäneeseen uutiseen (klusteri 4319267).


Tietenkin tietokantaa koskee kaikki normaalit klausuulit konetunnistetusta tekstistä ja klusterien algoritmisesta kokoamisesta. Vahvimmin hälytyskellot soivat, kun esityksiä kuunnellessa useaan otteeseen pointtina oli se, liikkuiko uutinen Suomesta Ruotsiin vai päinvastoin. Kysymys on tietenkin mielenkiintoinen ja Jani Marjanen esityksessään oikeassa siinä, että aiemmat maininnat kultturiyhteyksistä kaipaavat tarkennusta, ajoitusta ja kvantifiointia. Suuret linjat varmasti selviävätkin, mutta yksittäisistä uutisista on voinut jäädä löytymättä alkuperäisin teksti ja alkuperä voi näin ollen olla väärä.

Marjasen esityksen kaavio, jossa Suomen merkitys (eli suomalaisten tekstien kopiointi) ruotsalaisessa lehdistössä romahti vuoden 1809 jälkeen, oli hätkähdyttävä, mutta kun Marjanen selitti asiaa se oli aivan järkeen käypä. Suomessa oli 1800-luvun alussa vain yksi lehti ja Venäjän vallan alla sen toimituksellinen sisältö oli niin vähäistä, ettei siinä juuri ollut kopioitavaa ruotsalaiseen lehdistöön, joka puolestaan oli huomattavasti monilukuisempi.

Heli Rantala antoi pari esimerkkiä pitkään kiertäneistä teksteistä. Toinen oli Anna Maria Lenngrenin runo Förlorade saker, joka leikittelee hukattujen tavaroiden ilmoitusten muodolla ja oli näin sopivaa toistettavaa vuodesta 1775. Oman kokeiluni perusteella runoa oli ainakin klustereissa  5839195 (28 toistoa), 1007529 (70 toistoa) ja 1699754 (3 toistoa), mutta näistä ei saanut yhteistä statistiikkaa ulos (tai en ainakaan osannut sellaista tuottaa).

Rantalan toinen esimerkki oli eksoottisempi. Turkulaisessa lehdessä oli 1775 lainaus Örlosan 1600-luvun lopun kirkonkirjojen kuvauksesta 1500-luvun lopun nälänhädästä. Turussahan julkaistiin paljon asiakirjatekstejä, mutta useimmiten ne koskivat Suomea. Kaivettuani tekstin alun 29.4.1775 ilmestyneestä lehdestä selvisi, että se oli peräisin Turun hovioikeuden presidentin papereista, mikä selittää julkaisun. 

Mutta kun etsin Rantalan mainitseman toiston Mariestads Weckobladista 25.11.1826, kävi ilmi että sitä ei oltu kopsattu turkulaisesta lehdestä vaan Andr. Olav Rhyzeliuksen kirjasta Brontologia Theologico-Historica (1721), johon tutustuin taannoin suomalaisten tulipalojen osalta. Kirjassa otsikko on käytännöllisesti katsoen sama kuin turkulaisessa lehdessä, joten paroni Lagerflychtin papereissa todennäköisesti oli kirjasta kopioitu teksti. Tällaiselle intermediallisuuden metsästämiselle tietokanta siis jättää tarvetta.

(Virallisen totuuden voit lukea lehdistötiedotteesta ja puhutun kuulee YouTuben tallenteesta.)

Ei kommentteja:

Lähetä kommentti