Konferens: Libraries in the sky: large-scale collaboration strategies and infrastructures to enhance the use of digital heritage collections.

Nasjonalbiblioteket, Oslo, 12 April 2018.

Varje dag fylls servrar runt om i världen på med ytterligare mängder av digitaliserat kulturarv (fotografier, böcker, tidningar, manuskript, kartor, arkivhandlingar, osv.). De fysiska artefakterna, som av bevarandeskäl ofta måste förvaras relativt svåråtkomligt, görs härigenom tillgängliga på helt nya sätt. Digitalisering har blivit en oundgänglig del i tillgängliggörandet av kulturarvssamlingarna.

Fram till ganska nyligen har det varit vanligt att plattformarna för digital bildvisning varit mer eller mindre lokala initiativ. Det har ofta handlat om tekniska val och lösningar, kanske konstruerade för specifika samlingar, som tagits fram av enskilda organisationer. En uppenbar risk med detta är att en senare migration till andra system kan bli komplicerad. I andra fall har lösningar skapats inom ramen för specifika forskningsprojekt där det långsiktiga förvaltandet av systemen i bästa fall kan beskrivas som osäkert. Det som i stor utsträckning har varit gemensamt är att det har saknats tekniska standarder och övergripande riktlinjer, någonting som haft som konsekvens att interaktionen mellan olika plattformar blivit svårlöslig.

Detta är såklart inte optimalt vare sig för användaren, som tvingas navigera sig fram i en vildvuxen digital djungel, eller för avsändaren, som på ett resursslösande sätt riskerar att ständigt behöva uppfinna hjulet på nytt. Situationen har beskrivits som att stora delar av det digitaliserade kulturarvet har varit inlåsta i silor mellan vilka det inte finns några möjligheter till kommunikation.

På senare tid har det emellertid börjat ske tydliga förändringar i positiv riktning. Större kollaborativa infrastrukturer har börjat växa fram. Någonting som biblioteksvärlden länge varit väldigt duktig på, nämligen utarbetandet av olika typer av internationella standarder (till exempel för metadata), håller nu också på att överföras till de mer tekniska aspekterna av digitaliseringen. Gemensamma riktlinjer och standarder avseende även dessa delar har börjat utvecklas av biblioteksaktörerna, med IIIF som det kanske tydligaste exemplet (mer om det nedan). Dessutom håller nya molntjänster på att öppna upp för bredare samarbetslösningar.

Med detta som bakgrund anordnades häromveckan konferensen ”Libraries in the sky” på Nasjonalbiblioteket i Oslo. Undertiteln löd i ungefärlig svensk översättning: ”Storskaliga samarbetsstrategier och infrastrukturer för att främja användningen av digitala kulturarvssamlingar.” Som arrangör stod IFLA RBSCS, en förkortning där IFLA (The International Federation of Library Associations and Institutions) alltså är den stora internationella biblioteksorganisationen och RBSCS (Rare Books and Special Collections Section) är dess avdelning för rart material och specialsamlingar.

Konferensen var uppdelad i fyra delar, där den första hade rubriken ”Digital Discovery of Cultural Heritage Treasures”. Vesna D. Župan var först ut och hon berättade om det 30-tal specialsamlingar, benämnda ”legacies”, som hör till Belgrads universitetsbibliotek. Dessa utgör ett konkret exempel på den typ av kulturarv vars digitala tillgängliggörande övriga konferensbidrag sedan handlade om.

Därefter var det dags för dagens svenska programpunkt, då Patrik Granholm från Kungliga biblioteket presenterade plattformen Manuscripta.se, en digital katalog över medeltida manuskript i Sverige. I dag finns där cirka 130 grekiska och 40 medeltida svenska manuskript tillgängliga, sammanlagt omkring 50 000 digitaliserade sidor. Den detaljerade beskrivningsnivån gjorde att ingen av de befintliga eller planerade svenska plattformarna för digitaliserat kulturarv kunde användas, så det blev därför nödvändigt att utarbeta en egen lösning. Grunden är ett antal mjukvaror med öppen källkod (eXist-db, IIPImage, Diva.js, Mirador). För objektbeskrivningen tillämpas Text Encoding Initiative (TEI) och för de digitaliserade bilderna används IIIF. Systemet förvaltas nu av Kungliga biblioteket och det finns planer på att så småningom kunna lägga förenklade poster i den nationella samkatalogen Libris, som då naturligtvis skulle länka vidare till den fördjupade beskrivningen på Manuscripta.se.

Dagens andra del hade fått den övergripande rubriken ”Large-scale collection development, discovery and access”. Här började Eilidh Macglone, webbarkivarie vid National Library of Scotland, med att berätta om UK Legal Deposit Web Archive och detta digitala arkivs selekterade specialsamlingar. Det handlar om det kontinuerliga insamlandet av webbsidor som görs i Storbritannien för att bevara dessa för framtiden. Den svenska motsvarigheten till detta är Kungliga bibliotekets Kulturarw3. I den brittiska versionen görs i efterhand ett aktivt urval där några av de insamlade webbsidorna får bilda specialsamlingar kring olika teman eller händelser och Macglone redogjorde specifikt för en av dessa urvalssamlingar, den som handlar om sport.

Nästa talare var Jerry Simmons (U.S. National Archives Liason to SNAC) som berättade om Social Networks and Archival Context, mera känt som SNAC. Detta är ett ambitiöst försök att lösa det som kan beskrivas som ”den arkivaliska diasporan”. Arkivhandlingar som på något sätt är kopplade till en viss person eller organisation kan som bekant vara utsprida på många olika platser, många olika arkiv, runt om i världen. För en forskare kan det därför vara mycket tidskrävande att få överblick och att spåra alla dessa olika utspridda handlingar, om det ens låter sig göras. SNAC har alltså ambitionen att erbjuda en lösning på detta. På plattformen finns i nuläget 4,2 miljoner auktoritetsposter och till dessa knyts sedan olika arkivbestånd. Det blir också möjligt att visualisera olika sorters relationer mellan poster och på så sätt blir olika former av nätverk synliga.

Siste talare innan lunch var François Vignale som presenterade ett tvärvetenskapligt forskningsprojekt inom digital humaniora kallat READ-IT. Syftet är att studera läspraktiker från 1700-talet och framåt. Varför läste man? Hur läste man? Utgångspunkten är läsakten som individuell upplevelse och en utmaning är då naturligtvis att läsning är en aktivitet som lämnar få direkta spår. Projektet kommer att behöva arbeta med stora mängder data, bland annat i form av brev och dagböcker, men också sådant som målningar och fotografier. Standarder som kommer att användas är Semantic Web (RDF, SPARQL, SKOS), TEI och FRBR. Ett av målen är att projektet ska resultera i ett onlineverktyg där det bland annat ska gå att söka på en viss titel för att se vad som skrivits om denna, samt av vem och när.

Efter lunchen tog konferens tredje del vid: ”Improving access through technology: user experience and IIIF”. Här kan det vara läge att mycket kort förklara en viktig term som redan har hunnit nämnas ett par gånger i det föregående: IIIF (International Image Interoperability Framework). Det är ett ramverk som definierar ett antal API:er, alltså, någorlunda enkelt uttryckt, specifikationer kring hur applikationsprogram ska kommunicera med en viss mjukvara och därigenom kunna fungera som gränssnitt. Syftet med IIIF (utläses på engelska ”Triple-I-F”) är att åstadkomma interoperatibel teknik genom det gemensamma ramverket för visning av digitala objekt. Målsättningen är att skapa kompabilitet mellan lagringsplatser för digitala bilder. Standarden har arbetats fram i ett samarbete mellan ett antal av världens ledande forskningsbibliotek, flera stora nationalbibliotek och även icke-kommersiella plattformar.

Alexander Lyngsnes från NTNU:s universitetsbibliotek (Norges teknisk-naturvetenskapliga universitet i Tromsø), presenterade de olika digitala projekt som man där arbetat med. På Gunnerus.no finns bibliotekets digitaliserade specialsamlingar, men inom ramen för plattformen Mubil laborerar man dessutom med mer innovativa och experimentella digitala lösningar, som till exempel Augumented books, Art in the library och ARK4. En grundläggande fråga för dessa tvärvetenskapliga projekt är: Hur skapar vi intresse för samlingarna? Det handlar om försök att inte förbli bunden vid den äldre codexformen och att inte bara se de digitala objekten som volymer på en virtuell bokhylla.

Nästa person att inta podiet var Matthew Mcgrattan, Head of Digital Library Solutions vid Digirati. Han har tidigare även varit verksam som Head of Technical Strategy vid Bodleian Library. Digirati är en kommersiell aktör som erbjuder digitala produkter och tjänster. De har bland annat utvecklat bildvisaren Universal Viewer, byggd på IIIF-standarden. Mcgrattan visade till att börja med tre konkreta lösningar som de tagit fram åt olika organisationer: The Indigenous Digital Archive, The Royal Society Journal Collection: Science in the making och Cardiganshire First World War Tribune (Appeals) Records. Samtliga dessa projekt har använt standarderna IIIF och W3C. Tjänsterna skapas inte som engångslösningar, underströk Mcgrattan, utan en viktig tanke att grundläggande lösningar ska gå att återanvända och vidareutveckla i framtida projekt. Alla organisationer har inte ekonomiska möjligheter att bygga nya och lokalt installerade tekniska lösningar. Utifrån detta faktum, och utifrån sina tidigare arbeten, erbjuder nu Digirati också molntjänsten Digital Library Cloud Service. Här kan alla kunder bruka en och samma grundlösning, som sedan kan anpassas för mer specifika behov.

Därefter presenterade Sara Carlstead Brumfield från Brumfield Labs och John Howard från University College Dublin ett transkriberingsprojekt som de har arbetet med tillsammans. Crowdsourcing förekommer numera som ett arbetssätt på flera digitala kulturarvsplattformar, till exempel för taggning och transkribering. Brumfield och Howard ställde den retoriska frågan om det är möjligt att bygga sådana framgångsprojekt med öppna lösningar och på detta svarade de ja, med IIIF. Ett konkret sådant exempel utgör UCD:s projekt för transkribering av brev och den lösning som Brumfield Labs utarbetat för detta. De har skapat en direkt funktionalitet mellan UCD:s digitala samlingar och sin egen plattform FromThePage, vilken erbjuder transkribering genom crowdsourcing. Lösningen bygger på interoperalitet mellan IIIF och FromThePage. På detta vis är alltså paradiset möjligt, sade Howard med en anspelning på föredragets titel, om än med tillägget att det otvivelaktigt är ett ganska nördigt paradis. En allmän poäng som underströks var också att för att nå framgång med crowdsourcing på kulturarvsområdet, så är det avgörande att lyckas kommunicera ut ett klart syfte. Värdet av det kollektiva arbetets resultat måste göras tydlig.

Konferensens fjärde och avslutande del hade rubriken “Sharing and using collections digitally”. Raphaële Mouren skulle här ha inlett med att talat om ReACH-projektet (Reproduction of Art and Cultural Heritage), men hon kunde tyvärr inte närvara. Delar av hennes presentation visades. Sista talare för dagen var därefter Rachel Di Cresce från University of Toronto Libraries och hon redogjorde bland annat för de tekniska lösningar som de utvecklat inom den samlande ramen Digital Tools for Manuscript Studies. Det handlar till exempel om olika plugins för Omeka samt utvecklingsarbete för det intressanta verktyget VisColl, vilket erbjuder möjligheter för att visualisera hur ett bundet manuskript är uppbyggt. Integration med IIIF är en grundläggande beståndsdel i samtliga dessa projekt.

Konferensen avslutades med en öppen frågestund. En av de saker som där framhävdes var att även om tekniska kunskaper såklart är centrala på det digitala kulturarvsfältet, så fortsätter kuratoriska färdigheter att vara en lika grundläggande beståndsdel, d.v.s. kunskap och kännedom om samlingarna är nödvändiga även för det digitala tillgängliggörandet. Det är viktigt, sades det vidare, att få användare att aktivt interagera med digitaliserade kulturarvet, inte bara passivt konsumera det. En annan sak som kom upp, och som varit tydlig under hela dagen, var betydelsen av att försöka bygga så framtidssäkra lösningar som möjligt. Hur ska då detta genomföras, att göra så att saker kommer att fungera även på längre sikt? Grundläggande är att skilja mjukvara och data åt. Det kan också underlättas genom att inte bygga plattformar från grunden, utan i stället så långt som möjliga bygga vidare på gemensamma lösningar, varav IIIF är en sådan. Länkade data var också en sak som här omnämndes som något som öppnar upp för nya möjligheter. Ytterligare en fråga som diskuterades var hur mindre organisationer med begränsade resurser ska kunna deltaga på det digitala området. En sådan möjlighet som föreslogs är att samarbeta med större organisationer som redan har utvecklat lösningar. Sådana samarbetslösningar har också blivit enklare genom en etablerad standard som IIIF. En annan väg är att använda någon av de färdiga molntjänster som finns på marknaden.

Sammanfattningsvis visade denna sammankomst i Oslo tydligt på bredden hos de många digitala verktygen samt de stora möjligheter som härigenom finns för tillgängliggörandet av kulturarvssamlingar. Framträdande var också den positiva utveckling som nu sker genom olika former av samarbeten, större infrastrukturer och kollektiva överenskommelser.