Preservatiestrategieën per bestandstype

Digitaal archief leesbaar houden is in essentie het continu migreren van oude bestanden naar de actuele bestandsformaten (een "migratiestrategie") of het nabootsen/emuleren van een oude computeromgeving op de actuele computeromgeving, zodat oude software nog kan draaien (een "emulatiestrategie").

Beide strategieën zijn op termijn erg complex. De beste garantie om je digitaal archief leesbaar te houden is dan ook samenwerken met een gespecialiseerde archiefinstelling of bedrijf. Maar je kunt zelf ook al wat doen door op meerdere paarden te wedden en van je complexe 3d-modellen ook afbeeldingen of pdf's te bewaren.

Hieronder vind je een overzicht van tips per bestandstype.

Tekstverwerkingsdocumenten

Voorbeelden: DOC; DOCX; ODT; RTF

Tekstverwerkingsdocumenten worden best opgeslagen in ODT, of, wanneer het document niet meer moet worden gewijzigd, in PDF. Vanuit Word is het tegenwoordig eenvoudig om Word-bestanden op te slaan in ODT of PDF. Kies in dit laatste geval niet voor de "print-to-pdf"-functie. Deze is minder kwaliteitsvol dan de "publiceren-" of "exporteren-"functie. Kies ook steeds voor het archiveringsprofiel van PDF: PDF/A. Een dergelijk archiveringsprofiel kan in Word gekozen worden bij de instellingen voor PDF-opslag. Bestanden in de nieuwste versie van Word (DOCX-bestanden) opslaan in het originele formaat is geen ideale oplossing, maar de risico's zijn momenteel erg laag.

PDF

PDF-bestanden kunnen (op middellange termijn) gewoon in het PDF-formaat worden bewaard. Zorg er voor, wanneer mogelijk, dat iedere PDF die wordt aangemaakt binnen het bureau wordt opgeslagen in een archiveringsprofiel van PDF (bij voorkeur PDF/A, of in geval van bouwtekeningen PDF/E)

Raster images

Voorbeelden: TIFF; JPEG; GIF; PNG; PSD; BMP

Algemeen wordt TIFF aangeraden als duurzaam bewaarformaat voor raster images. Er wordt bij afbeeldingen best geen gebruik gemaakt van compressie. Gebruik van (lossy) compressie zorgt er immers voor dat kwaliteitsverlies ontstaat bij bewerkingen van het beeld. Zorg er daarom voor dat foto's met artistieke waarde, gebruikt voor communicatie en presentatie, aangeleverd en opgeslagen worden in ongecomprimeerde TIFF. (Let op! Er zijn verschillende TIFF-profielen. Als meest duurzame wordt beschouwd: uncompressed baseline IBM TIFF v6.0).

Zorg ervoor dat er gebruikgemaakt wordt van een RGB-profiel, als het kan AdobeRGB of ecirgb-v2.

Ook Photoshopbestanden krijgen best een equivalent in TIFF, maar blijf het originele bestand met layer-informatie bewaren wanneer je dit nog verder wilt bewerken. Voor foto's die worden gemaakt ter documentatie van een bestaande toestand of werf, is het geen probleem om JPEG, GIF of PNG te gebruiken. Gebruik wel deze formaten en geen exotische of obsolete formaten, zoals BMP (Bitmap).

2D Vector images

Voorbeelden: AI; SVG; EPS

Algemeen wordt SVG aangeraden als duurzaam bestandsformaat voor vectoriële tekeningen. Zorg daarom steeds voor een SVG-equivalent van definitieve vector-images.

Tekstbestanden

Voorbeelden: TXT

Tekstbestanden kunnen gewoon als tekstbestand bewaard worden. Let op, tekst kan op verschillende manieren gecodeerd worden (bv. ANSI, ASCII en UTF-8). Probeer er in de mate van het mogelijke voor te zorgen dat tekstbestanden in UTF-8 worden gecodeerd.

Presentatiebestanden

Voorbeelden: PPT; PPTX

Deze bestanden kunnen op middellange termijn in hun oorspronkelijke formaat worden bewaard. Een duurzamer formaat is PDF, dus migreer voltooide presentaties ook naar dit formaat. PPT is ondertussen verouderd. Zorg er daarom voor dat PPT-bestanden ook een equivalent hebben in PPTX of PDF. Kies voor PDF/A.

Spreadsheets of rekenbladen

Voorbeelden: XLS; XLSX; ODS

Er is binnen de archiefgemeenschap geen sluitende oplossing voor spreadsheetbestanden. XLSX en ODS worden wel als voldoende duurzaam beschouwd. XLS is verouderd. Het verdient de aanbeveling om belangrijke XLS-spreadsheets in het archief te identificeren en een equivalent te creëren in ODS en XLSX.

Mailbestanden

Voorbeelden: PST; MBOX; MSG

Mails kunnen op verschillende manieren worden bewaard. Indien volledige mailboxen worden bewaard kan best worden geopteerd voor het MBOX-formaat. Het is echter aan te raden om belangrijke mails met hoge informatieve waarde voor het project ook apart op te slaan in het projectdossier. Hiervoor kan best het EML-formaat dienen. Sla bijlagen ook steeds apart op van de mail.

De meest gebruikte e-mail clients, zoals Outlook en Gmail, beschikken jammer genoeg niet over veel functies om mails te exporteren of op te slaan in EML. Outlook maakt gebruik van applicatieafhankelijke formaten, zoals PST en MSG, die niet duurzaam zijn. Om Outlook- of Gmail-mailboxen op te slaan, kan daarom best gebruik worden gemaakt van een e-mailclient als Thunderbird. Meer info over mailarchivering op: http://www.projecttracks.be/nl...

2D CAD

Voorbeelden: DWG; DXF; VWX; DGN

2D-CAD-bestanden kunnen best worden opgeslagen in een formaat dat algemeen gebruikt en makkelijk te openen is. Voor CAD-tekeningen in 2D is dit meestal DWG of DXF. Voor architecten die geen gebruik maken van Autodesk-producten is het aangeraden om tekeningen met een uitgewisselde en gepubliceerde status in DWG of DXF op te slaan. Zorg dat bestanden die naar elkaar refereren (xref's, plotstyle-bestanden enz.) bij elkaar staan. (Via AutoCAD kan dit bv. worden gerealiseerd via de etransmit-functie). In veel gevallen worden tekeningen in 2D-CAD ook naar PDF omgezet. Blijf deze PDF's behouden. Niet alleen hebben ze een juridische waarde, de duurzaamheid van PDF is momenteel veel groter dan die van enige CAD-bestand. PDF's worden op dit moment meestal via de plot- of printfunctie gecreëerd. Programma's als AutoCAD en Vectorworks voorzien echter in de mogelijkheid om tekeningen rechtstreeks te exporteren naar PDF. De PDF's kunnen in dat geval meer informatie bevatten, de kans op fouten bij PDF-creatie verkleint en het geeft ook meer controle aan de tekenaar over welke elementen nu precies in de tekening moeten komen. Kies voor PDF/A of PDF/E. Voor de digitale bouwaanvraag gelden er specifieke richtlijnen waaraan de PDF's dienen te voldoen, zie hiervoor de normenboeken uit het Omgevingsloket: https://www.omgevingsloket.be/...

Voor CAD-bestanden publiceerden we ook een meer gespecialiseerd advies.

3D CAD

Voorbeelden: DWG; DXF; VWX; DGN; SKP; 3DM

CAD-bestanden kunnen best worden opgeslagen in een formaat dat algemeen gebruikt en makkelijk te openen is. Voor CAD-tekeningen in 3D is een dergelijk formaat echter nauwelijks voorhanden. Bewaar daarom 3D-modellen in hun oorspronkelijke formaat, maar documenteer wel de software en de versie van de software waarmee het bestand is gemaakt en documenteer ook de system requirements ervan. Er zijn immers gevallen bekend waarbij een 3D-CAD-bestand anders wordt weergegeven na een versie-update van de software. Om technische 3D-modellen uit te wisselen en publiceren werpt IFC zich steeds meer op als de industriestandaard. IFC is open gedocumenteerd en duurzaam, maar hou er rekening mee dat de vertaalslag van 3D-model naar IFC steeds een zeker verlies inhoudt.

Voor CAD-bestanden publiceerden we ook een meer gespecialiseerd advies.

BIM

Voorbeelden: RVT; PLN

IFC lijkt definitief door te breken als de uitwisselingsstandaard voor BIM-modellen. Daarmee is dit ook het meest duurzame bestandsformaat. Maar net als bij 3D CAD-bestanden zal de vertaalslag van een BIM-applicatie naar IFC leiden tot informatieverlies. Bewaar daarom ook steeds het oorspronkelijke formaat van gepubliceerde BIM-modellen en documenteer de software en versie waarmee het model is gemaakt en kan worden geopend. BIM-modellen zijn vaak moeilijk te interpreteren voor buitenstaanders. Ook wordt hun opbouw in veel gevallen bepaald door specificaties die door het volledige projectteam worden afgesproken. Het is dan ook belangrijk om deze specificaties en afspraken te bewaren, zodat de BIM-modellen ook in de toekomst kunnen worden geïnterpreteerd. Het gaat hier dan om allerlei manuals, BIM Execution plans, Model View Definitions etc. BIM-modellen worden vaak gebruikt om 2D-tekeningen of andere afgeleide bestanden te genereren. Bewaar deze afgeleide bestanden ook. Ze zijn eenvoudiger te openen, te interpreteren en te bewaren dan BIM-modellen.

3D modeling files

Voorbeelden: 3DS; VRML; X3D; U3D; BLEND

De variatie in 3D modeling files is te groot om algemene uitspraken te doen over hun preservatie. X3D en U3D zijn duurzame bestandsformaten, maar deze bestanden zijn niet geschikt als duurzaam formaat voor alle 3D-modellen. Bewaar daarom net als voor 3D-CAD de bestanden in hun oorspronkelijk formaat, met documentatie van de oorspronkelijke software. Vaak worden 3D modellen gemaakt om andere documenten te produceren, zoals renders in 2D. Voor dergelijke documenten gelden dezelfde aanbevelingen als voor beeldbestanden. In sommige gevallen is een 3D-model geen bestand, maar een executable, zoals bij modellen in Unity. Documenteer in dat geval zeker de system requirements van de executable. Het is een goede optie om 3d scenes te documenteren via snapshots of video's (bv. schermopnames)

Videobestanden

Voorbeelden: AVI; FLV; MOV; MPEG-1; MPEG-2; MPEG-4; SWF; WMV

Video's duurzaam bewaren is een taak van specialisten. Wanneer je echter video's bestelt, kun je de leveranciers eisen dat ze hun video's aanleveren in duurzame formaten: MKV is in principe het meest duurzame formaat voor de opslag van video. Ook MXF, AVI en MOV zijn duurzame formaten. Bestandsformaten voor audio en video zijn slechts containers voor de video- en audiostreams. Het is ook belangrijk om te bepalen hoe video en audio dienen te worden geëncodeerd. Binnen de archief- en erfgoedsector wordt algemeen de FFV1-codering gekozen, maar ook de JPEG2000-codering is een valabele optie. Voor audiostream wordt aangeraden deze te coderen in LPCM. Zorg ervoor dat zowel bestandsformaat als video- en audiostream niet zijn gecomprimeerd. Dit leidt vaak tot grote bestanden (voor FFV1 en JPEG2000: 45-50 GB per uur video!!), dus pas het vooral toe bij waardevolle video's, waarin veel geld is geïnvesteerd. Voor minder belangrijke video's kunnen lagere kwaliteitsnormen in acht worden genomen. De videocodec's h.262 en h.264 worden bijvoorbeeld veel gebruikt. Een goed overzicht voor het duurzaam opslaan van videobestanden is na te lezen op https://www.scart.be/?q=nl/con....

Audiobestanden

Voorbeelden: AC3; AIFF; MP3; WAV; WMA

Het verdient de voorkeur (belangrijke) audiobestanden op te slaan in het WAVE-formaat. Ook FLAC en AIFF gelden als duurzame formaten. Maak gebruik van LPCM voor de codering van het geluidssignaal.

Websites

Websites zijn in wezen dynamische informatiegehelen, die voortdurend veranderen. Alle informatie capteren kan dan ook maar door op gezette tijdstippen snapshots te nemen van je website, ongeveer zoals the Internet Archive dat doet (archive.org). Let wel! Het is niet voldoende om enkel te vertrouwen op the Internet Archive. De snapshots van deze dienst zijn zelden volledig. Bovendien is het relatief eenvoudig om deze zelf aan te maken. Een snapshot van een website is een "statische kopie" van alle html-pagina's waaruit de website bestaat, samen met alle afbeeldingen, style sheets enz. Het systeem waarop de website draait (vaak een content management systeem als Drupal of Wordpress) wordt in zo'n geval niet mee gearchiveerd. Een gratis programma dat dit zeer goed doet is HTTRACK Web Copier (https://www.httrack.com/). In de praktijk is het voor een architectenbureau niet mogelijk om snapshots te nemen in de frequentie waarop the Internet Archive dat doet. Wel een haalbare strategie is dat dit per jaar gebeurt, waarbij de snapshots van ieder jaar worden bijgehouden. Archiveer een website minstens op deze manier wanneer hij wordt vervangen. De mate waarin HTTRACK of andere "website copiers" websites effectief kunnen archiveren, is vaak afhankelijk van de technologie wordt gebruikt. Flash-code kan bijvoorbeeld erg moeilijk worden geactiveerd. De mate waarin je website archiveerbaar is, kan gemeten worden op archiveready.com. Indien je nieuwe websites ontwikkelt, probeer er dan in de mate van het mogelijke voor te zorgen dat ze later eenvoudig archiveerbaar zijn.

Databases

Databases komen voor in verschillende vormen en functies. Databases archiveren gaat er in essentie om dat de informatie in de database geëxporteerd wordt in een vorm, zodat deze in een nieuwe database kan worden geïmporteerd. Vaak gaat het om exceltabellen, csv-bestanden of XML-bestanden, maar ook andere databestanden zijn mogelijk. Belangrijk is dat goed gedocumenteerd wordt hoe de databank in elkaar zat. Dezelfde opmerking als voor websites geldt hier. Bouw databases zo op, dat de informatie erin er gemakkelijk uitgehaald kan worden in vormen die eenvoudig in andere databanken kan worden geïmporteerd.