Er zijn 2 belangrijke beeldformaten :
Ø TIFF
· voor zwart-witbeelden
· TIFF is een archiefformaat,
Ø JPEG
· voor kleurbeelden.
· JPEG is geen officieel archiefformaat. Dit heeft voor gevolg dat het al dan niet leesbaar blijven
op lange termijn verantwoordelijkheid is van de IT afdeling wanneer deze zou beslissen dit formaat te adopteren.
En één algemeen
opslagformaat : PDF.
TIFF (Tagged Image File Format) is een grafisch formaat van het bitmap-type,
in 1987 op punt gesteld door Microsoft en ALDUS, die daarna fusioneerde met ADOBE Systems Inc. De laatste specificaties (Revisie
6.0) werden gepubliceerd in 1992. TIFF als formaat is in public domain wat betekent dat er geen rechten of licenties op dienen
betaald te worden.
TIFF is ook een zgn
DIB-formaat (Device-Independant Bitmap), wat betekent dat het op verschillende
platformen kan gelezen worden (Windows, Unix, Linux, …). Dit is een niet-onaanzienlijk voordeel, zeker op lange termijn.
TIFF is zo flexibel dat het aan alle eisen van een archiefsysteem voldoet (portability, …)
TIFF-files kunnen
maximaal 4 Gb groot zijn (na compressie) en zowel zwart/wit, grijswaarden als kleur opslaan. Voor kleur kunnen verschillende
kleurschema’s gebruikt worden (RGB, CYMK, …) en is zelfs True Color (32 bits per pixel) mogelijk. Zoals de naam
het zegt gebruikt het “tags” dit wil zeggen dat in de beschrijving van het beeld gegevens worden opgeslagen die
informatie geven over dit beeld (vb lengte, breedte, maar ook datum van opmaak, auteur, …).
Een TIFF-document
bestaat dus uit 2 delen : de “bijkomende informatie” en dan de gegevens van het beeld zelf. De vernoemde bijkomende
informatie zit in de zgn “header” (de “aanhef”) van het beeld en heeft de vorm van een tekstbestand.
Dit deel van de file kan gemakkelijk in een tekstverwerker bekeken worden en wordt niet meegecomprimeerd met het beeld.
De tags kunnen erg
divers van inhoud zijn en er zijn dan ook erg weinig viewers die alle mogelijke opties ondersteunen. Niet alle TIFF-files
kunnen dan ook door alle viewers geafficheerd worden.
TIFF laat verschillende soorten compressie toe en kan dan ook « niet
lossy » gemaakt worden. Niets belet de gebruiker echter JPEG-compressie te gebruiken en dan is er wel verlies van informatie.
Wel te verstaan is het toepassen van JPEG-compressie in een TIFF-bestand niet erg intelligent omdat het juist hét grote voordeel
van TIFF, waarheidsgetrouwheid, tenietdoet. Daarenboven moet de decompressiealgoritme
mee weggeschreven worden want deze is niet standaard voor TIFF.
De kwaliteit van een TIFF-file is dan ook perfect, tenzij er JPEG-compressie
werd toegepast. Maar het volume van de file kan enorme proporties aannemen. Een TIFF-file lezen of wegschrijven duurt dan
ook relatief « lang ».
Een andere kwaliteit van TIFF is het bestaan van de zgn « multi-image-file » :
in 1 file kunnen verschillende beelden worden weggeschreven.
Het JPEG-Formaat
Dit
gebeurt door een sterke compressie (soms tot 90% of een verkleining van de filegrootte met een factor 10). De meeste software
die in JPEG wegschrijft geeft de gebruiker dan ook de keuze de compressiegraad in te stellen om zelf te beslissen waar hij
de balans legt tussen kwaliteit en opslagruimte.
Want
deze compressie is niet “gratis”. Ze gaat ten koste van een niet onaanzienlijk kwaliteitsverlies. JPEG is dan
ook een “lossy” formaat, d.w.z. een formaat dat verlies aan informatie meebrengt. Bekend bij JPEG is bv dat naast
elkaar liggende pixels vaak samengevoegd worden tot blokjes van 8x8 pixels, kleuren worden veranderd en details worden verwijderd
als ze niet in de compressie passen. Hoe sterker de gekozen compressiegraad, hoe meer informatieverlies.
JPEG
laat dan ook niet toe het beeld te vergroten omdat dadelijk de “artifacten” (= de gevolgen van de compressie)
meevergroot worden. Het beeld wordt dan ook heel snel vlekkerig en hoekig. Vooral tekst en grafieken lijden zwaar onder JPEG
omdat hier alle hoeken worden afgerond (en de file blijft zelfs na compressie vaak groter dan een TIFF). Anderzijds is JPEG
is anderzijds ideaal voor foto’s met grote uniforme kleurvlakken omdat daar compressie toch nog een goede kwaliteit
oplevert.
JPEG
is een ideaal formaat wanneer de opslagruimte of de overdrachtsnelheid kritisch zijn, maar een kwaliteitesverlies niet zo’n
belangrijke rol speelt. Voor archiefopslag van kritische files met veel details is het dan ook ongeschikt.
Maar er is erger : telkens een JPEG-file opnieuw opgeslagen wordt gebeurt de compressie ook opnieuw en is er dus weer
informatieverlies. Een JPEG die 3 maal werd geopend en opnieuw weggeschreven heeft veel van zijn duidelijkheid verloren. Archiefsystemen
slaan dan ook vaak de “master” (het oorspronkelijk gescande beeld) op in TIFF, maar gebruiken voor de overdracht
over het net JPEG. Wanneer het nodig is het beeld opnieuw op te slaan wordt de JPEG verwijderd en opnieuw opgemaakt vanaf
de oorspronkelijke TIFF.
Ander nadeel van JPEG is dat het verscheidene
regels toelaat zodat het formaat niet erg uniform is. Hierdoor kan voor eenzelfde opgeslagen beeld datgene wat op het scherm
komt sterk verschillen. Alles hangt af van hoe de file werd weggeschreven en hoe hij wordt geïnterpreteerd door de viewer.
Sommige viewers (INTERNET-browsers bv) gebruiken daarenboven truukjes om sneller te laden (nogmaals ten koste van de kwaliteit).
JPEG is dan ook zo enorm variabel qua kwaliteit dat het als archiefformaat
niet in aanmerking komt, tenzij voor files waarvoor het detail van de inhoud weinig belang heeft. Hoewel vaak gebruikt voor
foto’s is dit zowat het laatste wat er betrouwbaar in opgeslagen kan worden, zeker wanneer men detail of waarheidsgetrouwheid
hoog op de eisenlijst heeft staan.
Het spreekt vanzelf dat een JPEG-beeld opslaan in TIFF-formaat nutteloos
is. Er zal hierdoor immers geen kwaliteitsverbetering optreden. De « artifacten » van de JPEG zijn er immers al
en ze blijven bestaan.
Het PDF-Formaat
PDF (Portable document format) is een fileformaat dat ontwikkeld
werd door Adobe Systems met de bedoeling documenten op te slaan op een manier die totaal onafhankelijk is van zowel hardware,
software als operating system. Het is dus de meest universele manier van opslaan.
De reader (lezer) is gratis beschikbaar op internet op de site van ADOBE (http://www.adobe.com/products/acrobat/readstep2.html) en hij bestaat voor elk besturingssysteem. Iedereen kan het dus openen en dit hangt niet af van welk
programma gebruikt werd om het document aan te maken. In tegensteling tot bv een document dat aangemaakt werd met een bepaalde
versie van MS Word kan het dus ook gelezen worden in Linux, Unix, … en door andere programma’s of versies ervan
zonder dat omzetting noodzakelijk is.
Een PDF document is dus zgn “cross-platform”,
d.w.z. het kan gelezen worden op elk platform (besturings-systeem). Op MAC is het zelfs het formaat waarin het besturingssysteem
zelf beelden vastlegt en gezien MAC een zeer belangrijke rol speelt in de publicatie-industrie is het formaat bijna zeker
een blijvende waarde.
PDF is daarnaast onafhankelijk van de resolutie (instelling van scanner of scherm)
en het kan meer dan duizend bladzijden beslaan waarin rijkelijk gebruik gemaakt wordt van tekst, fonts (lettertypes), kleur,
grafiek, beelden, …. Een PDF file is dus vaak een combinatie van tekst, vector- en bitmapbeelden en kan ook gewone grafiek
en tabellen bevatten.
PDF is een open standaard en iedereen mag het formaat gebruiken om er applicaties voor te ontwikkelen, zowel voor
creatie als opslag, consultatie en beheer van documenten en dit zonder dat hij rechten moet betalen.
PDF is gebaseerd op Postscript, een in de publicatiewereld veelgebruikt programma dat
pagina-beschrijvingen uitvoert naar drukpersen. Maar PDF maakt kleinere files aan, vooral dank zij de gebruikte compressie-algoritmes
en doordat het de specifieke instructies niet overneemt die bv de drukpers moeten aansturen.
Lettertypes, lay-out en afmetingsgegevens anderzijds blijven onaangetast. PDF zichtbaar
maken gebeurt dus gewoon door een paginabeschrijving te lezen en te interpreteren. Een PDF-file aanmaken bestaat er dus in
de gebruikte lettertypes, tekst, grafiek en beelden te verzamelen en ze allemaal in 1 file weg te schrijven zodat, wanneer
dit later terug op het scherm gezet wordt, het beeld exact hetzelfde is als dat van het oorspronkelijk document, welke ook
de viewer is die gebruikt wordt.
Een document dat in PDF-formaat is opgeslagen heeft exact hetzelfde uitzicht
als het brondocument. Veel landen aanvaarden het formaat dan ook als voldoende betrouwbaar voor gebruik in een rechtszaak.
Voor sommige organismen is het een vereist standaardformaat (vb de archieven van de federale rechtbanken in de Verenigde Staten).
Dit maakt het op lange termijn wel betrouwbaar als archiveringsformaat.
Anderzijds is het wel zo dat niet elke PDF uit het verleden nu nog kan gelezen worden. Voor gewone “bladspiegels”
geldt geen probleem, ADOBE garandeert voor de basisfuncties permanente leesbaarheid. Maar bv kan een Form (invulscherm op
internet bv) dat opgenomen wordt in een PDF-document wel problemen opleveren wanneer men het probeert in te lezen in een nieuwere
versie van ADOBE-reader.
Een PDF-document uitvergroten zal de tekst groter op het scherm brengen maar
verder de verhoudingen, de relatieve tussenafstanden enz ongemoeid laten. De vectorbeelden kunnen natuurlijk ook zonder kwaliteitsverlies
uitvergroot worden, de bitmapbeelden worden korreliger en hoekiger bij uitvergroten. Voor een groot deel kan de file dan ook
zoveel ingezoomd worden als men wil zonder dat de beeldkwalitiet eronder lijdt.
Een ander voordeel van het formaat is dat, net als TIFF, ook PDF gebruik kan maken van tags (bijkomende informatievelden).
En tenslotte heeft PDF ook nog het voordeel dat de tekst weliswaar wordt gecodeerd,
maar toch als tekst blijft bestaan. Dit heeft voor gevolg dat een viewer die de codering kan ontcijferen gemakkelijk in de
file op zoek kan gaan naar een bepaald woord. Bladeren en opzoeken in een PDF-file is dan ook geen probleem met bv Acrobat
Reader.
[1] Hardware : de machines waarop gewerkt wordt
Software
: de gebruikte programma’s
[2] PDF = Adobe®
Portable Document Format.
[3] d.w.z. iedereen mag het gebruiken om er applicaties voor te ontwikkelen, zowel voor
creatie als opslag, consultatie en beheer van documenten