De Wereld Volgens Grimm

Startpagina
Wie ben Ik ?
Fotomodellen
BDSM is Freaky
Man & Vrouw
Dichters
Gedachten
Muziek
Paperless Office
Even Verpozen
Interessante Sites
Boeken
Films

Belangrijke Formaten

Er zijn 2 belangrijke beeldformaten :

Ø TIFF

·         voor zwart-witbeelden

·         TIFF is een archiefformaat,

Ø JPEG

·         voor kleurbeelden.

·         JPEG is geen officieel archiefformaat. Dit heeft voor gevolg dat het al dan niet leesbaar blijven op lange termijn verantwoordelijkheid is van de IT afdeling wanneer deze zou beslissen dit formaat te adopteren.

En één algemeen opslagformaat : PDF.

Het TIFF-Formaat

TIFF (Tagged Image File Format) is een grafisch formaat van het bitmap-type, in 1987 op punt gesteld door Microsoft en ALDUS, die daarna fusioneerde met ADOBE Systems Inc. De laatste specificaties (Revisie 6.0) werden gepubliceerd in 1992. TIFF als formaat is in public domain wat betekent dat er geen rechten of licenties op dienen betaald te worden.

 

TIFF is ook een zgn DIB-formaat (Device-Independant Bitmap), wat betekent dat het op verschillende platformen kan gelezen worden (Windows, Unix, Linux, …). Dit is een niet-onaanzienlijk voordeel, zeker op lange termijn. TIFF is zo flexibel dat het aan alle eisen van een archiefsysteem voldoet (portability, …)

 

TIFF-files kunnen maximaal 4 Gb groot zijn (na compressie) en zowel zwart/wit, grijswaarden als kleur opslaan. Voor kleur kunnen verschillende kleurschema’s gebruikt worden (RGB, CYMK, …) en is zelfs True Color (32 bits per pixel) mogelijk. Zoals de naam het zegt gebruikt het “tags” dit wil zeggen dat in de beschrijving van het beeld gegevens worden opgeslagen die informatie geven over dit beeld (vb lengte, breedte, maar ook datum van opmaak, auteur, …).

 

Een TIFF-document bestaat dus uit 2 delen : de “bijkomende informatie” en dan de gegevens van het beeld zelf. De vernoemde bijkomende informatie zit in de zgn “header” (de “aanhef”) van het beeld en heeft de vorm van een tekstbestand. Dit deel van de file kan gemakkelijk in een tekstverwerker bekeken worden en wordt niet meegecomprimeerd met het beeld.

 

De tags kunnen erg divers van inhoud zijn en er zijn dan ook erg weinig viewers die alle mogelijke opties ondersteunen. Niet alle TIFF-files kunnen dan ook door alle viewers geafficheerd worden.

 

TIFF laat verschillende soorten compressie toe en kan dan ook « niet lossy » gemaakt worden. Niets belet de gebruiker echter JPEG-compressie te gebruiken en dan is er wel verlies van informatie. Wel te verstaan is het toepassen van JPEG-compressie in een TIFF-bestand niet erg intelligent omdat het juist hét grote voordeel van TIFF, waarheidsgetrouwheid,  tenietdoet. Daarenboven moet de decompressiealgoritme mee weggeschreven worden want deze is niet standaard voor TIFF. 

 

De kwaliteit van een TIFF-file is dan ook perfect, tenzij er JPEG-compressie werd toegepast. Maar het volume van de file kan enorme proporties aannemen. Een TIFF-file lezen of wegschrijven duurt dan ook relatief « lang ».

 

Een andere kwaliteit van TIFF is het bestaan van de zgn « multi-image-file » : in 1 file kunnen verschillende beelden worden weggeschreven.

 

Het JPEG-Formaat

 

Dit gebeurt door een sterke compressie (soms tot 90% of een verkleining van de filegrootte met een factor 10). De meeste software die in JPEG wegschrijft geeft de gebruiker dan ook de keuze de compressiegraad in te stellen om zelf te beslissen waar hij de balans legt tussen kwaliteit en opslagruimte.

 

Want deze compressie is niet “gratis”. Ze gaat ten koste van een niet onaanzienlijk kwaliteitsverlies. JPEG is dan ook een “lossy” formaat, d.w.z. een formaat dat verlies aan informatie meebrengt. Bekend bij JPEG is bv dat naast elkaar liggende pixels vaak samengevoegd worden tot blokjes van 8x8 pixels, kleuren worden veranderd en details worden verwijderd als ze niet in de compressie passen. Hoe sterker de gekozen compressiegraad, hoe meer informatieverlies.

 

JPEG laat dan ook niet toe het beeld te vergroten omdat dadelijk de “artifacten” (= de gevolgen van de compressie) meevergroot worden. Het beeld wordt dan ook heel snel vlekkerig en hoekig. Vooral tekst en grafieken lijden zwaar onder JPEG omdat hier alle hoeken worden afgerond (en de file blijft zelfs na compressie vaak groter dan een TIFF). Anderzijds is JPEG is anderzijds ideaal voor foto’s met grote uniforme kleurvlakken omdat daar compressie toch nog een goede kwaliteit oplevert.

 

JPEG is een ideaal formaat wanneer de opslagruimte of de overdrachtsnelheid kritisch zijn, maar een kwaliteitesverlies niet zo’n belangrijke rol speelt. Voor archiefopslag van kritische files met veel details is het dan ook ongeschikt.

 

Maar er is erger : telkens een JPEG-file opnieuw opgeslagen wordt gebeurt de compressie ook opnieuw en is er dus weer informatieverlies. Een JPEG die 3 maal werd geopend en opnieuw weggeschreven heeft veel van zijn duidelijkheid verloren. Archiefsystemen slaan dan ook vaak de “master” (het oorspronkelijk gescande beeld) op in TIFF, maar gebruiken voor de overdracht over het net JPEG. Wanneer het nodig is het beeld opnieuw op te slaan wordt de JPEG verwijderd en opnieuw opgemaakt vanaf de oorspronkelijke TIFF. 
 
Ander nadeel van JPEG is dat het verscheidene regels toelaat zodat het formaat niet erg uniform is. Hierdoor kan voor eenzelfde opgeslagen beeld datgene wat op het scherm komt sterk verschillen. Alles hangt af van hoe de file werd weggeschreven en hoe hij wordt geïnterpreteerd door de viewer. Sommige viewers (INTERNET-browsers bv) gebruiken daarenboven truukjes om sneller te laden (nogmaals ten koste van de kwaliteit).

 

JPEG is dan ook zo enorm variabel qua kwaliteit dat het als archiefformaat niet in aanmerking komt, tenzij voor files waarvoor het detail van de inhoud weinig belang heeft. Hoewel vaak gebruikt voor foto’s is dit zowat het laatste wat er betrouwbaar in opgeslagen kan worden, zeker wanneer men detail of waarheidsgetrouwheid hoog op de eisenlijst heeft staan. 

 

Het spreekt vanzelf dat een JPEG-beeld opslaan in TIFF-formaat nutteloos is. Er zal hierdoor immers geen kwaliteitsverbetering optreden. De « artifacten » van de JPEG zijn er immers al en ze blijven bestaan.

 

Het PDF-Formaat

 

PDF (Portable document format) is een fileformaat dat ontwikkeld werd door Adobe Systems met de bedoeling documenten op te slaan op een manier die totaal onafhankelijk is van zowel hardware, software als operating system[1][1]. Het is dus de meest universele manier van opslaan.

 

De reader (lezer) is gratis beschikbaar op internet[2][2] op de site van ADOBE (http://www.adobe.com/products/acrobat/readstep2.html) en hij bestaat voor elk besturingssysteem. Iedereen kan het dus openen en dit hangt niet af van welk programma gebruikt werd om het document aan te maken. In tegensteling tot bv een document dat aangemaakt werd met een bepaalde versie van MS Word kan het dus ook gelezen worden in Linux, Unix, … en door andere programma’s of versies ervan zonder dat omzetting noodzakelijk is.

 

Een PDF document is dus zgn “cross-platform”, d.w.z. het kan gelezen worden op elk platform (besturings-systeem). Op MAC is het zelfs het formaat waarin het besturingssysteem zelf beelden vastlegt en gezien MAC een zeer belangrijke rol speelt in de publicatie-industrie is het formaat bijna zeker een blijvende waarde.

PDF is daarnaast onafhankelijk van de resolutie (instelling van scanner of scherm) en het kan meer dan duizend bladzijden beslaan waarin rijkelijk gebruik gemaakt wordt van tekst, fonts (lettertypes), kleur, grafiek, beelden, …. Een PDF file is dus vaak een combinatie van tekst, vector- en bitmapbeelden en kan ook gewone grafiek en tabellen bevatten.

PDF is een open standaard[3] en iedereen mag het formaat gebruiken om er applicaties voor te ontwikkelen, zowel voor creatie als opslag, consultatie en beheer van documenten en dit zonder dat hij rechten moet betalen.

PDF is gebaseerd op Postscript, een in de publicatiewereld veelgebruikt programma dat pagina-beschrijvingen uitvoert naar drukpersen. Maar PDF maakt kleinere files aan, vooral dank zij de gebruikte compressie-algoritmes en doordat het de specifieke instructies niet overneemt die bv de drukpers moeten aansturen.

Lettertypes, lay-out en afmetingsgegevens anderzijds blijven onaangetast. PDF zichtbaar maken gebeurt dus gewoon door een paginabeschrijving te lezen en te interpreteren. Een PDF-file aanmaken bestaat er dus in de gebruikte lettertypes, tekst, grafiek en beelden te verzamelen en ze allemaal in 1 file weg te schrijven zodat, wanneer dit later terug op het scherm gezet wordt, het beeld exact hetzelfde is als dat van het oorspronkelijk document, welke ook de viewer is die gebruikt wordt.

Een document dat in PDF-formaat is opgeslagen heeft exact hetzelfde uitzicht als het brondocument. Veel landen aanvaarden het formaat dan ook als voldoende betrouwbaar voor gebruik in een rechtszaak. Voor sommige organismen is het een vereist standaardformaat (vb de archieven van de federale rechtbanken in de Verenigde Staten). Dit maakt het op lange termijn wel betrouwbaar als archiveringsformaat.  

Anderzijds is het wel zo dat niet elke PDF uit het verleden nu nog kan gelezen worden. Voor gewone “bladspiegels” geldt geen probleem, ADOBE garandeert voor de basisfuncties permanente leesbaarheid. Maar bv kan een Form (invulscherm op internet bv) dat opgenomen wordt in een PDF-document wel problemen opleveren wanneer men het probeert in te lezen in een nieuwere versie van ADOBE-reader.

Een PDF-document uitvergroten zal de tekst groter op het scherm brengen maar verder de verhoudingen, de relatieve tussenafstanden enz ongemoeid laten. De vectorbeelden kunnen natuurlijk ook zonder kwaliteitsverlies uitvergroot worden, de bitmapbeelden worden korreliger en hoekiger bij uitvergroten. Voor een groot deel kan de file dan ook zoveel ingezoomd worden als men wil zonder dat de beeldkwalitiet eronder lijdt.  

Een ander voordeel van het formaat is dat, net als TIFF, ook PDF gebruik kan maken van tags (bijkomende informatievelden).

En tenslotte heeft PDF ook nog het voordeel dat de tekst weliswaar wordt gecodeerd, maar toch als tekst blijft bestaan. Dit heeft voor gevolg dat een viewer die de codering kan ontcijferen gemakkelijk in de file op zoek kan gaan naar een bepaald woord. Bladeren en opzoeken in een PDF-file is dan ook geen probleem met bv Acrobat Reader.  


[1] Hardware : de machines waarop gewerkt wordt

Software : de gebruikte programma’s

[2] PDF = Adobe® Portable Document Format.

[3] d.w.z. iedereen mag het gebruiken om er applicaties voor te ontwikkelen, zowel voor creatie als opslag, consultatie en beheer van documenten

Horizontal Divider 1

Inhoudstafel

Vorige pagina : Problemen van Electronische Archivering

Volgende pagina : Automatische Indexering

Als een duif begint samen te werken met kraaien blijven zijn veren wit maar wordt zijn hart zwart
 
Duits Spreekwoord

Horizontal Divider 18

*** Grimm dankt jullie voor de commentaren ***